Төслийн танилцуулга· 2026

Хиймэл Оюун Ухаан Olonlog ai v1

Сургалтын хөтөлбөрт суурилсан дотоодын AI model

⚡ VLLM 💎 Gemma3 12B 🖥️ Local AI 🔍 RAG 🎯 Fine-tuning
ДООШ ГҮЙЛГЭ

Яагаад локал ажиллуулах вэ?

Cloud AI үйлчилгээнүүд бидний датаг гадаад серверт илгээдэг. Локал AI буюу өөрийн сервер дээр ажиллуулах загвар нь өгөгдөл нууцлал, Мөн өөрийн сургалтын хөтөлбөрийн цахим сан бүрдүүлэх, Суралцагч бүрийн хэрэглээг хянах зэрэг олон давуу тал эдлэх юм.

🔒

Өгөгдөл нууцлал

Суралцагчын асуусан асуулт болон хариулт бүгд Server дотроо үлдэнэ.

Хичээлийн хоцрогдол

Багшийн заасан хичээлийг өөрийн сурах хурданд тохируулж нөхөж судлах боломжтой.

💰

Зардал хэмнэлт

API дуудалтанд мөнгө төлөхгүй. Нэг удаа тоног төхөөрөмж авбал хязгааргүй ашиглана.

🎛️

Бүрэн тохируулга

Загварыг өөрчилж, fine-tune хийж, аль ч параметрийг тохируулах эрх бидэнд байгаа.

АРХИТЕКТУР
👤 Хэрэглэгч
↓ HTTPS Request
🌐 https://olonlog.ai
↓ дамжуулна
🚀 VLLM
Engine
🗄️ Vector
DB
↓ GPU Load Balancer
💎 Gemma3 12B загвар
↓ хариулт
🖥️ Суралцагчийн interface

Retrieval Augmented Generation

RAG нь AI загварыг дахин сургалгүйгээр бидний сургалтын материалд тулгуурлан хариулт өгдөг архитектур юм. Загвар зөвхөн өөрийн цээжилсэн мэдлэгт найдахгүй — хэрэглэгч асуулт тавихад шууд мэдээллийн санаас хамааралтай хэсгүүдийг татаж авч, тэдгээрийг контекст болгон ашигладаг.

Гол санаа: текстийг вектор хэлбэрт (embedding) хийж хөрвүүлж вектор мэдээллийн санд хадгална. Хэрэглэгч асуулт тавихад уг асуултыг мөн вектор болгоод, мэдээллийн сангаас хамгийн ойр утгатай хэсгүүдийг косинус ижил төстэй байдлаар хайна.

RAG ҮЙЛДЛИЙН ЖИЦ
1
Баримт бичиг оруулах
PDF, Markdown, HTML → давхцалтай хэсгүүдэд хуваана (ж.нь: 512 токен, 50 давхцал)
2
Вектор болгох (Embedding)
Хэсэг бүр → embedding загвар → тоон вектор [0.12, -0.87, 0.34, …] (768–4096 хэмжээс)
3
Вектор хайлт
Асуултыг вектор болгоод → ANN хайлтаар косинус ижил төстэй байдлаар хамгийн ойр K хэсгийг олно
4
Хариулт үүсгэх
LLM авна: системийн заавар + олдсон хэсгүүд + хэрэглэгчийн асуулт → эх сурвалжид тулгуурласан хариулт
Жишээ

Vector Database

Өгөгдлийн хэрхэн хайж байгааг харна уу

Ready — press Search
DIMENSION 1
DIMENSION 2
LEGEND
Stored vectors
Query vector
Top-K matches
Similarity link
TOPICS
TOP-5 Results
IDLE
EMBED QUERY
SCAN SPACE
RANK
RETURN TOP-K
03 · СЕРВЕР & GPU

Хэдэн хэрэглэгч нэгэн зэрэг ашиглах вэ?

Сервер дээр VLLM + Gemma3 12B ажиллуулахад ямар GPU сонголт тохирох, хэдэн concurrent user дэмждэг, хэзээ queue үүсдгийг энд харна уу.

СЕРВЕРС
Olonlog AI Server Build
🟢 Авхаар төлөвлөж буй Server
CPU
AMD Ryzen 9 9950X3D
16C/32T · 5.7GHz boost
🧠
RAM
96GB DDR5 5600MHz
Corsair Vengeance 2×48GB
💾
STORAGE
Samsung 9100 PRO 8TB
PCIe 5.0 · 14,800 MB/s
🖥️
MOTHERBOARD
GIGABYTE X870E Aero X3D
PCIe 5.0 · DDR5 support
❄️
COOLER
DeepCool Mystique 360
LCD Display · 360mm AIO
🔌
PSU
Phanteks Revolt 2200W
80+ Platinum · 2x GPU хүч
GPU СОНГОЛТУУД — ҮНЭ & ЧАДАВХ
СОНГОЛТ А
2× RTX 4090
24GB GDDR6X × 2 = 48GB
НИЙТ ҮНЭ
~$5,500
~$2,750 × 2
8–12
CONCURRENT
~400
ТОК/СЕК
VRAM (нийт)48GB (тус бүр 24GB)
Gemma3 12B FP16✓ Тохирно
Tensor Parallel✓ 2-GPU split
TDP (нийт)900W (450W × 2)
Зах зээлийн үнэ '26↑ Өссөн (+70% MSRP)
СЕРВЕР ✓
СОНГОЛТ Б — ОДООГИЙН
2× RTX 5090
32GB GDDR7 × 2 = 64GB
НИЙТ ҮНЭ
~$7,400
~$3,700 × 2 (зах зээл)
15–25
CONCURRENT
~750
ТОК/СЕК
VRAM (нийт)64GB (тус бүр 32GB)
Gemma3 12B FP16✓ Тав тухтай
Tensor Parallel✓ 2-GPU split
TDP (нийт)1150W (575W × 2)
Bandwidth1.79 TB/s × 2 🔥
ЖИНХЭНЭ AI DATACENTER GPU-ТЭЙГЭЭ ХАРЬЦУУЛБАЛ
GPU VRAM ХУДАЛДАХ ҮНЭ CLOUD/ЦАГ CONCURRENT (12B) ЗОРИУЛАЛТ
RTX 4090
Ada Lovelace · Consumer
24GB GDDR6X ~$2,750 $0.40–0.59/hr
4–8
Dev / тест
RTX 5090 Миний сонголт
Blackwell · Consumer
32GB GDDR7 ~$3,700 $0.80–1.20/hr
8–15
Local prod ✓
2× RTX 5090
Tensor Parallel · VLLM
64GB (32×2) ~$7,400
15–30
Бүрэн байршуулалт
A100 80GB
Ampere · Datacenter
80GB HBM2e $10K–15K $1.49–2.50/hr
25–50
Enterprise cloud
H100 80GB SXM
Hopper · Datacenter
80GB HBM3 $25K–40K $2.69–4.50/hr
50–100
Big AI lab
⚠️ QUEUE ЯАЖ ҮҮСДЭГ ВЭ?

VLLM нь дотоодоо continuous batching хийдэг. GPU-гийн KV cache дүүрэхэд шинэ хүсэлтүүд queue-д орно.

🟢 0–15 хэрэглэгч (2× 5090)
Queue байхгүй. Бүх хүсэлт шууд боловсруулагдана. Хоцрогдол: 200–800мс
🟡 15–30 хэрэглэгч
Богино queue үүснэ. Continuous batching-ийн ачаар харагдахааргүй байж болно. Хоцрогдол: 1–3 сек
🔴 30+ хэрэглэгч
OOM эрсдэл эсвэл урт queue. Хоцрогдол: 5–30+ сек. Нэмэлт GPU шаардагдана.
QUEUE ТООЦООЛОЛ
Нэгэн зэрэг хэрэглэгч: 10
12550
GPU ачаалал (KV Cache) 62%
Queue-д хүлээж буй 0 хүсэлт
✓ Боловсруулалт хэвийн
Дундаж хоцрогдол: ~400 мс
04 · ИНТЕРФЭЙС

Хоёр төрлийн interface

6–12-р анги
🎓
Дунд, Ахлах ангийн
AI Туслах
Ахлах анги
📋
Сурагчдын бүртгэл
Нэвтрэх эрхтэй. Хэн юу асуусан бүртгэгдэнэ.
🔍
Prompt history шалгалт
Багш нар сурагчдын бүх асуулга харах боломжтой.
💬
Text → Text горим
Бичгээр асуулт → бичгээр хариулт. Chat UI загвартай.
Claude API — хүчтэй загвар
Зарим сурагчид Claude API- эрх авна.
🗂️
KV Cache идэвхтэй
Урт яриа, нэг session-д контекст хадгалагдана.
👁️
Жишээ загвар үзэх
Хариулт хэрхэн гарахыг урьдчилж харах товчтой.
Claude API VLLM KV Cache
Туршилтын загвар
🌟
1–5-р анги
🧒
Бага ангийн хүүхдийн
AI Найз
Бага анги
🎤
Speech → Text горим
Хүүхэд бичихгүй — зүгээр ярина. Дуу нь текст болно.
🔊
Text → Speech горим
AI-н хариултыг Chimege дуугаар уншиж өгнө.
🔒
Бүртгэлгүй — нэрээ хэлэхгүй
Нэвтрэх шаардлагагүй. Хүүхэд шууд ашиглана.
🧹
History үүсэхгүй
Яриа хадгалагдахгүй. KV cache ашиглахгүй. Хөнгөн.
🇲🇳
Chimege API — монгол дуу
Монгол TTS/STT — хүүхдэд ойлгомжтой дуугаралт.
Chimege API Speech API No Auth Stateless
Туршилтын загвар
05 · ТОХИЖИЛТ

Төслийн хүрээнд шинэчлэгдэж буй ангиуд

ЗАСАГДАЖ БАЙГАА
505 тоот
1 / 4
Дунд, Ахлах ангийн AI Room
505 ТООТ · ДУНД АХЛАХ СУРГУУЛЬ
СТАТУС МЭДЭГДЭЛ
   🏗️ Дотоод засал өнөөдөр дуусна  ·  🪑 Тавилгын ажил 2025 оны 4 сарын 9-нд бүрэн дуусах төлөвлөгөөтэй  ·  🥽 Apple Vision Pro ашиглан AI-д нэвтрэнэ  ·  🔬 Science experiment-үүдийг бодитоор хийнэ  ·  🎓 Дунд ахлах ангийн сурагчдад зориулсан  · 
🥽
Apple Vision Pro
AI нэвтрэлт
🔬
Science Lab
Бодит туршилт
🤖
Local Server
AI Server энэ өрөөнд байрлана.
ХУВААРЬ
Өнөөдөр
Дотоод засал дуусна
4 сарын 9
Тавилга бүрэн дуусна
Удахгүй
AI системийн тохиргоо
ДАРААГИЙН АНГИУД ТӨЛӨВЛӨГДСӨН
501 тоот
🖥️
Бага сургуулийн
AI Kiosk Room
All-in-one Kiosk том дэлгэц
Big screen — AI хариулт харагдана
Хананд AR гэрэлтдэг самбар
Хичээлийн агуулга AR дүрслэлтэй
Kiosk AR Wall Big Screen
IB
📚
IB сургуулийн
Номын сан
Номын сан 2 хувааж номын сан CS Lab хамт байрлана.
Нэмэлт ангиуд
Тохижуулагдаж болно
Робот програмчлалын анги
Multimedia анги
УДАХГҮЙ
+ Нэмэлт
НИЙТ ЯВЦ
1 / 4 анги бэлэн болж байна
505 тоот 85%
501 тоот 0%
IB Номын сан 0%
Нэмэлт ангиуд
06 · ТӨЛӨВЛӨГӨӨ

Ажлын хуваарь

2025–2026
2026–2027
Хийгдэх ажлууд
Зөвлөх
Түвшин
Ундрам, Баярцэцэг
Амартүвшин
Самбууданзан