Hogyan építs RAG pipeline-t lépésről lépésre (magyar adatokkal)
A RAG (Retrieval-Augmented Generation) az LLM-ek gyakorlati integrációjának legfontosabb architektúrája 2026-ban — mert összeköti a modell erejét a saját, friss, privát adataiddal. Ez a gyakorlati tutorial 7 lépésben végigvezet, hogyan építs éles RAG rendszert magyar dokumentumokból.
1. lépés: Adat előkészítése
Válogasd össze a dokumentumokat (PDF, DOCX, HTML, Confluence, Notion). Bontsd őket kisebb darabokra (chunk) bekezdés- vagy mondat-szinten. A magyar szövegnél a bekezdés-chunking jobb, mint a fix token-határ, mert a magyar mondatok hosszabbak és a ragozás miatt a szavak közt erős szemantikai kötés van.
2. lépés: Embedding modell választása
Magyar nyelvű RAG-hoz a multilingual-e5-large a legjobb belépő, hybrid pontosságra a BGE-m3 jobb. Angol-only task-okra az OpenAI text-embedding-3-large. Minden chunk-ot embeddelünk 768–3072 dimenziós vektorrá, amit később a vector store fog indexelni.
3. lépés: Vector store beállítása
Production-re Qdrant (self-host, EU-régió) vagy Pinecone (managed SaaS). Development-re pgvector Postgres-en. Minden chunk mellé elmentjük a metaadatot (forrás, dátum, szerző, szekció) — ez lesz a szűrők alapja.
4. lépés: Retrieval layer
Felhasználói kérdésből készül embedding → top-K (10–20) vector search. Production-ben hozzáadunk BM25-öt (full-text) és egy re-ranker-t (Cohere Rerank vagy BGE-reranker) — ez átlagosan 3-4x javít a relevancián.
5. lépés: Prompt engineering
A lekért chunk-okat a system prompt után, majd a user kérdés. A system prompt utasítja az LLM-et: csak a megadott chunk-okból válaszolj, idézd őket, és ha nincs elég infó, mondd 'nem tudom'. A magyar tone-of-voice külön szakaszban kerül a system prompt-ba.
6. lépés: LLM integráció
Claude Sonnet 4.6 regulated domain-re (a hallucinációt a legjobban kezeli), GPT-4o kreatív task-ra, Gemini 2.5 long-context feladatokra. Minden esetben zero-retention enterprise API és EU region deployment.
7. lépés: Kiértékelés (eval suite)
A 'működik-e' kérdésre nem az első kipróbálás a válasz — hanem egy golden set. Készíts 50-200 kérdés-válasz párost, futtasd heti rendszerességgel. Mérd a hit rate-et, faithfulness-t, answer relevance-et. Eszközök: LangSmith, Ragas, Promptfoo.
“A RAG rendszerek 80%-a azon bukik el, hogy nem csinálnak eval suite-ot. Az első éles deploy után azt hiszik, működik, aztán három hónap múlva derül ki, hogy 40%-os a valós pontosság.”
Tipikus időzítés és költség
Egy kis RAG (5–10k dokumentum) fejlesztési ideje 4-6 hét, €15.000–€35.000. Közepes vállalati RAG (több forrás, hybrid search, RBAC) 8-12 hét, €35.000–€80.000. A futóköltség €500-€2.500/hó közötti, API és infra választól függően.