Hogyan építs RAG pipeline-t lépésről lépésre (magyar adatokkal)

AI architekt, UseAIEasily alapító

2026. április 14. · 12 perc olvasás

Frissítve: 2026. április 17.

A RAG (Retrieval-Augmented Generation) az LLM-ek gyakorlati integrációjának legfontosabb architektúrája 2026-ban — mert összeköti a modell erejét a saját, friss, privát adataiddal. Ez a gyakorlati tutorial 7 lépésben végigvezet, hogyan építs éles RAG rendszert magyar dokumentumokból.

1. lépés: Adat előkészítése

Válogasd össze a dokumentumokat (PDF, DOCX, HTML, Confluence, Notion). Bontsd őket kisebb darabokra (chunk) bekezdés- vagy mondat-szinten. A magyar szövegnél a bekezdés-chunking jobb, mint a fix token-határ, mert a magyar mondatok hosszabbak és a ragozás miatt a szavak közt erős szemantikai kötés van.

2. lépés: Embedding modell választása

Magyar nyelvű RAG-hoz a multilingual-e5-large a legjobb belépő, hybrid pontosságra a BGE-m3 jobb. Angol-only task-okra az OpenAI text-embedding-3-large. Minden chunk-ot embeddelünk 768–3072 dimenziós vektorrá, amit később a vector store fog indexelni.

3. lépés: Vector store beállítása

Production-re Qdrant (self-host, EU-régió) vagy Pinecone (managed SaaS). Development-re pgvector Postgres-en. Minden chunk mellé elmentjük a metaadatot (forrás, dátum, szerző, szekció) — ez lesz a szűrők alapja.

4. lépés: Retrieval layer

Felhasználói kérdésből készül embedding → top-K (10–20) vector search. Production-ben hozzáadunk BM25-öt (full-text) és egy re-ranker-t (Cohere Rerank vagy BGE-reranker) — ez átlagosan 3-4x javít a relevancián.

5. lépés: Prompt engineering

A lekért chunk-okat a system prompt után, majd a user kérdés. A system prompt utasítja az LLM-et: csak a megadott chunk-okból válaszolj, idézd őket, és ha nincs elég infó, mondd 'nem tudom'. A magyar tone-of-voice külön szakaszban kerül a system prompt-ba.

6. lépés: LLM integráció

Claude Sonnet 4.6 regulated domain-re (a hallucinációt a legjobban kezeli), GPT-4o kreatív task-ra, Gemini 2.5 long-context feladatokra. Minden esetben zero-retention enterprise API és EU region deployment.

7. lépés: Kiértékelés (eval suite)

A 'működik-e' kérdésre nem az első kipróbálás a válasz — hanem egy golden set. Készíts 50-200 kérdés-válasz párost, futtasd heti rendszerességgel. Mérd a hit rate-et, faithfulness-t, answer relevance-et. Eszközök: LangSmith, Ragas, Promptfoo.

“A RAG rendszerek 80%-a azon bukik el, hogy nem csinálnak eval suite-ot. Az első éles deploy után azt hiszik, működik, aztán három hónap múlva derül ki, hogy 40%-os a valós pontosság.”
— Mező Dezső, UseAIEasily

Tipikus időzítés és költség

Egy kis RAG (5–10k dokumentum) fejlesztési ideje 4-6 hét, €15.000–€35.000. Közepes vállalati RAG (több forrás, hybrid search, RBAC) 8-12 hét, €35.000–€80.000. A futóköltség €500-€2.500/hó közötti, API és infra választól függően.

Hogyan építs RAG pipeline-t lépésről lépésre (magyar adatokkal)

1. lépés: Adat előkészítése

2. lépés: Embedding modell választása

3. lépés: Vector store beállítása

4. lépés: Retrieval layer

5. lépés: Prompt engineering

6. lépés: LLM integráció

7. lépés: Kiértékelés (eval suite)

Tipikus időzítés és költség

Honnan tudod, hogy az AI rendszered tényleg működik? (eval suite útmutató)

AI ügynök fejlesztés ára 2026-ban: mennyibe kerül és mennyi idő?

AI tanácsadás Budapest — mit várj egy szakértőtől 2026-ban

RAG fejlesztés