Definitie
Retrieval-Augmented Generation (RAG) is een techniek die generatieve modellen combineert met informatie-ophaalsystemen. Het baseert de output op externe bronnen om de feitelijke nauwkeurigheid te verbeteren.
Doel
Het doel is om hallucinaties in generatieve AI te verminderen door antwoorden te verrijken met gevonden documenten. Dit is vooral nuttig bij het beantwoorden van vragen en kennisintensieve taken.
Belang
- Verbetert de feitelijke nauwkeurigheid van LLM-uitkomsten.
- Maakt domeinspecifieke kennisintegratie mogelijk.
- Vereist betrouwbare ophaalsystemen.
- Gerelateerd aan hybride zoeken en open-domein QA.
Hoe het werkt
- Gebruiker geeft een vraag of prompt.
- Het ophaalsysteem haalt de relevante documenten op.
- Documenten worden doorgegeven aan een generatief model.
- Het model genereert reacties die gebaseerd zijn op opgehaalde content.
- Feedbackloops verbeteren toekomstige prestaties.
Voorbeelden (echte wereld)
- OpenAI ChatGPT met browser- of ophaalplug-ins.
- Meta RAG-model: onderzoek naar op retrieval gebaseerde LLM's.
- Perplexity AI: conversatiezoekfunctie met behulp van retrieval.
Referenties / Verder lezen
- Lewis et al. “Retrieval-Augmented Generation voor kennisintensieve NLP.” NeurIPS 2020.
- Implementatie van Hugging Face RAG.
- Stanford HAI-onderzoek naar ophaalmethoden.
- Wat is RAFT? RAG + Fine-Tuning