RAG 面试专题
RAG 原理、文档切分、Embedding、向量库、检索优化、落地
题目列表
- 1. 什么是 RAG?详细描述一个完整 RAG 系统的详细工作流程?
- 2. 大模型的 RAG 主要用来解决什么问题?
- 3. 相比直接微调 LLM,RAG 解决了什么问题?微调和 RAG 各自的优劣势是什么?
- 4. RAG 中的文档是怎么存的?粒度是多大?详细说说文档切割(Chunking)策略?
- 5. 怎么规避语义被切割掉的问题?
- 6. 在 RAG 中 Embedding 究竟是什么?如何选择和评估一个 Embedding 模型?
- 7. Embedding 有哪几种算法你了解过吗?
- 8. 什么是向量数据库?有没有做过向量数据库的对比选型?
- 9. 讲讲你用的向量数据库?数据量级是多大?性能如何?遇到过性能瓶颈吗?
- 10. 你使用 RAG 给大模型一个输入,系统是怎样的工作流程?
- 11. 请你介绍一下向量检索和关键词检索的区别?
- 12. 如何润色用户的 Query(Query Rewrite)?目的是什么?
- 13. 什么是多路召回?具体怎么做?
- 14. RAG 检索优化策略有哪些?
- 15. 了解哪些更复杂的 RAG 范式?
- 16. 在什么场景下,你会选择使用图数据库来增强传统的向量检索?
- 17. 如何规避 RAG 系统中大模型的幻觉?
- 18. 怎么量化你的 RAG 效果?
- 19. RAG 知识库如何实现动态与持续更新?
- 20. 在实际落地中,你觉得 RAG 最难的地方是哪里?