课程简介
RAG 技术在当下的信息检索领域是一项关键技术,其把检索与生成相结合,以此提升生成文本的质量及准确性,从而得到更具语义连贯性和信息准确性的结果。不过,针对海量文档的信息检索存在一些核心问题,也就是怎样在有限的预算内实现高效、准确且安全的信息检索与增强。
OpenSearch 作为一款开源且在向量检索、混合检索等场景已颇有建树的搜索分析套件,目前已在字节跳动内部得到广泛应用。凭借 OpenSearch 所具有的海量数据、调优工具以及实践经验的优势,构建更为精准高效的模块化 RAG 系统成为了一个富有意义的解决办法。
本次分享字节云搜索构建向量化引擎的实现思路,帮助企业利用多路召回和混合搜索能力,以及干预方法进行精准检索,同时介绍对 Embedding 模型、ReRanker 模型、大模型采用的模块化可插拔的实践,探讨不同业务需求中如何通过规则引擎简化流程、降低成本、提高准确度。同时,为大家分享实现符合当前需求的多模态检索,以及在不同行业和场景中应用的典型案例的最佳实践。
课程收益
1、帮助学员了解结合传统检索方式,借助 OpenSearch 的搜索能力和模块化设计构建一个更便捷、可扩展的RAG系统。
2、帮助学员了解RAG系统的基础概念和构建方法
3、帮助企业掌握应用RAG在智能问答、搜推应用、混合搜索等不同场景中的落地实践
受众人群
企业管理者,IT行业从业者及其他对RAG系统感兴趣的人员
课程周期
3H
课程大纲
1、RAG检索的挑战
1)字节跳动使用方式与规模
2)存在的挑战,why OpenSearch
2、基于OpenSearch构建RAG系统
3、典型案例最佳实践
4、QA