课程简介
在金融行业数字化转型加速推进的当下,银行业作为核心领域,既面临着提升业务效率、优化客户服务的迫切需求,又承受着严格的数据安全监管压力。此外,银行内部积累了海量的非结构化数据,这些数据蕴含着宝贵的知识,却因格式复杂、提取困难而未被有效利用。如何将这些分散、无序的数据转化为结构化知识,构建一个高效、智能的知识库,为审批人员提供实时、准确的知识支持,成为提升银行竞争力的关键。
本课程以信贷审批场景为案例,系统讲解Deepseek本地化部署与企业级RAG知识库构建的全流程。通过模块化教学,涵盖硬件适配、模型部署、非结构化数据处理、多级知识库搭建等核心技术,结合实操任务完成环境配置、数据清洗、索引优化等关键环节,助力学员掌握从数据安全治理到业务场景赋能的完整方法论,为金融机构提供兼顾合规性、效率与体验的数字化转型解决方案。
课程收益
1、帮助学员掌握Deepseek本地化部署全流程,包括硬件选型、软件适配及分步上线策略,确保数据安全合规;
2、帮助学员学会构建多级RAG知识库,实现非结构化数据提取、混合索引优化及多维度检索,提升知识利用率;
3、帮助学员获得智能审批辅助系统落地经验,助力企业数字化转型
受众人群
银行相关业务及技术人员
课程周期
0.5天(3H)
课程大纲
标题 | 授课内容 |
一、基于案例的本地化部署 | 1. 案例背景与本地化需求解析(10 分钟) (1) 某城商行信贷审批现状:日均处理 500 + 信贷申请,依赖人工查询政策文件、历史案例,效率低且易出错;客户信贷数据包含征信、资产等敏感信息,需严格保障数据安全。 (2) 本地化部署必要性:结合《银行业金融机构数据安全管理办法》,分析该银行为何放弃云端部署 —— 避免敏感数据出境、满足监管 “数据不出行” 要求,同时减少网络延迟对实时审批的影响。 (3) 项目目标:完成 Deepseek 本地化部署、构建信贷审批业务识库,支撑信贷审批业务场景化应用。 2. 案例场景下的部署环境准备(15 分钟) (1) 硬件适配:根据该银行信贷数据规模(月增 10 万条结构化数据 + 5 万份非结构化文件),确定服务器配置及集群架构。 (2) 软件环境:适配银行现有 Windows/Linux 系统,安装ollama/vllm、deepseek、qwen3_emb、dify等。 (3) 实操任务 1:学员分组模拟该银行环境,使用提供的配置清单检查硬件 / 软件兼容性,输出环境准备报告。 3. 案例项目的本地化部署实施(35 分钟) (1) 部署规划:基于该银行 “分步上线” 策略,先部署ollama/vllm、然后部署deepseek、Qwen3_Emb基础模型服务,再然后部署Dify本地知识库、接入信贷数据,最后联调测试。 (2) 关键步骤演示:讲解deepseek、ollama/vllm、dify本地部署过程。 (3) 实操任务 2:分组执行简化版部署流程,参照案例部署手册,完成dify的安装部署和deepseek模型的参数配置。 |
二、基于案例的 RAG 知识库构建 | 1. 案例知识库的需求定位(10 分钟) (1) 核心功能:为信贷审批人员提供实时知识支持,包括监管政策匹配、历史案例检索(同类客户审批结果)、。 (2) 数据构成:内部数据(近 3 年信贷审批单、客户征信报告、贷后风险记录)+ 外部数据(央行信贷政策、行业风险评级报告)。 (3) 案例痛点:非结构化数据占比达 60%(如客户经理手写调查报告),需解决格式识别与信息提取难题。 2. 案例数据的采集与处理全流程(20 分钟) (1) 采集方案:从银行核心系统抽取结构化数据,通过文档解析工具抽取非结构化电子文档,通过 OCR 工具识别非结构化报告,调用央行开放 API 获取最新政策。 (2) 数据处理重点: ① 非结构化转结构化:使用 Deepseek 的文本理解能力,从调查报告中提取 “客户收入稳定性”“抵押物估值” 等关键字段。 (3) 实操任务 3:使用案例提供的 10 份模拟信贷报告(含手写体扫描件),完成数据清洗、脱敏及结构化转换,输出标准化数据表。 3. 案例知识库的构建实施(20 分钟) (1) 知识抽取:基于信贷审批场景,定义 “借款金额”“担保方式”“审批结论” 等 20 个核心实体,用 Deepseek 提取并关联。 (2) 索引优化:针对该银行高频查询场景(如 “房贷利率政策”),采用倒排索引 + 向量索引混合模式,提升检索速度 30%。 (3) 结构设计:按 “政策库 - 案例库 - 风险库” 三级架构搭建,支持按 “业务类型(房贷 / 经营贷)”“客户等级” 多维度检索。 (4) 实操任务 4:基于处理后的数据,分组搭建小型信贷知识库,完成索引创建并测试检索效果。 4. 案例知识库的效果评估(10 分钟) (1) 评估方法:模拟 100 次真实审批查询(如 “客户有 3 次逾期记录能否获批 30 万经营贷”),统计准确率(该银行目标≥95%)、平均响应时间(目标<800ms)。 (2) 优化案例:针对初期 “政策时效性识别不足” 问题,添加时间权重因子,使政策匹配准确率从 82% 提升至 96%。 |
三、基于案例的 RAG 知识库应用 | 1. 案例中的核心应用场景落地(15 分钟) (1) 智能审批辅助:审批人员输入客户信息后,系统自动检索相似案例(如 “同行业同规模企业的审批额度”)并生成参考意见,该银行应用后审批效率提升 40%。 (2) 政策智能解读:将央行 “房地产贷款集中度管理” 等政策转化为 “可执行规则”,如自动提示 “某支行房贷额度已达上限”。 2. 案例应用的技术实现(20 分钟) (1) 接口开发:演示如何通过 RESTful API 将知识库与该银行信贷审批系统对接,实现 “一键查询” 功能(提供案例中的 API 文档模板)。 (2) 交互设计:模拟该银行的 “自然语言查询界面”,支持模糊提问(如 “小微企业贷款有哪些优惠”),讲解意图识别与查询改写逻辑。 (3) 实操任务 5:使用搭建的知识库,模拟信贷审批场景,完成 3 个典型查询(政策匹配、案例检索、风险预警)并输出结果报告。 3. 案例应用效果复盘与优化(15 分钟) (1) 量化成果:该银行应用后的数据对比 —— 审批周期从 3 天缩短至 1.5 天,人工错误率从 8% 降至 2%,客户满意度提升 25%。 (2) 持续优化:建立 “用户反馈 - 数据更新 - 模型调优” 闭环,如根据审批人员反馈,补充 “新市民信贷政策” 等遗漏知识点。 4. 案例延伸与项目总结(10 分钟) (1) 场景拓展:该知识库在 “贷后管理”(如逾期客户催收话术推荐)、“内部培训”(新员工审批流程学习)中的延伸应用。 (2) 项目全流程回顾:串联本地化部署(数据安全基础)- 知识库构建(内容核心)- 应用落地(价值体现)的逻辑关系,强调各环节对项目成败的影响。 |
四、课程总结与答疑 | 1. 案例项目回顾:以时间轴形式梳理某城商行项目从需求分析到落地见效的关键节点,总结各模块的联动关系。 2. 问题答疑与经验分享:解答学员在案例实操中遇到的技术难点,分享银行 RAG 项目实施的 “避坑指南”。 |
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
Zane Zhang
百林哲咨询(北京)有限公司专家团队成员
京ICP备2022035414号-1