2025大模型赋能投研:如何结合结构化数据搭建本地智能投研系统?
今天分享的是:2025大模型赋能投研:如何结合结构化数据搭建本地智能投研系统?
报告共计:36页
《2025大模型赋能投研:如何结合结构化数据搭建本地智能投研系统?》由国金证券撰写,探讨RAG架构在大模型应用中的作用、痛点,以及RAGFlow开源解决方案在金融投研领域的应用。
1. RAG架构的重要性与痛点:大模型发展促使LLM应用落地,但面临“幻觉”、过时信息和专业知识匮乏问题。RAG架构通过引入知识库,检索补充信息,辅助大模型落地,在智能研报解读、政策法规解读等场景有广泛应用。然而,RAG工作流程存在痛点,“索引入库”时,文本识别分块、信息处理和Embedding模型选择困难;“检索输出”时,内容检索、重排序模型选择和Prompt处理影响结果;向量数据库也需提升效率和支持结构化数据融合。
2. RAGFlow开源解决方案:在多种RAG开源方案中,RAGFlow追求高质量输入输出,深度理解文档,支持复杂格式和结构化数据。在“索引入库”流程,DeepDoc组件解析分块文档,Raptor策略和知识图谱处理信息,还提供多种Embedding模型。“检索输出”时,采用混合搜索和多路召回,优化重排序策略,设计合理Prompt模板,并引入Deep Research提升LLM思考能力。向量数据库当前使用Elasticsearch,未来将接入Infinity,提升检索质量。
3. RAGFlow效果评估与应用:基于RAGAs框架,以15篇金融报告为样本评估RAGFlow,设计问题和答案,设置多指标衡量。结果显示,“General”解析方式结合知识图谱社区摘要功能检索效果好,开启Raptor可减少解析时间;Embedding模型选SFR - Embedding - Mistral、Reranker模型选bce - reranker - base_v1较优;还确定了其他参数的较优范围。在金融投研领域,RAGFlow可进行文本、结构化数据及混合检索,实现Text to SQL功能和周报自动化写作。
RAGFlow为大模型赋能投研提供了有效方案,通过解决RAG架构痛点,优化各组件和参数,在金融领域展现出强大应用潜力,助力提升金融投研效率和智能化水平 。
以下为报告节选内容
报告共计: 36页
中小未来圈,你需要的资料,我这里都有!