向量检索与通义千问搭建专属问答服务

备案控制台

方案导读

本方案介绍如何使用向量检索服务（DashVector）结合通义千问大模型来打造基于垂直领域专属知识等问答服务。解决大模型本身在处理特定领域的知识表示和应用时的局限性。为企业提供部署简单、便于集成、实时高效、专业稳定的应用服务。

本方案重点介绍如何利用DashVector自主构建RAG能力，如果您倾向于完整的RAG产品模式，可以参考阿里云百炼提供的RAG检索增强服务。如果您有免费试用资格，可按照手动部署免费体验本方案（向量检索服务支持申请免费试用实例，通义千问及通用文本向量模型支持限时免费）如果采用一键部署，会额外产生ECS抢占式实例的费用，约0.5元/小时。实际产生费用价格以控制台显示为准。

通过ROS一键部署专属问答服务，只需5分钟，费用低至0.5元/小时。

方案介绍

向量检索与通义千问搭建专属问答服务

通过文本向量模型将其转化为高质量低维度的向量数据，再写入DashVector向量检索服务。数据的向量化采用灵积模型服务上的Embedding API实现。将提问文本向量化后，通过DashVector提取相关知识点的原文。将相关知识点作为“限定上下文+提问”一起作为prompt询问通义千问。

解决问题：问答结果不准确

大语言模型本身有丰富的自然语言处理能力，但其训练语料库一般由普适知识、常识性知识组成。在处理特定领域的知识时会有局限性，匹配的效果往往不太理想。

解决问题：检索方式单一

带关键词感知能力的向量检索能力，既有“两路召回、综合排序”方案的优点，使得系统复杂度、资源开销大幅度降低，还具备关键词检索、向量检索、关键词+向量混合检索的优势。

相关产品

向量检索服务模型服务灵积

方案优势

向量数据实时索引

当向量发生新增、删除、修改后，向量状态即时生效，实现了向量即增即查、即时落盘以及向量实时动态更新。

支持关键词感知

Sparse Vector具备关键词检索、向量检索、关键词 + 向量混合检索的优势，且可大幅降低系统复杂度。数据统一、检索效率高。

简洁 SDK 功能设计

通过简洁易用的 SDK/API 接口透出，方便被上层 AI 应用迅速集成。

应用场景

企业内部问答平台

通过DashVector+通义千问构建企业内部专有知识库，企业内部的员工可以提出问题，获取产品知识等答案和业务解决方案。

企业智能客服

基于DashVector+通义千问实现智能问答、语义理解和自动回复等功能，从而减少客服人员的工作负担，提高客户服务效率和质量，提高客户支持效率，增强客户体验和满意度。

智能旅游顾问

智能旅游顾问可以为用户提供个性化的旅游规划建议和旅游咨询服务，提高旅游体验和满意度。智能旅游顾问可通过机器学习进行用户画像和旅游需求分析，提供个性化的旅游路线和景点推荐，并根据用户的反馈进行自动迭代和优化。提供更加个性化、人性化的旅游服务。

方案部署

01部署准备

开通灵积模型服务、向量检索服务，并获得API-KEY、完成Cluster创建。准备开发环境及数据。

02本地知识库向量化

创建embedding.py文件，并将示例代码复制到embedding.py中，将文稿存入向量检索服务中。

03提取知识点

创建search.py文件，并将示例代码复制到search.py文件中，在向量检索服务中检索最相关的知识点。

04构造 Prompt

将 “提问 + 知识点” 按照特定的模板作为prompt向LLM（通义千问）发起提问。

05验证及清理

验证方案是否部署成功。如完成本方案部署后无需使用相关资源，请释放相关云资源。

方案部署一键部署