RAG 检索基础使用
本章节将指导您快速入门 PIG AI 的 RAG (检索增强生成) 功能,基础篇使用阿里云百炼平台提供充足的免费调用额度,满足大多数用户的日常需求。先熟悉本章节内容,再深入研究私有化部署章节方案,一口吃不了大胖子。
模型类型 | 模型名称 |
---|---|
聊天模型 | qwen-max |
向量模型 | qwen-text-embedding |
视觉模型 | qwen-vl |
一、配置向量数据库
PIG AI 在 2025.3 版本已全面接入 Milvus 向量数据库,我们强烈推荐使用 Milvus 作为您的首选向量存储方案,它提供了更好的性能和扩展性。
milvus 提供 cloud 版本在线使用版本,适和本地快速测试使用,刚上手 PIGAI 请使用这个方式
PIG AI 向量配置
milvus 提供 cloud 版本在线使用版本,适和本地快速测试使用,刚上手 PIGAI 请使用这个方式
PIG AI 向量配置
二、配置模型
2.0 大模型 KEY
2.1 配置聊天模型
2.2 配置向量模型
2.3 配置视觉模型
三、知识库配置
3.1 创建知识库
- 知识库管理 > 新增
- 高级配置、安全配置参数 正常情况下不需要修改
- 匹配率、匹配条数:决定了大模型匹配的幻觉率,比如匹配率越低,在知识内容较少的情况下,大模型匹配的幻觉率越高(胡说八道)。建议根据自己实际情况动态调整此处参数
3.2 上传资料
- 知识库管理 > 新增
3.3 切片管理
- 上传至知识库的资料,会自动切片,切片管理可以查看切片详情,点击切片即可编辑。
- 当右上角显示已训练的标识时,则说明文档已经调用大模型生成了切片的向量并存储到向量数据库。
四、问答测试调用
AI 助手点击具体的文档库,进行针对性的问答调用。