如何使用Rust创建一个基于ChatGPT的RAG助手-德赢Vwin官网网

如今，ChatGPT 已经成为家喻户晓的名字，每个开发者都主动或被动地使用过 ChatGPT 或者是基于 ChatGPT 的产品。ChatGPT 很好，但是应用到实际工作与生活场景，ChatGPT 经常会出现一些幻觉，“一本正经”地为我们提供一些错误答案，没有办法为我们提供专业的意见或指导。那我们如何让 ChatGPT 具备某个专业领域的知识，提升回答的正确率，从而让 ChatGPT 真的用起来？比如训练 ChatGPT 成为企业的智能客服助手，解放客服的双手。

如何构建一个具有专业知识的机器人

为了解决这个问题，一般我们有两种解决方法。第一种是利用自己的数据在大模型的基础上进行 fine-tune（微调），训练出一个具备相关领域的知识的大模型，另一种方法称作 RAG (Retrieval-Augmented Generation)，检索增强生成，利用向量数据库的能力，将专业的知识数据转换成多个向量，然后再利用大模型的能力进行检索，最后回答问题。两种方法各有自己的优势和劣势，总体来说，尽管 RAG 的准确度不如 fine-tune 高，但是 RAG 的性能比更适合普罗大众，因为 RAG 更简化，更高效。RAG 的优势有以下几点：

相较于微调大模型需要GPU算力等硬件设备支持，RAG 只需要在软件层面添加向量数据库，操作起来更加简单，成本也更低。

当有数据更新时，RAG 允许开发者通过添加新的 embedding 以保证内容的时效性，但是微调大模型则需要反复重新训练模型，耗费资源比较多

	fine-tune	RAG
是否需要 GPU 资源	是	否
开发周期	长	短
更新/删除知识	需要重新训练	更新 embedding
适合场景	赋予大模型某种能力	赋予大模型某种知识
结果准确度	高于 RAG	低于 fine-tune

如何使用 Rust 创建一个基于 ChatGPT 的 RAG 助手

常见的构建 RAG 助手的工具是以Python为主的 langchain，但是如何使用 Rust 来构建呢？这就需要我们有一套围绕 Rust 语言打造的 LLM 工具链。flows.network 就是这样一个专门为 Rust 开发者打造的构建 LLM Agent 的平台。和 langchain 一样，flows.network 为 Rust 开发者包装了常用的 LLM 工具库，比如 ChatGPT 、Claude、Llama2 以及我们常用的 SaaS 工具 GitHub 、Discord、Telegram、Slack。但是更进一步的是，flows.network 是一个 serverless Rust 平台，开发者只需构建业务逻辑，编译以及部署 Rust 函数都由平台完成。

具体到构建基于 ChatGPT 的 RAG 助手，flows.network 已经开源了一套开箱即用的框架供 Rust 开发者使用。最近新发布 Learn Rust 助手就是基于这套框架所实现的。

为了方便大家理解基于 ChatGPT 的 RAG 助手，我在这里补充了一张在 Learn Rust 助手询问问题的流程图。从用户问一个问题开始，Agent 就要和向量数据库和 LLM 打交道，为没有记忆的大模型补充手脚、眼睛和记忆。

下面我们来详细看看怎么使用 Rust 构建 RAG 助手。开源的代码分为两部分，一部分是利用向量数据库创建 embedding，另一部分是把加好 embedding 的向量数据库与我们常用的工具结合起来。这两部分代码都是完全用 Rust 编写的。

这篇文章主要聚焦如何搭建 RAG 知识库助手，不会对代码进行详细解释。对源代码感兴趣的朋友，敬请期待我们下一篇文章。

首先先来看第一部分在向量数据库中创建 embedding。

在创建 embedding 的这个 demo repo 我们需要做三件事：

fork 这个 repo，把文件 text1.txt 里的内容换成自己的内容。这里要注意 embedding 的方法，要把相似的内容放在一个 embedding 里，每个空行代表一个 embedding。你也可以直接在本地存储自己的 embedding。

将 RAG-embedding repo 的代码部署在 flows.network 上，得到一个可以访问向量数据库的 webhook。

在这个 webhook 中添加 embedding 的内容以及命名 collection。

第一步是主要是开发者自己的工作，你可以选择手动分段，也可以选择使用算法进行分段。

第二步需要用到 flows.network，简单来说，我们需要把包含源代码的 repo 导入到 flows.network 平台，并且添加 OpenAI的 APIkey。因为把 text 转换成 embedding 的工作是调用 OpenAI 的 embedding API 完成的。部署完成后，我们会在页面看到一个 webhook 链接。这个 webhook 链接需要保存下来，因为接下来我们将通过这个 wbhook 添加 embedding 的内容。

//webhook示例 https://code.flows.network/webhook/I9GNgD5HKhFLY25DsOUI

第三步是用 curl 为这个向量数据库添加 embedding 内容。打开终端命令行工具，输入下面的命令行。

//获取源代码及准备好的txt文件 gitclonehttps://github.com/alabulei1/demo-RAG-embeddings.git cddemo-RAG-embeddings //上传创建好的 embedding 文件。 //Webhook链接要替换成在flows.network生成的链接 //collection_name可以随意替换，要记住这个名字，后面需要用到 //"@test1.txt"根据实际情况替换即可 curl"https://code.flows.network/webhook/I9GNgD5HKhFLY25DsOUI?collection_name=laokeshi&vector_size=1536&reset=1"-XPOST--data-binary"@test1.txt" //添加成功后，终端会提示总共创建了多少个embedding Successfullyinserted7records.Thecollectionnowhas7recordsintotal

看到终端输出如上的命令行，就意味着我们的 embedding 已经创建好了。

下面的视频展示了如何在 flows.network 上部署这个创建 embedding 的 repo，并且在得到webhook 链接后，如何把 embedding 添加到向量数据库。

接下来就可以将这些 embedding 与其他 SaaS 工具自由组装。这时候就用到我们的第二个 demo repo：使用这些 embedding 创建一个 discord 机器人（Agent），让用户能够在 Discord 直接咨询相关问题。

同样，我们需要将 RAG-discord-bot demo repo 导入到 flows.network 进行部署。我们需要配置五个环境变量。discod_token 和 bot_id 是设置 Discord 机器人的。这两个参数在 Discord 的开发者中心获取。

还有一个 collection_name ，这里要填入我们在上一步创建 embedding 的是所设置的 collection_name 的值，让 Discord agent 知道去找哪个数据库检索相关内容。

另外两个是 Agent 本身的信息。error-mesg 是发生错误时，给用户的错误提示信息，system_promopt 是 agent 总的 Prompt，给 ChatGPT 规划任务。

同样，下面有一个视频展示了如何在 flows.network 上导入 github repo，创建这个 Discord 机器人。

当 flow 的状态变成 ready 后，就可以去 server 里找刚刚创建的 Discord 机器人，让这个 Discord 机器人回答问题。注意，这时的 Discord 机器人应该是 online 的状态，如果 Discord 机器人是 offline 的状态，请检查 Discord 机器人是否设置正确。

这就是使用 Rust 创建一个基于 ChatGPT 的 RAG 助手的全部过程。当然你也可以把 ChatGPT 换成其他的大模型，比如 Llama2。

使用 Rust 构建 LLM Agent 并没有那么难！如果你正在发愁不知道怎么把 Rust 用起来，来试试构建这个 RAG Agent 吧。你可以构建企业手册助手、开发手册助手、开源项目助手等等。

下一篇文章，我们将详细解读这个 RAG 助手的 Rust 源代码，帮助大家更好地理解这背后的原理。敬请期待！

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
209

文章
27720

浏览量
203635
gpu

gpu

+关注

关注
27

文章
4558

浏览量
127981
python

python

+关注

关注
53

文章
4747

浏览量
83927
Rust

Rust

+关注

关注
1

文章
226

浏览量
6477
ChatGPT

ChatGPT

+关注

关注
28

文章
1513

浏览量
6491

原文标题：手把手教你用 Rust 实现一个基于 ChatGPT 的 RAG 助手

文章出处：【微信号：Rust语言中文社区，微信公众号：Rust语言中文社区】欢迎添加关注！文章转载请注明出处。

如何使用Rust连接Redis

] redis = "0.22" Redis基础用法和示例连接Redis 连接Redis非常简单，只需要使用redis::Client来创建一个连接即可，如下所示： use redis::Client; fn ma

发表于09-19 16:22 • 1856次阅读

如何在Rust中使用Memcached

Memcached协议的实现，使得开发者可以在 Rust中使用Memcached。基础用法创建连接使用 Rust语言Memcached需要先创建一

发表于09-19 16:30 • 1052次阅读

RustGUI实践之Rust-Qt模块

Rust-Qt 是 Rust语言的一个Qt 绑定库，它允许 Rust开发者使用 Qt 框架来创建

发表于09-30 16:43 • 1316次阅读

Rust的多线程编程概念和使用方法

的 std::thread::Thread 结构体表示。我们可以通过下面的代码来创建一个Thread： use std::thread; fn

发表于09-20 11:15 • 742次阅读

TaD+RAG-缓解大模型“幻觉”的组合新疗法

TaD：任务感知解码技术（Task-aware Decoding，简称TaD），京东联合清华大学针对大语言模型幻觉问题提出的一项技术，成果收录于IJCAI2024。 RAG：检索增强生成技术

发表于07-16 15:01 • 1570次阅读

【国产FPGA+OMAPL138开发板体验】（原创）6.FPGA连接ChatGPT4

OMAP-L138（定点/浮点DSP C674x+ARM9）+ FPGA处理器的开发板。编写一个用于FPGA访问 ChatGPT4的程序代码是一

发表于02-14 21:58

让chatGPT帮我写硬件代码，是懂行的，好助手！#chatgpt#物联网开发 #python开发板

ChatGPT

苏州煜瑛微电子科技有限公司
发布于 :2023年02月17日 15:27:42

只会用Python？教你在树莓派上开始使用Rust

项目，请创建一个新目录，然后输入mkdir YourFoldercd YourFolder使用Cargo 创建一

发表于05-20 08:00

科技大厂竞逐AIGC，中国的ChatGPT在哪？

推出了 ChatGPT，尝试在这里与它交谈”，还包括一个链接，任何人都可以点击链接，免费与 ChatGPT交谈。与Siri、小爱同学等语音助手

发表于03-03 14:28

在Rust代码中加载静态库时，出现错误 `rust-lld: error: undefined symbol: malloc `怎么解决？

我正在 MCUXpresso IDE 中创建一个静态库。我正在使用 redlib 在我的代码中导入 ` [i]stdlib.h`。它成功地构建了一个

发表于06-09 08:44

一个用于打印漂亮的Rust结构和枚举表tabled

一个易于使用的库，用于打印漂亮的 Rust结构和枚举表。

发表于10-09 10:23 • 1209次阅读

一个用Rust开发的压测工具rsb

一个用 Rust开发的压测工具，项目地址：rsb，给个star 鼓励下。

发表于03-21 09:32 • 718次阅读

什么是RAG，RAG学习和实践经验

高级的 RAG能很大程度优化原始 RAG的问题，在索引、检索和生成上都有更多精细的优化，主要的优化点会集中在索引、向量模型优化、检索后处理等模块进行优化

发表于04-24 09:17 • 430次阅读

如何手撸一个自有知识库的RAG系统

用于自然语言处理任务，如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的 RAG系统数据收集建立知识库向量检索提示词与模型数据收集数据的收集再整个

发表于06-17 14:59 • 247次阅读

OpenAI向部分用户推出ChatGPT语音助手

据智通财经APP报道，OpenAI正在为其部分尊贵的用户们精心呈现备受瞩目的 ChatGPT语音助手，尽管此款助手原定于今年6月底的发布因为可能存在的安全隐患问题而被暂时搁置。

发表于07-31 15:41 • 310次阅读

搜索历史

如何使用Rust创建一个基于ChatGPT的RAG助手

评论

如何使用Rust连接Redis

如何在Rust中使用Memcached

RustGUI实践之Rust-Qt模块

Rust的多线程编程概念和使用方法

TaD+RAG-缓解大模型“幻觉”的组合新疗法

【国产FPGA+OMAPL138开发板体验】（原创）6.FPGA连接ChatGPT4

让chatGPT帮我写硬件代码，是懂行的，好助手！#chatgpt#物联网开发 #python开发板

只会用Python？教你在树莓派上开始使用Rust

科技大厂竞逐AIGC，中国的ChatGPT在哪？

在Rust代码中加载静态库时，出现错误 `rust-lld: error: undefined symbol: malloc `怎么解决？

一个用于打印漂亮的Rust结构和枚举表tabled

一个用Rust开发的压测工具rsb

什么是RAG，RAG学习和实践经验

如何手撸一个自有知识库的RAG系统

OpenAI向部分用户推出ChatGPT语音助手