LangChain+ChatGPT三分钟实现基于pdf等文档问答应用

日期：2024-12-26 作者：danquan1688 移动：http://oml01z.riyuangf.com/mobile/quote/38780.html

LangChain是一个用于开发由语言模型驱动的应用程序的框架。它不仅可以通过API调用语言模型，还可以连接语言模型到其他数据源（数据感知），并允许语言模型与其环境进行交互（具有代理性）。LangChain提供了模块化的抽象组件，用于与语言模型一起工作，并为所有这些抽象提供了实现集合。此外，LangChain还提供了特定用例的链（Chains），可以将这些组件以特定方式组装在一起，以最好地完成特定用例。

也许这么讲，你可能一脸懵逼，这到底是个啥玩意，不急，下面就代理领略一下LangChain的风采。

要安装LangChain，您可以使用以下命令：

或者

安装完成后，您可能需要集成一个或多个模型提供商、数据存储、API等。例如，如果您要使用OpenAI的API，您需要先安装它们的SDK：

然后，您需要在终端中设置环境变量：

或者，您可以在Jupyter笔记本（或Python脚本）中执行此操作：

但是，我更加建议你下载这个仓库：

玩了之后，你可以在这个仓库中找到 .env文件，然后再里面配置你的OPENAI_API_KEY，是一样的道理。

在vscode上可以使用交互式的方式来一行一行的执行Python代码，快捷键shift+enter ，非常方便，当执行

就代表环境变量已经加载好了。

写一首诗试试，看起来很轻松，和调用openAI的api没啥区别呀，没看到神奇的地方啊，别着急，继续往下看。

我们可以使用Prompt Templates来管理LLM的提示。例如，您可以定义一个prompt模板，然后使用.format方法对其进行格式化：

此外，我们还可以使用链（Chains）将多个组件组合在一起，创建一个单一或者连贯的应用程序。例如，创建一个简单的链，它将用户输入格式化为prompt，然后将其发送到LLM：

早学早致富，LangChain是几分钟搭建一个基

这样，一个取名器就完成了，这就是一个小应用，你可以把他封装为一个微服务，提供给其他模块调用。

在LangChain中，我们可以创建一个链，它接受用户输入，使用它格式化提示，然后将其发送到LLM。例如，可以使用LLMChain，它结合了PromptTemplate和LLM。PromptTemplate可用于通过获取用户输入并构造提示来管理LLM的提示。

找到感觉了吗，是不是有点AgentGpt的味道了，LangChain提供额很多tools，不仅仅可以从维基百科查找，还可以通过google搜索，必应，都可以，这意味着，ChatGPT不限于他训练的知识，你可能很好奇，这个是如何实现的，其是实现原理也很简单。

1、通过你的prompt来调用openAI，分解出执行你这个目标所需要的步骤。

2、openAI推理出那些目标需要调用哪个tool，例如，我们demo中的“中国有多少所大学”这个需要分配到维基百科这个tool，而拿到的数据进行计算就交给llm-math这个tool。

3、链式执行的结果输出。

如果你理解了这个例子，下面基于文档，视频的内容问答，基本上也是这个原理，注意看：

这里只给出一个基于YouTube视频的问答的demo，实际上基于文档的问答原理类似：

1、YouTube流里面解析出文本字幕，内容，保存为doc

2、使用text_splitter进行分割，因为openAI模型有token数限制，所以要分割

3、使用OpenAIEmbeddings进行embeddings操作。

4、基于用户的输入进行一个db.similarity_search，找到最接近的4个小docs，应该在token范围内（3.5是4096）。

5、然后通过chain = LLMChain(llm=llm, prompt=prompt) 这个chain来调用，chain.run(question=query, docs=docs_page_content)，这里PromptTemplate威力体现出来了，这样，我们就可以基于每个query调出最相似的内容，然后在一起交给openAI提问了。

这个可以说是前端开发的福音，但是有能力，建议还是Python版本的，工具链会齐全不少。

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行