分享好友 最新动态首页 最新动态分类 切换频道
100行代码实现私人定制多模态RAG机器人
2024-12-27 02:20

报告日期:2024年8月18日

100行代码实现私人定制多模态RAG机器人

项目负责人:Bilyc(WsWs

该项目旨在构建多模态智能体对话机器人,以txt 文本为RAG知识库并结合图片识别功能。选用 Nvidia NIM 平台的相关模型,进行数据构建和向量化处理。通过环境搭建和代码实现,具备一定的可操作性。应用场景广泛,包括客户服务、教育培训、金融服务等多个领域。其亮点在于采用先进模型,能提供全新互动体验,且数据处理和功能整合较为有效。

模型选择: 选择微软的phi-3-small-128k-instruct和ai-phi-3-vision-128k-instruct模型,分别实现txt文档和png、jpg、jpeg图像的智能回答和识别。

Phi-3-Small-128k-Instruct 模型占用资源相对较少,便于部署和应用在资源有限的环境中,同时仍能提供较为准确和有用的指令响应。它在处理常见任务时能够保持高效和可靠。 AI-Phi-3-Vision-128k-Instruct 模型则在视觉相关的指令处理上表现出色。能够理解和处理图像相关的指令,为涉及图像分析、识别和理解的任务提供有力支持。这两个模型都具有长上下文处理能力,能更好地理解复杂的任务和指令,为用户提供更全面和准确的服务。

1.数据构建过程

首先,收集txt电子书和图片。当选择txt电子书后,Phi-3-Small-128k-Instruct 模型会对文本进行预处理,建立本地Faiss vector向量数据库。而图片则直接喂给模型分析。

2.向量化处理方法及其优势。

向量化模型选用ai-embed-qa-4。对 txt 文档进行向量化。该模型会对文档中的文本进行深度分析和编码。它会将文本分解为单词、短语或更细粒度的语言单元,并通过其内部的神经网络架构将这些单元转换为数值向量。

采用gradio框架和Nvidia的NIM服务,将两个模型整合成一个多模态的智能机器人,并实现网页可视化应用。

1. 创建Python环境

首先需要安装Miniconda

大家可以根据自己的网络情况从下面的地址下载

miniconda官网地址:https://docs.conda.io/en/latest/miniconda.html

清华大学镜像地址: Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

安装完之后,打开Anaconda Powershell:

在打开的终端中按照下面的步骤执行,配置环境:

创建python 3.8虚拟环境

 

进入虚拟环境

 

安装nvidia_ai_endpoint工具

 

安装Jupyter Lab

 

安装langchain_core

 

安装langchain和langchain_community

 
 

安装matplotlib

 

安装Numpy

 

安装faiss

 

安装OPENAI库

 

2.Macbook 环境

Macbook也可以按照上面的步骤同样执行, 只是在下载Miniconda的时候要下载Mac OS版本的

直接上干货仅,有100行左右。

 
 
 

客户服务与支持、教育培训领域、金融服务行业、医疗健康领域、企业内部应用、政务服务领域、媒体与新闻行业、旅游与出行领域等。

1.首先看图片的识别效果。

2.再看一看RAG文本的实现效果

本文旨在构建一个以txt文本为知识库和图片识别相结合的多模态智能体对话机器人,为读者提供全新互动体验。 选择Nvidia NIM平台的(phi-3-small-128k-instruct 和 ai-phi-3-vision-128k-instruct)模型,并采用了有效的数据构建和向量化处理方法。 详细介绍了环境搭建和代码实现,具有可操作性。总体而言,该项目具有一定的创新性和实用性,但在性能评估和未来规划方面还有待进一步完善。读者可在此基础上进行改进完善。

该项目未来可朝着以下方向发展:一是优化模型性能,提高对文本和图像的理解与分析能力,提升回答的准确性和全面性;二是拓展应用场景,深入挖掘更多领域的需求,为用户提供更广泛的服务;三是加强与其他技术的融合,如与物联网、大数据等结合,实现更智能的交互;四是持续改进用户体验,根据用户反馈不断优化界面和交互方式;五是探索商业化应用,为企业和个人带来实际价值。

1. https://python.langchain.com/v0.1/docs/integrations/chat/nvidia_ai_endpoints/

2. NVIDIA NIM页面: https://build.nvidia.com/explore/discover

3. NVIDIA DLI课程学习资料页面:https://www.nvidia.cn/training/online/

最新文章
直通车推广怎么收费,直通车推广的扣费规则
随着电商行业的飞速发展,越来越多的商家开始在各大电商平台上开设店铺,想要在竞争激烈的市场中脱颖而出,简单依靠自然流量已经远远不够。因此,许多卖家会选择使用推广工具来增加店铺的曝光率和转化率,而在淘宝平台上,直通车无疑是最为
聊城大学建筑工程学院2024年硕士研究生复试录取工作方案
根据《教育部关于印发〈2024年全国硕士研究生招生工作管理规定〉的通知》(教学[2023]2号)和《聊城大学2024年硕士研究生复试录取工作方案》的相关要求,结合学院实际,现将我院2024年硕士研究生招生考试复试相关工作安排如下:一、组织领
粉丝必看!如何设计一个吸睛的Logo?AI免费神器让你的专业形象更出众
还在找人花钱做logo设计?当然这里申明下,小编还是建议大家尊重设计劳动力尽量选择付费不过小编就是喜欢免费的,今天就给大家带来一个免费在线生成LOGO的工具。工具名称:搜狐简单AI工具地址https://ai.sohu.com/pc/generate/textToImg?030
浙马纪录挑战赛 |2024第五届浙马纪录挑战赛竞赛规程!
2024第五届浙马纪录挑战赛竞赛规程一、组织单位主办单位:临平区人民政府、浙江省马拉松及路跑协会 承办单位:临平区文化和广电旅游体育局、杭州雁渡寒潭体育运动俱乐部 协办单位:浙江黄龙体育文化培训有限公司、杭州电视台青少•体育频道
利用YouTube玩转独立站营销和SEO
YouTube是世界最大的社交平台之一,也是世界第二大的搜索引擎和世界最大的视频网站。虽然网络上能找到很多关于优化YouTube视频创作和频道运营的教程,但是如何利用YouTube来使您的网站实际受益呢?以下8点建议将会帮助你! 接下来,我们会
选品时如何评估竞争热度:搜索量多少算是竞争不激烈?
讲到选品时,我总是反复强调,除非你家大业大资金雄厚运营彪悍,否则,一定要选择偏冷门的产品。 那什么才算是偏冷门的产品呢? 为了让选品更有针对性、可量化,我专门给出建议:选择Best Seller日销量在50-150单的产品。 这样的产品,大卖
正则表达式(awk、sort 、uniq 、tr 工具)
awk 选项 ‘模式或条件{编辑命令}’ 文件1 文件2…. //过滤并输出文件中符合条件的内容 awk -f 脚本文件 文件1 文件2… //从脚本中调用的编辑指令,过滤并输出内容 awk包含几个特殊的内建变量(可直接用)如下所示࿱
限地区: Apple 苹果AI笔记本电脑 2023Mac mini迷你主机 M28G 256G (实测成都等地有效),2785.21元
新款 Mac mini 搭载 M2 和 M2 Pro 芯片,搭载 M2 芯片的机型:M2 芯片具有 4 个性能核心和 4 个能效核心,10 核图形处理器,16 核神经网络引擎,100GB/s 内存带宽;支持 H.264、HEVC、ProRes 和 ProRes RAW 硬件加速,带有视频解码引擎、视
苹果id贷怎么申请—100%下款+苹果回租id贷24小时
苹果id贷怎么申请—100%下款+苹果回租id贷24小时上汽集团等在嘉兴成立股权投资合伙企业,出资额3亿天眼查App显示,近日,嘉兴屹晨股权投资合伙企业(有限合伙)成立,执行事务合伙人为上海上汽恒旭投资管理有限公司,出资额约3亿人民币,经
【U90(Kiss初恋版)WiFi万能钥匙下载】天语U90 Kiss初恋版WiFi万能钥匙5.1.02免费下载
下载WiFi万能钥匙,认准官方正版!免费安全WiFi热点,无忧一键连接。日常任务随时做,轻松赚现金外快~【积分赚钱】完成简单日常任务,轻轻松松赚现金【安全免费】随时随地免费连接,畅享安全免费WiFi,节省流量快人一步!【权威认证】通过
相关文章
推荐文章
发表评论
0评