分享好友 最新动态首页 最新动态分类 切换频道
AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具
2024-12-26 08:31

今天我们来讲讲目前非常火的人工智能话题“AIGC”,以及怎么使用目前的AI技术来开发,构建自己的AIGC工具
什么是AIGC
AIGC它的英文全称为(Artificial Intelligence Generated Content),中文翻译过来就是“人工智能生成内容”,就是利用人工智能技术来创建文本、图像、音乐、视频或者其他的媒体内容的过程。这种技术的应用目前正在迅速扩展,因为它可以大大提高内容创建的效率,同时降低成本、除了降低成本之外。在某些情况下,它提供与人类创作者相媲美,甚至超越的作品。
AIGC的技术背景
AIGC它依赖于各种人工智能模型,特别是深度学习技术,如生成对抗网络(GANs,以及变分自编码器(VAEs)用于图像,以及自然语言处理(NLP)模型,如GPT(Generative Pre-trained Transformer)系列用于文本生成,这些技术通过学习大量数据中的模式,来生成全新的内容。

AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具

文本生成工具
OpenAI的ChatGPT: 基于GPT(生成预训练变换器)模型,能够生成连贯、有逻辑的文本,适用于对话、文本创作等多种场景。
Google Bard: Google推出的对话型AI,旨在提供信息、娱乐以及创作帮助。

图像生成工具
OpenAI的DALL·E: 能够根据文本提示生成高质量、创意丰富的图像。
Midjourney: 是一个独立的研究实验室和社区,专注于使用AI生成图像。
Stable Diffusion: 一个开源的图像生成模型,支持个人和商业用途,能够根据文本提示生成图像。

音乐和声音生成工具
OpenAI的Jukebox: 能够生成音乐,包括旋律、节奏、和声,甚至可以模仿特定艺术家的风格。
Descript’s Overdub: 允许用户根据文本生成声音,可以用于语音编辑和生成。

视频生成工具
Runway: 提供了一个机器学习工具套件,允许用户创建、修改和生成视频内容。
Synthesia: 通过AI为企业和个人提供视频内容创作服务,特别是能够生成虚拟演讲者和自动化视频。

编程和代码生成工具
GitHub Copilot: 由OpenAI训练,能够根据现有代码和注释提示生成编程代码,支持多种编程语言。
深度伪造和合成媒体
Deepfakes: 软件和技术,能够在视频和音频文件中合成人类的面部和声音,通常用于娱乐、教育或创建虚假信息。

了解这些感念和专业技术词汇,以及这些AI工具之后,唯独没有国内的AIGC工具代表作品,果然搞技术的还得是人家外国佬厉害呀!既然没有国产的,那作为一个技术渣渣,那对不起了,我们就基于他们的基础上去搭建一个吧,这里演示怎么基于OpenAI的API接口去搭建一个我们自己的AIGC工具。

 

(1)、教程点击这里,获取服务器地址
https://bwh88.net/aff.php?aff=74320

(2)ssh客户端finalshell工具下载地址
Windows X64版,下载地址
http://www.hostbuf.com/downloads/finalshell_windows_x64.exe
macOS Arm版,支持m1,m2,m3 cpu,下载地址
http://www.hostbuf.com/downloads/finalshell_macos_arm64.pkg
macOS X64版,支持旧款intel cpu,下载地址:
http://www.hostbuf.com/downloads/finalshell_macos_x64.pkg
Linux X64版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_x64.deb
Linux Arm64版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_arm64.deb
Linux LoongArch64龙芯版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_loong64.deb
选择对应系统版本的下载安装即可。

  1. 获取服务器端openai的API 对接服务代码。进入到home目录并运行如下指令:

 
 
  1. 然后cd 进入工程目录openai_project,并运行app_install.sh脚本安装服务器程序。命令如下
 
 

【脚本参数说明】

 

如果你 开通了gpt4,gpt版本可以填写最新的gpt-4,绘画模型版本填写最新的:dall-e-3,如果你没有开通gpt4默认填写gpt-3.5-turbo和dall-e-2即可。
openai的api key获取

这个客户端仅仅是本人为了调试功能测试用,其他做得不好的地方大家不要太在意,界面有点丑陋大家可以忽略,主要看功能即可。如各位大佬有兴趣,可以自己开发一个好看的客户端,这个客户端的代码我双手奉上,还望各位能够进一步开发完善,发扬光大,哈哈
代码下载地址

 
  1. 下载GPT客户端工具,下载连接如下
    git下载地址
 
 

或者网盘下载
链接:https://pan.baidu.com/s/1HCdCHuSqhX9dSrRzt8ik4g?pwd=3lm4
提取码:3lm4

2.减压GPT客户端工具,如下

  1. 调用openai的dall-e-3进行绘画,在输入框输入提示词,点击发送即可绘画,例如

3.语音输入,即就是有的时候你不方便打字,你可输入语音,然后ai会以文字的方式回答你,并显示在对话框上。这个功能和语音对话相似,自行体验即可。

4.图片解析,这个就是你点击这个按钮上传一张图片,然后AI会解读你的图片内容,然后将AI 解读的内容返回到对话框,这个功能适用于名画鉴赏的。

  1. 图片播放,这个功能就我自己diy的,因为目前的sora很火,然后openai又还没有发布视频生成的API接口,所以我突发奇想,让AI画几十张连续的画,然后我把这些画放到一个文件夹里,然后以每秒25帧的速度播放这些图片,这不就可以生成视频了吗?但是结果没我想的那么好,最后还是等视频生成的API 接口发布了再做视频生成功能吧

    播放效果:https://live.csdn.net/v/373939
最新文章
百度秒收的网站★发帖网站收录好/排名好★高权重论坛
下一篇文章内容预览:SEO或者站长都知道软文营销技巧,发布软文信息的作用很重要。软文有助于吸引潜在用户,吸引用户增加网站流量,增加流量提高网站收录,提高收录提高网站排名。那么发布软文有哪些注意事项呢?这是我们每个人都值得思考
高考精选|河北省唐山市路南区哪家高中补习班值得信赖名单公布
锐思教育就比较好,在学生的辅导上,有自己更科学系统的方法,有助于更快地提升学生的学习成绩,让孩子在短时间内,掌握重要知识柳。锐思教育的老师,都非常的专业,在给孩子授课的过程中,会结合孩子目前的实际情况,对孩子进行有针对性的
近日,中央纪委国家监委印发《关于贯彻落实习近平总书记重要批示精神 加强监督执纪坚决制止餐饮浪费行为的工作意见》,要求各级纪检监察机关把监督节约粮食、坚决制止餐饮浪费作为一项重要任务,立足职能职责精准监
  一粥一饭,当思来之不易。8月11日 ,习近平总书记作出重要指示强调,坚决制止餐饮浪费行为 ,切实培养节约习惯,在全社会营造浪费可耻、节约为荣的氛围。习近平总书记的重要指示在兵团广大干部群众中引起强烈反响 。各师市职工群众、餐
鹰潭百度推广优化服务,助您企业高效曝光,领先市场一步
鹰潭百度推广优化电话,专业提升企业网络曝光,助您抢占市场先机,增强竞争力。快速响应,精准定位,优化服务,让您的品牌在互联网时代熠熠生辉。随着互联网的快速发展,越来越多的企业开始重视网络营销,而百度作为我国最大的搜索引擎,拥
原创行业第一 | 盈峰环境第 9000 台新能源环卫装备成功下线!
在绿色发展蔚然成风,可持续发展成为共识的今天,盈峰环境正以坚实步伐践行绿色使命,引领行业迈向新高度。12月11日,盈峰环境迎来了历史性的里程碑时刻——第 9000 台新能源环卫装备成功下线暨河北保定301台氢能源环卫车正式发车!这不仅
高清美女写真生成神器:如何用AI轻松打造你的虚拟女友?
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个数字化迅猛发展的时代,许多人开始借助人工智能打造属于自己的美好幻想。你是否曾经想
诈骗手段!AssistantAPP不靠谱不可信!网约受骗不能提现真相!!
AssistantAPP不靠谱不可信!网约受骗不能提现真相!!技术出嘿《溦:9836356》(一)希望阅读此文的读者能够及时采取措施以减少损失;请及时与团队联系提供解决方案(文章下面图片有咨询方式)若想追回损失资产,务必仔细阅读以下内容。【JFHHERY
“免费搜”的百度,到底靠什么盈利?
图文编辑:邓志文图文来源:网络
超真实美女写真生成神器:AI工具评测与使用技巧全攻略!
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个数字化快速发展的时代,科技的进步让我们能够用更简单便捷的方式获取美好而又真实的艺
博世BOSCH会议代表话筒会议话筒DCN-DL-CN
企业类型有限责任公司(自然人投资或控股)统一社会信用代码9111010857523377X8成立日期2011-04-19法定代表人/负责人孙灵尔注册资本500万(元)注册地址北京市房山区良乡凯旋大街建设路18号-D3128营业期限2011-04-19 至 2031-04-18登记机关北京
相关文章
推荐文章
发表评论
0评