基于百度AI开放平台的人脸识别及语音合成

日期：2024-12-26 作者：hongfamaoyi2010 移动：http://oml01z.riyuangf.com/mobile/quote/35414.html

（1）人脸识别
在Web界面上传人的照片，后台使用Java技术接收图片，然后对图片进行解码，调用云平台接口识别人脸特征，接收平台返回的人员年龄、性别、颜值等信息，将信息返回到Web界面进行显示。
（2）人脸比对
在Web界面上传两张人的照片，后台使用Java技术接收图片，然后对图片进行解码，调用云平台接口比对照片信息，返回相似度。
（3）语音识别
在Web页面上传语音文件，判断语音文件格式，如果不是wav格式进行转码处理，然后调用平台接口进行识别，最后将识别的文本内容返回到Web界面进行显示。
（4）语音合成
在Web界面上传文本内容和语音类型，后台接收文本内容和语音类型后，调用平台接口生成语音数据，最后将数据转码成mp3格式文件，Web界面可以下载到本地。

课题基于客户端—服务端-平台端构架，客户端主要实现功能界面展示、数据上传和处理结果展示；服务器端接收客户端数据、数据转码处理、平台接口调用、请求结果相应；平台端介绍服务端数据、人脸识别、人脸比对、语音识别、语音合成等。

数据交互类型：JSON
请求数据：请求数据除了请求参数以外，还需另外发送以下参数：(否则会返回403状态码)

返回参数：
Mp3音频格式文件

 请求体格式化：Content-Type为application/json，通过json格式化请求体。
 Base64编码：请求的图片需经过Base64编码，图片的base64编码指将图片数据编码成一串字符串，使用该字符串代替图像地址。您可以首先得到图片的二进制，然后用Base64格式编码即可。需要注意的是，图片的base64编码是不包含图片头的，如data:image/jpg;base64,
 图片格式：现支持PNG、JPG、JPEG、BMP，不支持GIF图片

源码下载地址：https://github.com/jcdjor/AIProject

PS：欢迎大家给予评论、建议和下载学习，下面为源码的一些说明

AIProject.zip 为后端代码，为eclipse项目，app.properties文件需要自己配置百度云开发平台的AppID、APIKey、SecretKey。

Web.zip 为前端代码，前后端分离，可直接运行使用。

运行环境，对版本没太大要求，但jdk和tomcat要对应 JDK：我使用的版本为JDK1.8，官方下载地址
Tomcat：，我使用的版本为tomcat 9，官方下载地址；

注意需要百度云开放平台的AppID、APIKey、SecretKey，百度云AI开放平台：http://ai.baidu.com/

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行