分享好友 最新动态首页 最新动态分类 切换频道
百度推新款语音识别模型,准确率飙升30%,还有三款AI语音芯片模组
2024-12-26 13:43

智东西(公众号:zhidxcom)
文 | Lina

智东西11月28日消息,在百度大脑开放日上,百度语音首席架构师贾磊推出了一款新的语音识别模型——全名叫“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,它与业内几乎所有语音识别方案都不一样,打破了传统远场语音识别技术的流程,能够将语音识别准确率提高30%以上。

在采访中,贾磊告诉智东西,这款语音识别模型是百度前后历时近一年打造的。在三年之内,随着这一技术的不断发展成熟,远场语音识别的准确率将能达到近场语音交互的水平,未来远场语音交互将会是主流。

百度AI技术生态部总经理喻友平则推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,以及基于智能家居、智能车载、智能IoT设备这三大场景的行业解决方案人,让智能硬件厂家更好、更快地集成AI语音能力。

百度CTO王海峰在还开场致辞中表示,目前,百度语音技术平台每天调用量已经超过了100亿次。

贾磊表示,传统远场语音交互技术,首先要对声音进行数字信号处理(信号增强、波束生成等),接着再对其进行语音识别,涉及数字信号处理和语音识别这两大学科。

而今天百度推出的基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型则是一款几近颠覆式的新模式,它打破了上述传统流程,以一套深度学习模型代替整个流程。

这套模型能够直接输入多路麦克风信号,输出目标语音文字,参数调整只有字准确率这唯一的优化目标,不需要任何声学先验知识。

贾磊说,目前除了谷歌之外,业内所有主要玩家的语音交互都采用都是传统的方式。但是随着识别率到达一定阶段,传统远场语音识别的准确率很难再进一步提高。

百度的这款新模型搭配百度鸿鹄语音芯片,能够将语音识别准确率提高30%以上。

在采访中,贾磊告诉智东西,即便设备没有搭载鸿鹄芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音识别、首次唤醒准确率大幅提升。

贾磊说,深度学习的下一步方向就是这种跨领域融合的技术,目前深度学习的端到端、跨学科整合方面正在快速发展,不断对已有学科进行着颠覆。

喻友平则在现场推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,为智能硬件厂家提供软硬一体的解决方案,让智能产品更好、更快地集成远场语音交互能力。

喻友平说,百度大脑开放平台目前是国内服务规模最大的AI开放平台,当前,其开发者群体超过150万(主要是企业开发者)、有228项开放的技术能力、能够在24小时内快速集成。

而对于智能硬件来说,加入语音交互能力有三大主要难点:

1)唤醒、降噪、识别的语音算法要求高;

2)软硬件适配复杂、周期长;

3)硬件选型难;

而百度今天推出的三款硬件模组和三大行业解决方案正是为了解决这些问题所打造的。

百度CTO王海峰在开场致辞中表示,目前百度大脑已经开放了200多项能力,语音能力是其中的重要方面。

百度从2010年开始进军AI语音技术,2010年初开始全面布局人工智能技术,2011年下半年开始研究深度学习,2012年初正式立项研究开发基于深度学习的语音技术。

王海峰表示,人工智能是用电脑计算机模拟人的能力,人类在自然环境中不断进化,人工智能也在应用场景中不断进化。

当前,算力高速发展、算法持续提升、数据不断积累,从而推动AI技术不断进化。

同时王海峰还表示,目前,百度语音技术平台每天调用量已经超过了100亿。

除此之外,来自创维、瓴岳、子杰宝贝、华智水稻、善行智能的百度合作伙伴也分别介绍了百度AI技术落地在家电、金融、护理、农业、智能眼镜等方面的落地。

创维AIoT研究院产品经理李凯表示,从2017年开始,创维就和百度进行了深度合作。创维集团AIoT研究院成立于2018年,专注于AIoT相关技术的研发与合作落地。

李凯告诉智东西,目前创维的“Swaiot小维智联”AI系统的设备部署量已经突破了千万台。创维电视目前也正在推进与百度鸿鹄语音芯片的合作落地。

最新文章
2025历史文献学专业考研难度排名
在选择研究生院校时,历史文献学研究生院校排名是一个重要的参考因素。对于希望深入研究历史文献的学生来说,了解各大院校的排名和特点,可以帮助你做出更明智的选择。在这篇文章中,我们将探讨一些知名院校的优势,以及如何根据自己的需求
2022免费手机单机游戏大全 免费手机单机游戏排行榜
最近有不少热门单机游戏上线,下面就给大家带来2022免费手机单机游戏大全,以及免费手机单机游戏排行榜。这些游戏不仅可玩性极高,而且也是不要大家氪金的,小伙伴们快来试试吧。1、《小小梦魇》这款游戏上线的时候可是受到很多玩家喜爱,
2024年搜狗下载安装全流程详解:快速上手小技巧汇总
简介:在当今信息爆炸的时代,搜索引擎已成为我们获取信息的重要工具。作为国内领先的搜索引擎之一,搜狗凭借其丰富的资源和先进的技术,为用户提供了优质的信息检索服务。本篇文章将为您详细介绍2024年最新的搜狗下载安装全流程,并提供一
10 个最佳 AI 图形设计工具
由于人工智能(AI)前所未有的影响力,数字设计领域正在经历一场剧变。 人工智能图形设计工具正在重构艺术家和设计师表达创造力的方式,使他们能够在更短的时间内制作出更独特的设计。 让我们浏览一下十大人工智能图形设计工具,它们能帮助
AI绘画神器:快速生成超逼真美女写真教程与评测
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在当今科技快速发展的时代,AI绘画生成工具正在悄然改变我们的创作方式。随着AI技术的不断进
2024年四川希望汽车职业学院在黑龙江招生计划表:招生专业、招生人数
2024年四川希望汽车职业学院在黑龙江招生吗?今年四川希望汽车职业学院在黑龙江招生专业有哪些?每个专业计划招生人数是多少?以下为赶考猫整理的四川希望汽车职业学院各专业2024年在黑龙江招生计划表,欢迎参考!2024年四川希望汽车职业学
3D周五连号走势图近100期带连线
功能类福彩3D显示遗漏:显示/隐藏遗漏值,遗漏值是指自上期开出到本期间隔的期数。福彩3D遗漏分层:是将当前遗漏值用柱状图形标注。福彩3D分段线:是每五期使用分隔线,使横向导航更加清晰。福彩3D显示断区:在分区走势中使用,将开出0个号
2024年必备:6个免费高清PPT模板平台推荐,让你的演示更出色!
3. SLIDEGO:高质量模板层出不穷SLIDEGO提供了多种高质量的Google幻灯片及PowerPoint模板,涵盖教育、商务、医疗等多个领域。这个平台的另一个亮点是集成了AI工具,用户可以快速生成精美的演示文稿。其分类清晰明了,用户可以根据需求快速
(第一财经)到百度首页
​​到百度首页(溦:9369400)服务到位让您的 柜焕然一新,尽享无忧生活。我们深知您的 对您意义非凡,因此,我们提供全方位的,让您的 柜电器在使用中也能享受如家的呵护:SFVGHTRWD妨诱黄豆就到百度首页(溦:9369400)确实是有挂的,很
#### 1. 数据分析与灵感捕捉
在数字时代的浪潮中,人工智能()不仅改变了咱们的生活办法,还渗透进了创意领域。想象一下,要是可以辅助我们创作搞笑剧本及台词,那将是多么令人兴奋的事情!它能够打破传统创作模式的局限,激发出前所未有的幽默火花。本文将深入探讨怎
相关文章
推荐文章
发表评论
0评