智能写作-随着人工智能写作的发展，智能语音交互技术也将迎来爆发！

编辑：pitaya02 日期：2020-11-26

据估计，到2020年，全球语音市场规模将达191.7亿美元。作为人工智能研究方向之一的语音识别，随着语音交互技术的发展，出现了语音 AI芯片。如今，无论是互联网巨头，还是 AI初创企业，都纷纷宣布要进军芯片领域。火龙果智能校对

回顾国内车载语音市场，2013年才能算是真正开始发展。此前，车内语音部分使用最多的也就是收听音乐和广播，车内语音虽已出现，但系统仍处于起步阶段，准确率不高，市场普及率极低。火龙果智能校对

2013是个转折点，行业开始发生变化，更多的人开始关注发展的车载语音市场。在2015年后重点关注云方向，与智能汽车、车联网的发展方向相关，产品形态越来越标准化。

随着人工智能领域的不断发展，2016年，许多公司加大了在智能语音领域的投入，尤其是语音芯片的研发。这一年更是语音芯片“爆发”的一年，而且在此后的几年里，语音芯片将继续成为热点。火龙果智能校对

多种场景，低功率

各种语音技术公司在研发语音芯片时所考虑的因素可能都不同，大体上有几个原因。

第一个需要快速集成和低功耗。话音芯片可以更好地整合本地功能，同时由于目前深度学习领域的计算量大、终端设备对功耗的要求高，低功耗芯片成为市场需求。

第二， IoT时代对场景多样化的需求。在物联网场景中，设备形态的多样化，需要一种硬件载体，成本低，运算能力强，同时能够承载多种终端设备，芯片在这一过程中扮演了核心角色。

也有获利的目的。所有的语音技术公司，推出产品或技术，以及软件或硬件的整合方案，最终都会获得利润。开发语音芯片也不例外，现在正是物联网时代推动产品落地的时机，增加硬件功能后的产品将带来更高的市场收益。火龙果智能校对

从 IOT到车载的语音芯片

前不久，云知声、思必驰、外问等语音技术公司纷纷推出了 AI芯片项目。

五月十六日，云知声发布了面向物联网领域的第一款 AI芯片 UniOne，同时，亿咖通与云知声签署战略合作协议，携手打造基于 UniOne芯片的汽车级 AI芯片，该芯片可为用户与汽车之间的智能语音交互提供更深层的能力。

五月二十四日， SundayYahoo发布了国内第一款已经量产的 AI语音芯片模块 MobvoiA1，该模块可以帮助传统家电厂商实现远距离语音交互功能，随后将与创维和微鲸电视实现合作落地。

六月二十六日，智能语音技术公司思必驰宣布它已经完成了新一轮融资，并宣布它已经和一家芯片巨头就 AI芯片达成了合作，双方将建立合资企业，而且用于智能语音交互的 AI芯片已经进入研发阶段。火龙果语法检查

尽管语音技术公司相继宣布自己在研发语音芯片，高工智能汽车咨询了多家语音技术公司及主机厂，了解到目前还没有专门针对车载领域的语音芯片。火龙果语法检查

5月16日发布的这款芯片是 UniOne系列芯片中的第一款，从语音 AI切入，芯片名为“雨燕”，主要面向 IoT领域，适用于智能家电、智能车载等多种人机交互场景。现正积极推进车规级芯片设计，预计将于明年推出符合标准的雨燕系列产品。

另外一个语音公司思必驰宣布研发 AI芯片，也不是专为车载领域开发的语音芯片，预计下半年会进行流片；出门问问推出的“问芯” MobvoiA1是语音芯片模块，即语音模块与芯片的结合，首先在智能家居领域，也不是车载领域。火龙果语法检查

目前市场上推出的“语音芯片”，可称之为传统芯片的“智能”，它将芯片与语音技术相融合，与语音技术相独立，语音与芯片相融合，两者相结合，若芯片与语音技术相匹配，不仅解决了兼容问题，而且达到了降低功耗的目的。火龙果语法检查

汽车级语音芯片是市场需求

车辆领域的语音芯片必须先满足车规的技术要求，经过温度、稳定性等测试后才能进入车内，研制能够通过车规的语音芯片仍有困难。

在技术方面，芯片的开发本身是有一定难度的。将软件与芯片相结合，其实就是将交互的东西放到硬件载体上，进行配比与兼容是很困难的，还要做到快速识别，不同 CPU适配，最后实现量产，都需要强有力的技术支持。

尽管目前在车载领域缺乏语音芯片，但随着汽车智能化和车载语音交互技术的发展，未来汽车级别的语音芯片将成为市场需求。

负责吉利汽车 HMI的相关人士表示，目前车载语音控制能力远远不够，对于目前已上市车型来说，在线语音控制识别速度缓慢，而本地词库较少，在自然语音状态下，语音内容与词库不匹配，将导致无法识别或识别错误。火龙果语法检查

而且目前市场上推出的“云+端+芯片”或“云端芯”集成芯片，优化了网络识别能力，但局部识别能力依然较差，识别速度慢，用户难以接受。

话音芯片需要改进局部识别能力，但未来随着网络传输速度的提高，应该可以开发出把局部识别和在线识别相结合的话音芯片。火龙果语法检查

据亿咖通相关人士介绍，随着车联网、人工智能的发展，车载芯片的性能远远不能满足汽车娱乐和多种交互功能的需要。话音作为车载系统的刚需和亮点，更需要一个硬件加速能力强、适应性强的平台，汽车级智能话音芯片将是大势所趋。

如何提高反应速度和识别率

近日，首款搭载“祺云概念”智联系统的中期改款传祺GS4搭载了智能语音控制系统，用户发出语音指令后，系统可在1.2秒内迅速响应。官员称，速度和灵敏度远远超过同类产品。

传祺智能语音控制系统可以实现95%的正确识别率，并在正常环境下具有多言普通话的识别能力，具有离线语音识别能力，可训练汽车麦克风阵列降噪能力，可打断语音技术，可见可说，自定义语音唤醒等多个核心技术能力。

对于传祺GS4的智能语音控制系统这一大卖点，业内人士表示：“最优工作状态下的网速、使用环境、车机 CPU、内存等，达到1.2 S响应，95%识别率并不难。

但在实际应用中，车辆噪声、网速波动、车后部多进程、占用硬件资源、第三方执行设备延迟等都会引起语音控制系统的延迟。

“影响语音识别响应时间的因素有：音频后端检测，网络传输，引擎处理，以及应用处理，”科大讯飞相关人士表示。

对语音响应速度影响最大的是音频后端点检测，它是不可减的，使用时间最长。一个语音指令完成后，系统需要800ms-1000ms的静音段来确定演讲是否结束，缩短这个时间，就会带来体验的下降。举例来说，用户说话暂停，系统误以为用户已经说完了，导致错误的识别结果。

发动机、主机硬件配置低或其他进程占用 CPU、内存等硬件资源，造成语音处理进程系统资源不足，造成处理延迟。

这两个方案可以有效地解决问题，但是升级硬件配置会增加成本，因此主机厂更倾向于优化引擎算法，在低成本的硬件平台上实现高效的语音系统应用。

慢且不稳定的网络也是造成语音识别延迟的一个重要因素。提高网络传输速率，比如未来5 g通信，也能有效降低延迟。

此外，优化源(地图、音乐、电台等)和第三方执行设备(开内灯、天窗、座椅加热等)也可以减少语音控制系统的延迟，提高用户体验。

话音控制、触屏、机械按键等等都属于控制层，最后由信源和第三方执行装置做出反馈。若电源和第三方执行设备运行缓慢，也会影响用户使用语音控制系统的体验。

现在，车载领域已量产的语音产品，大部分响应时间在1.5-3 s之间，当响应时间超过2 s，用户就能感觉到明显的延迟。火龙果语法检查

降低 NVH能提高识别效果

识别率是用户体验的关键，识别率太低，不准确，用户就像在对牛弹琴，不但不能体现语音控制系统的便利性，反而成了一个鸡肋配置。

主机厂相关人士表示：“提高语音识别率除了技术方面外，降低汽车 NVH也是一条重要途径。

汽车行驶时，外部环境噪声、发动机振动噪声、胎噪、风噪、车身共振等都会影响语音指令识别率，因此，除了不断优化语音指令识别，降低汽车 NVH也是提高语音识别率和用户体验的方法之一。

火龙果智能写作是全球第一款中英双语语法检查校对产品，运用火龙果智能写作技术进行错别字文本校对，除错别字校对以外，还可以对语法、标点等进行校对。火龙果错别字检查

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化，才能更好的应对这个时代

智能写作-围棋人机大战，人工智能轻松取胜