智能写作-随着人工智能写作的发展,智能语音交互技术也将迎来爆发!
编辑:pitaya02 日期:2020-11-26
据估计,到2020年,全球语音市场规模将达191.7亿美元。作为人工智能研究方向之一的语音识别,随着语音交互技术的发展,出现了语音 AI芯片。如今,无论是互联网巨头,还是 AI初创企业,都纷纷宣布要进军芯片领域。火龙果智能校对
回顾国内车载语音市场,2013年才能算是真正开始发展。此前,车内语音部分使用最多的也就是收听音乐和广播,车内语音虽已出现,但系统仍处于起步阶段,准确率不高,市场普及率极低。火龙果智能校对
2013是个转折点,行业开始发生变化,更多的人开始关注发展的车载语音市场。在2015年后重点关注云方向,与智能汽车、车联网的发展方向相关,产品形态越来越标准化。
随着人工智能领域的不断发展,2016年,许多公司加大了在智能语音领域的投入,尤其是语音芯片的研发。这一年更是语音芯片“爆发”的一年,而且在此后的几年里,语音芯片将继续成为热点。火龙果智能校对
多种场景,低功率
各种语音技术公司在研发语音芯片时所考虑的因素可能都不同,大体上有几个原因。
第一个需要快速集成和低功耗。话音芯片可以更好地整合本地功能,同时由于目前深度学习领域的计算量大、终端设备对功耗的要求高,低功耗芯片成为市场需求。
第二, IoT时代对场景多样化的需求。在物联网场景中,设备形态的多样化,需要一种硬件载体,成本低,运算能力强,同时能够承载多种终端设备,芯片在这一过程中扮演了核心角色。
也有获利的目的。所有的语音技术公司,推出产品或技术,以及软件或硬件的整合方案,最终都会获得利润。开发语音芯片也不例外,现在正是物联网时代推动产品落地的时机,增加硬件功能后的产品将带来更高的市场收益。火龙果智能校对
从 IOT到车载的语音芯片
前不久,云知声、思必驰、外问等语音技术公司纷纷推出了 AI芯片项目。
五月十六日,云知声发布了面向物联网领域的第一款 AI芯片 UniOne,同时,亿咖通与云知声签署战略合作协议,携手打造基于 UniOne芯片的汽车级 AI芯片,该芯片可为用户与汽车之间的智能语音交互提供更深层的能力。
五月二十四日, SundayYahoo发布了国内第一款已经量产的 AI语音芯片模块 MobvoiA1,该模块可以帮助传统家电厂商实现远距离语音交互功能,随后将与创维和微鲸电视实现合作落地。
六月二十六日,智能语音技术公司思必驰宣布它已经完成了新一轮融资,并宣布它已经和一家芯片巨头就 AI芯片达成了合作,双方将建立合资企业,而且用于智能语音交互的 AI芯片已经进入研发阶段。火龙果语法检查
尽管语音技术公司相继宣布自己在研发语音芯片,高工智能汽车咨询了多家语音技术公司及主机厂,了解到目前还没有专门针对车载领域的语音芯片。火龙果语法检查
5月16日发布的这款芯片是 UniOne系列芯片中的第一款,从语音 AI切入,芯片名为“雨燕”,主要面向 IoT领域,适用于智能家电、智能车载等多种人机交互场景。现正积极推进车规级芯片设计,预计将于明年推出符合标准的雨燕系列产品。
另外一个语音公司思必驰宣布研发 AI芯片,也不是专为车载领域开发的语音芯片,预计下半年会进行流片;出门问问推出的“问芯” MobvoiA1是语音芯片模块,即语音模块与芯片的结合,首先在智能家居领域,也不是车载领域。火龙果语法检查
目前市场上推出的“语音芯片”,可称之为传统芯片的“智能”,它将芯片与语音技术相融合,与语音技术相独立,语音与芯片相融合,两者相结合,若芯片与语音技术相匹配,不仅解决了兼容问题,而且达到了降低功耗的目的。火龙果语法检查
汽车级语音芯片是市场需求
车辆领域的语音芯片必须先满足车规的技术要求,经过温度、稳定性等测试后才能进入车内,研制能够通过车规的语音芯片仍有困难。
在技术方面,芯片的开发本身是有一定难度的。将软件与芯片相结合,其实就是将交互的东西放到硬件载体上,进行配比与兼容是很困难的,还要做到快速识别,不同 CPU适配,最后实现量产,都需要强有力的技术支持。
尽管目前在车载领域缺乏语音芯片,但随着汽车智能化和车载语音交互技术的发展,未来汽车级别的语音芯片将成为市场需求。
负责吉利汽车 HMI的相关人士表示,目前车载语音控制能力远远不够,对于目前已上市车型来说,在线语音控制识别速度缓慢,而本地词库较少,在自然语音状态下,语音内容与词库不匹配,将导致无法识别或识别错误。火龙果语法检查
而且目前市场上推出的“云+端+芯片”或“云端芯”集成芯片,优化了网络识别能力,但局部识别能力依然较差,识别速度慢,用户难以接受。
话音芯片需要改进局部识别能力,但未来随着网络传输速度的提高,应该可以开发出把局部识别和在线识别相结合的话音芯片。火龙果语法检查
据亿咖通相关人士介绍,随着车联网、人工智能的发展,车载芯片的性能远远不能满足汽车娱乐和多种交互功能的需要。话音作为车载系统的刚需和亮点,更需要一个硬件加速能力强、适应性强的平台,汽车级智能话音芯片将是大势所趋。
如何提高反应速度和识别率
近日,首款搭载“祺云概念”智联系统的中期改款传祺GS4搭载了智能语音控制系统,用户发出语音指令后,系统可在1.2秒内迅速响应。官员称,速度和灵敏度远远超过同类产品。
传祺智能语音控制系统可以实现95%的正确识别率,并在正常环境下具有多言普通话的识别能力,具有离线语音识别能力,可训练汽车麦克风阵列降噪能力,可打断语音技术,可见可说,自定义语音唤醒等多个核心技术能力。
对于传祺GS4的智能语音控制系统这一大卖点,业内人士表示:“最优工作状态下的网速、使用环境、车机 CPU、内存等,达到1.2 S响应,95%识别率并不难。
但在实际应用中,车辆噪声、网速波动、车后部多进程、占用硬件资源、第三方执行设备延迟等都会引起语音控制系统的延迟。
“影响语音识别响应时间的因素有:音频后端检测,网络传输,引擎处理,以及应用处理,”科大讯飞相关人士表示。
对语音响应速度影响最大的是音频后端点检测,它是不可减的,使用时间最长。一个语音指令完成后,系统需要800ms-1000ms的静音段来确定演讲是否结束,缩短这个时间,就会带来体验的下降。举例来说,用户说话暂停,系统误以为用户已经说完了,导致错误的识别结果。
发动机、主机硬件配置低或其他进程占用 CPU、内存等硬件资源,造成语音处理进程系统资源不足,造成处理延迟。
这两个方案可以有效地解决问题,但是升级硬件配置会增加成本,因此主机厂更倾向于优化引擎算法,在低成本的硬件平台上实现高效的语音系统应用。
慢且不稳定的网络也是造成语音识别延迟的一个重要因素。提高网络传输速率,比如未来5 g通信,也能有效降低延迟。
此外,优化源(地图、音乐、电台等)和第三方执行设备(开内灯、天窗、座椅加热等)也可以减少语音控制系统的延迟,提高用户体验。
话音控制、触屏、机械按键等等都属于控制层,最后由信源和第三方执行装置做出反馈。若电源和第三方执行设备运行缓慢,也会影响用户使用语音控制系统的体验。
现在,车载领域已量产的语音产品,大部分响应时间在1.5-3 s之间,当响应时间超过2 s,用户就能感觉到明显的延迟。火龙果语法检查
降低 NVH能提高识别效果
识别率是用户体验的关键,识别率太低,不准确,用户就像在对牛弹琴,不但不能体现语音控制系统的便利性,反而成了一个鸡肋配置。
主机厂相关人士表示:“提高语音识别率除了技术方面外,降低汽车 NVH也是一条重要途径。
汽车行驶时,外部环境噪声、发动机振动噪声、胎噪、风噪、车身共振等都会影响语音指令识别率,因此,除了不断优化语音指令识别,降低汽车 NVH也是提高语音识别率和用户体验的方法之一。
火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。火龙果错别字检查
火龙果智能写作官网https://www.mypitaya.com
积极拥抱变化,才能更好的应对这个时代