迄今为止,人类社会正处于人工智能发展的第三次浪潮,A.I.对于人类社会的影响已经越来越明显。在产业升级的道路上,A.I.无异于一柄利器。尤其是2019年科大讯飞推出的智能录音笔,直击传统录音笔“1小时录音数小时整合”的痛点,创新升级录音笔产品形态,A.I.转写给录音笔行业带来无限可能。
A.I.+录音笔引领行业迭代升级
传统录音笔功能单一,市面上的更新大部分都在外形、存储上做文章,甚至添加拍照等额外功能。但对于信息无法搜索、反复听效率低下等痛点却一直没有给到解决方案,直到科大讯飞推出的A.I.+录音笔。
A.I.赋能的讯飞智能录音笔,不仅解决了传统录音笔多场景/远距离拾音降噪效果不佳问题,同时还为录音转写文字提供了高效率的解决方案。讯飞智能录音笔打通了录音、转写、边录边译、重要内容标记、语音搜索、文件分享、后端编辑的记录全链路,成为市场上极具竞争实力的产品。
在录音笔的基础功能—拾音上,讯飞智能录音笔采用A.I.算法降噪,采用多麦克风阵列去混响和多麦克风波束形成提升信噪比(信噪比指一个电子设备或者电子系统中信号与噪声的比例,信噪比越高表明混在信号里的噪声越小,反之亦然)。
讯飞智能录音笔硬件上配备2+6麦克风阵列,同时利用具有自主知识产权的A.I.算法降噪,针对声源定位,采用自适应滤波的方法消除噪声,采用七大场景模式智能拾音。以远场演讲场景为例,讯飞智能录音笔会调用2个定向麦克风拾音,同时6个矩阵式麦克风识别周边及其他方向反射回来的噪声,通过算法进行比对消噪;而在会议模式下,2个定向麦克风将停止工作,6个矩阵麦克风对收集的信号进行加权算法,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的噪声,可以定向拾取与会者的发言,使得录制声音清晰准确。
高清降噪拾音功能为讯飞智能录音笔的转写文字打下了基础。讯飞智能录音笔采用基于深度全序列卷积神经网络的语音识别框架处理前端信号,从录音到文字的转写延时更少;智能转写引擎在转写过程中还会针对整句语音识别结果及时调整,利用相关声学信息、语言模型等进行重新评估,给出更合理可靠的结果;同时对整句还会进行口语规整操作,过滤语气词、无意义的词、重复词、智能调整词序,确保输出的转写结果“说人话”。
用人工智能与硬件产品的结合来解决专业的“录音转文稿”记录痛点,这个细分领域开始成为很多公司聚焦的方向。讯飞智能录音笔软硬件一体化设计,高清降噪拾音、高效智能转写,引领录音笔行业升级迭代,同时也打开新的消费市场。