科技

您的位置:主页 > 科技 >

人禾娱乐平台_适用于智能家庭应用的语音识别系统

发布日期:2020-11-21 00:12浏览次数:
本文摘要:开发基于自然语言的语音识别系统面临很多技术挑战,准确的语音识别引擎可以将机器听到的内容翻译成文本,通过全面的自然语言处理器来判断内容的意义或意图。然后回到有意义的呼吁或动作。这些课题已经普遍研究了几十年,这里不进行过多的辩论。 本文主要讨论了远距离语音模块系统中经常被忽视的一些最重要的技术挑战,即语音到达语音识别引擎之前的语音预处理。最现代的语音识别引擎也需要基本的语音来拒绝对引擎的输出,才能更好地工作。

用户

开发基于自然语言的语音识别系统面临很多技术挑战,准确的语音识别引擎可以将机器听到的内容翻译成文本,通过全面的自然语言处理器来判断内容的意义或意图。然后回到有意义的呼吁或动作。这些课题已经普遍研究了几十年,这里不进行过多的辩论。

本文主要讨论了远距离语音模块系统中经常被忽视的一些最重要的技术挑战,即语音到达语音识别引擎之前的语音预处理。最现代的语音识别引擎也需要基本的语音来拒绝对引擎的输出,才能更好地工作。

(约翰肯尼迪,语音,语音,语音,语音,语音,语音,语音)这可能是对远距离语音模块系统的明显拒绝,但也是最具挑战性的拒绝之一。(威廉莎士比亚、泰姆派斯特、语音、语音、语音、语音、语音、语音、语音)这里遥远的地方是指用户语音距产品微最远0.5米的系统。例如,附近用户脸上的智能手机由近距离使用案例组成,但谈论一只胳膊的长PC或平板电脑,或穿过房间谈论电视、单声道系统、照明电源、自动恒温器或智能家庭控制器,都被认为是远距离使用案例。近距离和远距离使用案例之间没有很多最重要的差异。

由于这种差异,在近距离系统中不存在,但在远距离系统中会出现非常困难的技术挑战。1.大动态范围:在远距离系统中,用户声音可能很低。他/她与产品麦克风相距数米,但干扰可能很大,例如不受语音控制的扬声器系统中有音乐音频。

2.低信噪比(SNR)、低必需路径与反向路径比率(DRR)和未知方向的语音和噪音:远距离系统的语音噪音要比近距离系统大得多。随着用户大声靠近产品的麦克风,语音水平不会更小,背景噪音水平保持不变。

在一定程度上,从用户口到麦克风的间接路径可以比沿途的墙壁和窗户等表面的光线路径和从用户到麦克风的必要路径具有相当大的功率(即较低的DRR)。这种混响效果在现有的语音处理技术和语音识别引擎中使用时不会引起明显的问题。

最后,在远距离系统中,用户声音对麦克风的方向和噪音对麦克风的方向是未知的。在典型的应用程序中,噪音来自与用户声音完全相同的方向。3.全双工语音交互:在很多远距离系统中,用户谈论产品时,音乐、电影、语音通知等音频内容可能正在产品扬声器中播出。这时,必须用在全双工Echo消除器上,才能一边听用户的声音一边抵消产品的音频输入声音。

在Echo去除器几乎不了解音频内容的系统中,情况更简单。在这种情况下,建立一个需要很好地降低声音的系统是一项非常困难的任务。本文介绍了传统方法在这种远距离条件下无法获得可接受性能的原因,然后明确提出了以经济高效的方式获得更远场性能的解决方案。用作大动态范围智能家庭设备的语音捕获系统,从小声到好听的音频内容音频,必须反对大信号的动态范围。

对于与用户的距离约为0.5至3米的设备,设备麦克风的语音水平范围约为75dB至44dBSPL。对于体积不大的音频音频设备,设备麦克风上音频内容的SPL电平可能类似于95dB。这些典型且具有挑战性的使用案例对设备的麦克风和模拟-数字转换器(ADC)选择有很大影响。


本文关键词:用户,麦克风,远距离,人禾娱乐官网

本文来源:人禾娱乐平台-www.yaboyule184.icu

微信扫码 关注我们

  • 24小时咨询热线

    24小时咨询热线0510-822503062

  • 移动电话19959308761

Copyright © 2006-2020 www.yaboyule184.icu. 人禾娱乐平台科技 版权所有 地址:安徽省滁州市交城县高用大楼56号 备案号:ICP备35190853号-9 网站地图 xml地图