基于TI的OMAP平台手持设备语音应用解决方案设计

基于TI的OMAP平台手持设备语音应用解决方案设计

时间:2020-02-12 07:47 作者:admin 点击:
阅读模式

语音技术问题 语音系统必须满足某些基本使用要求。很显然,语音输出必须清晰,使用户能够听懂。在给定应用用途中,ASR还必须支持自然语音。何为自然可谓变化无常,包括从逐字发出的简单名字和指令、到说出大量词汇的连续语句。另外,各人的自然语音以及发音方式也不同,因此系统应该能够灵活接受不同说话人说话。识别引擎必须准确,否则用户不会使用这种技术。 语音的系统要求是需要进行大量处理,有可能包含巨大的内存,这取决于所支持的词库。就基于服务器的应用而言,无线带宽的使用会有所增加。这些因素也会影响其他系统考虑。应用的MIPS和传输要求越高,给定系统的功耗就越高,因此会缩短电池寿命或导致更频繁的充电。当应用需要采用处理器外置存储器时,响应时间也有可能增加。 某些应用权衡考虑有助于通过放弃手持设备不必要的功能来降低系统要求。只识别少量词语、分散语音的基于说话人的系统会比识别大型词库、连续语音的基于说话人的系统要求少很多的资源。对其他语言的支持会增加处理要求并且使应用所需要的内存加倍。抗噪音和抗干扰性是重要的特性,但是会增加复杂性和内存要求。 很显然,开发商在增加说话人依赖性、连续语音、词库规模和语言支持等功能时希望尽可能少地降低基本应用的性能。有某些选项有助于减少语音技术中的性能降低,如:分布式语音识别(DSR)。DSR把识别任务分割开,这样手持设备可以把原始语音转换成频谱特性向量,同时服务器执行识别过程。这种方法以及类似的分布式TTS方法依赖于处理方法和传输协议的标准化。尽管这些技术颇有前途,但是,开发商仍然面临个人手持设备中语音应用的有限资源。 因此,为语音等高性能应用选择适当的平台与精心设计应用的功能同样重要。这种平台必须具有强大的处理能力,同时可以实现高水平的功效,不仅仅是在内核操作中,而且在处理内存中也应如此。应该有足够的MIPS来支持多媒体、安全和其他补充应用。提供集成新算法能力的可编程性也很重要。最后,这种平台必须包含为支持模块化应用开发所设计的软件架构,以帮助开发商快速把产品推向市场。 OMAP技术:卓越的语音平台 TI 的OMAP平台为在个人手持设备中开发语音应用提供卓越的 解决 方案。 OMAP1510和 OMAP5910 处理器的双内核架构集成了高功效的 TMS320C55 x?数字信号处理器(DSP)和高性能ARM9RISC微处理器。因此,这些OMAP处理器可提供语音所需要的算术集中的信号处理能力,同时还可提供系统层操作所需要的通用性能。OMAP710处理器是高度集成的单芯片 解决 方案,带有用于无线通讯处理的、基于DSP的GSM/GPRS基带、以及可低功耗执行多媒体应用的专用 TI 增强ARM925处理器。 OMAP1510、OMAP5910和OMAP710处理器可支持基于低端ARM的语音应用。它们还具有编码兼容性,从而使开发商能够把软件应用集成到针对不同市场的个人产品。OMAP1510和OMAP5910具有DSP处理能力,可处理更集中的语音应用。 双核硬件架构 OMAP1510 和OMAP5910的双核硬件平台设计用于最大化系统性能和最小化功耗。在用于个人手持设备时,DSP和RISC内核的结合给这些处理器提供了无与伦比的性能和功耗优势。RISC极其适合处理控制代码,如:用户界面、OS和高级应用。另一方面,DSP更适合语音应用所需要的实时信号处理功能。 如图2所示,OMAP1510架构包含用于两个处理器的片上高速缓冲存储器,可降低到外部存储器的平均发送次数,同时消除不必要的外部存取的功耗。两个内核的内存管理单元(MMU)提供虚拟物理内存转换。低功耗操作模式可保存不使用或者很少使用处理器期间的能力。 OMAP1510 架构还包含两个外部存储器接口和单个内存端口。这三个存储器接口彼此完全独立,可同时从任何一个内核或者从DMA单元进行存取。每个处理器都具有自己的外设接口,其不但支持到外围设备的直接连接同时还支持从处理器DMA单元的DMA连接。定时器、通用I/O、UART及监视定时器等在内的片上外设以及彩色 LCD控制器均支持OS一般的要求。 OMAP5910架构不但提供了片上系统功能同时还带有诸如192KbytesRAM、USB1.1主机和客户机、MMC/SD卡接口、多通道缓冲串口、实时时钟、GPIO及UART、LCD接口、SPI、uWire及i2s等在内的外围设备。与 OMAP1510类似,OMAP5910也包含内置的处理器间通讯机制,其提供与DSP连接的透明接口,以实现更轻松的代码开发。