基于智能语音识别的云电视系统设计
为了提高智能电视的可操作性,文章提出了一种基于智能语音设别的云电视系统设计方案。该系统在传统的智能电视上加入语音输入和云端网络技术,对语音智能处理之后达到操作电视的作用,可以通过语音输入自动查找或者使用电视功能,提高了智能电视的可操作性,让智能电视使用更方便,适合更多的使用人群。
当前,随着计算机和互联网技术的高速发展、3c融合的趋势以及电视机的数字化发展,作为家庭娱乐核心家电的电视机已经开始向智能化多媒体网络电视方向发展。智能网络电视机是一台多功能的网络终端,用户可以通过该网络终端得到诸多信息和服务,然而伴随应用功能的增加,其操作也随之变得复杂。面对智能电视的功能复杂、操作难问题,仅仅是将电视机的纸质说明书或者做成电子文档以flash形式在电视机上进行播放,并没有详细的指引用户操作的导航功能,或者说有详细的说明,电视面对的是任何消费者,很多功能的操作他们也不是很明白,甚至很多功能都找不到。在电子产品智能化的今天,智能语音设别是一个热门话题,该技术的实现提高了电子产品的可操作性,为用户带来了更多的方便。所以设计一个基于智能语音设别的电视系统,用语音来实现快速导航到各个需要的功能、信息、服务等应用成为当务之急。
本系统为基于智能语音设别的云电视系统,将输入的语音数据传输到电视机系统,系统把该模拟语音数据预处理,转化为数字语音信号,根据各个模块需求把数字语音数据发送到云端,云端经过智能语义识别分析处理之后,返回具体的控制指令给电视予以处理。
1.系统总体设计
该电视系统结构图如图1所示,该系统分三个模块设计,语音设别、电视系统处理、云端处理。在有网络连接的情况下,通过麦克录入语音,再通过语音模块把录入的语音转化为特定的语音格式传输到云端的中央服务器,云端服务器把传输过去的的语音与许多表示特定字符的语音模型进行比较,以提供输入语音所包含特定字符的许多不同可能性。然后,云端服务器生成一个字符序列,根据基于字符的语言模型,这个字符序列表示了输入语音中所包含已知特定字符的特定序列的不同可能性。然后字符序列通过网络被传输到中央服务器,在这里,字符序列生成一个词汇序列,根据词汇表和基于词汇的语言模型,这个词汇序列表示了输入语音中所包含已知特定字符的特定序列的不同可能性。然后,云端服务器根据词汇表确定哪个特定词汇序列与输入语音最匹配,并将所确定的词汇序列经由网络输送回终端电视机系统,电视机系统再把得到的数据分模块处理(电视机系统不同模块有不同的功能)。该电视系统硬件使用MIPS构架CPU,配置Linux操作系统。语音通过MIC输入,设计有两路MIC接口,使用标准的网络接口用于网络通信。
2.语音识别系统设计
2.1 语音识别基础知识
语音设别技术,也被称为自动语音设别,即AutomaTIc Speech RecogniTIon(ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人设别及说话人确认不同,后者尝试设别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别系统本质上是一个模式识别系统。语音识别一般分两个步骤,第一步是系统"学习"或"训练"阶段。这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型等。第二步是"识别"或"测试"阶段。根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法提取出这种识别方法所要求的语音特征参数,按照一定的准则和测度与系统模型进行比较,通过判决得出识别结果。
2.2 语音设别系统设计
语音设别系统框图如图2所示。首先要把电视机麦克输入的模拟语音信号进行预处理,云端需要数字语音信号,这里预处理使用语音IC进行处理,包括预滤波、采样和量化、信号数字化、加窗、断点检测、预加重等。语音信号经过预处理后,接下来重要的一环就是特征参数提取,其目的是从语音波形中提取出随时间变化的语音特征序列。把特征提取的结果送到电视机操作系统中进行判断处理,分析是否需要将其传送到云端服务器,云端服务器在对接收到的语音进行智能分析处理之后传回电视机终端,进行相应的功能处理。
2.3 云端服务器智能处理
云端服务器处理主要针对数字化语音数据进行分析处理,本系统的功能比较复杂,语音处理工作量非常大,该设计基于云计算的服务器来完成,在服务器端对语音进行分析处理的同时还需要进行智能设别,该智能设别主要针对本电视机系统的一些关键字及语音
- 基于DSP和机器人的声控系统设计与实现(02-21)
- CEVA携Sensory力推先进的语音识别解决方案(02-12)
- NEC开发出在噪声环境下进行语音操作智能机的技术(04-10)
- 基于语音的终端映射技术如何实现智能交互?(04-30)
- 解析语音识别技术在手机中的应用(06-16)
- Nuance语音识别技术及解决方案(11-16)