| |
车上设备人机语音接口 | |
吉林大学 秦贵和 张洪坤 葛安林 李柱张 | |
为节省流量,手机版未显示文章中的图片,请点击此处浏览网页版 | |
[摘要] 本文介绍了一个通过车上网络方式访问车上设备的语音接口。通过这个接口,驾驶员可以用语音命令控制车上设备和获得语音方式的反馈信息。这个接口装置是按车上网络的一个节点来设计的,它通过车上网络访问车上设备。硬件的核心是RSC364 微处理器。对系统的结构命令处理算法以及网络接口等进行了详细设计。这种接口在家庭轿车上有应用前景。
关键词:接口技术 车上网络 语音识别与合成 车上设备
1 前言
随着社会信息化的不断深入,车上设备及其功能不断增加,驾驶中使用这些设备的频率很高。由于驾驶员的视觉和手直接控制驾驶操作,传统的基于视觉和手操作的人机接口访问方式,无法适应驾驶中对不断增加的车上设备的访问;不仅使用不方便,而且极大地影响安全性,并占用大量的车上空间。由于驾驶中使用类似于手机等设备引发的事故不断增加,很多地方禁止驾驶中使用这些设备。在对车上设备访问方式进行评估中,由于语言访问方式不需要视觉和手的直接介入,安全性、使用方便性以及占用车上空间等指标远高于其它方式,被认为是最有发展潜力的人机接口方式[1][2][3]。语言交流方式也是人类最自然的交互方式,随着语音识别和语音合成等相关技术的不断成熟,语言接口将不断取代目前基于视觉和手操作的接口。基于语言的人机访问接口将是车上设备人机接口的发展方向。
随着车上电子设备与装置不断增多,传统的连接方式已无法适应线束数量和连接复杂程度的增加,车上网络技术越来越受到重视;普遍认为,所有车上电子装置将通过车上网络连接。车上网络协议以及支撑器件的工业化和标准化也发展非常快。在不久的将来,所有车上电子装置都将通过车上网络连接。所以本系统与被访问的设备之间采用网络连接方式。这有利于本系统与被访问设备的硬件连接和推广应用。它与车上网络之间通过标准网络协议进行通信。把语音接口纳入到车上网络体系中,也是连接语音接口与被访问设备的最有效方式。
车上语音接口的支撑技术是小词汇量语音识别、语音合成和车上网络技术。小词汇量语音识别技术(尤其是孤立词小词汇量识别)已经达到实用水平。采用隐马尔可夫模型的小词汇量识别可以在非特定人和高噪声环境下可靠工作并达到很高的识别率[4]。对于大量的私人用轿车,可以采用特定人识别方式,不仅可以达到更高的识别率,而且可以适应个人说话口音等因素。车上网络已经有较成熟的系统,如CAN 总线、MOST 总线等。而且越来越多的车上设备和总成支持网络连接方式。这些对与本文介绍的系统将来在车上的推广应用提供了有利的支持。
这方面的技术是国际上汽车电子技术研究的一个新领域,被认为是将来车上人机接口的必然发展方向,在我国尚未开展相关研究开发工作。对这项技术进行研究,并开发具有自主知识产权的技术产品,对提高我国汽车整体技术水平,提高我国汽车信息与电子技术产品的市场竞争力,具有重要意义。将来在车上使用语音人机接口方式,已经是一种共识,这项技术的市场潜力巨大。由于在车上应用语音接口方式的显著优点,和语音识别与合成技术已经进入实用阶段,也就是足以支持这类语音接口,国际上各大汽车公司和相应的配件厂家正展开车上语言人机访问方式一系列相关技术的研究,并且取得了一些成果。BOSCH公司最近已经开发出了较为实用的车用语言操纵系统。SENSORY 等公司开发了适用于车辆环境的语音处理器件。这些工作目前还处于开发与完善阶段,不久将进入市场;预计,首先在高档车上使用,随着技术不断成熟成本将下降很快,然后在其它类型车上广泛应用。
2 车上设备与装置
这个语音接口访问的车上设备和功能主要包括通信装置(如电话)、车上计算机、车上媒体装置(如音响设备、CD 播放机等)、车上辅助装置(如空调、车门窗、后视镜等)。语音接口访问的设备不包括驾驶操作中影响安全性的装置和设备(如转向、信号、制动、加速踏板等)。这个接口与被访问设备之间按标准车上网络协议进行连接。
车上语音接口,一方面是一个驾驶员访问其他设备的界面,另一方面它也是一个车用设备。设计中必须遵循汽车环境要求的指标。在汽车环境下应用的设备必须满足一些特定的要求,包括:
(1) 高可靠性;
(2) 低成本;
(3) 工作温度范围-40~125℃;
(4) 应用方便;
(5) 体积小,安装灵活;
(6) 满足环保和电磁兼容要求;
(7) 驾驶中应用时,基本不分散驾驶员的视觉和手操纵的注意力;
(8) 在汽车可能出现的任何状态下,它是安全的(不应引起有害后果)。
3 系统功能与操作方式
3.1 车上语音接口的功能
车上语音接口的主要功能包括:
(1) 上设备的语言命令控制;即通过这个接口,驾驶员可以用语言命令对这些设备进行操作。
(2) 表盘;即可以通过语音方式给出传统仪表盘上的各种汽车状态信息,如车速、燃料状态、蓄电池状态、故障状态信息以及车上数据库信息等。
(3) 语音形式的提示与报警功能。
3.2 基本操作方式
这个语音接口的基本操作为:
(1) 启动:当汽车上电时,这个系统初始化,并进入接受语音命令状态。初始化也可以通过初始化按键随时重新进入。
(2) 初始化完成后,系统可以接受系统控制命令、设备控制命令和信息数据请求命令。
(3) 系统控制命令用于设置和检查语音接口系统状态。
(4) 设备控制命令完成设备访问功能。
(5) 信息数据请求命令完成获取汽车状态或其他数据库中信息的访问。
4 车上语音接口硬件结构
由于这个接口是通过车上网络与被访问系统连接,这个接口本身就是网络中的一个节点。它首先识别输入的语音命令信息,识别后根据识别的结果发送访问命令信息。在这个实验系统中,语音接口通过CAN网络与被访问设备连接。系统硬件结构如图1 所示。它由两个信息通路构成,一个是由驾驶员到被访问设备的控制命令通路,包括拾音器、语音识别、控制信号转换以及与被控制设备的接口。另一个是由信息源或设备到驾驶员的反馈信息通路,包括信息获取设备接口、数据到词句的转换以及语音合成和发音器。语音识别部分完成识别驾驶员命令并转换为命令代码的功能。信号转换部分把命令代码转换为能控制对应设备的电信号形式。这个接口支持数字信号、模拟信号、串行接口信号和CAN 总线网络连接方式。 (图片) (图片) (图片) | |
电脑版 | 客户端 | 关于我们 |
佳工机电网 - 机电行业首选网站 |