世界首款翻译人形手语机器人国内诞生 “大家好,我叫联合一号。”发出这样的语音后,身高一米四的机器人缓慢地打出手语,面部的LED屏幕露出笑容,黑色的身子、白色的手臂、灵活的手指都格外惹眼。 这是世界上首款可以在听障人和健全人之间充当翻译的人形手语机器人,它诞生于联合大学,由特殊教育学院和自动化学院的师生们共同完成。 目前,“联合一号”还处在技术完善阶段。不过,想把这种机器人推向市场,还面临着极大的挑战,主要原因在于手语识别系统面临应用难题,而这一难题,是全世界都面临的普遍问题。 一通电话“打”出的想法 2014年6月的一个周六,联合大学特殊教育学院实验师关忠接到一通来自的电话:“你们有一个学生到我们这儿来报案,但是我们不明白他想说什么。” 电话那头的声音告诉关忠,一名聋哑学生去报案,双方出现了交流障碍,警方不懂手语,而听障学生按照手语逻辑写出来的文字警方也看不明白。 在警方把学生写出来的文字一句一句读给关忠后,关忠在电话这边根据手语逻辑反推,为警方翻译了这位听障学生的大思。 “我们这里的老师经常会接到类似的电话,因为学生与健康人交流中存在障碍,无奈之下被临时拉去当翻译。”关忠说。 正是这样的“麻烦”,让他产生了做一款“手语机器人”的想法。“绝大多数健全人都不会使用手语,这导致了听障人群与健全人群之间产生了非常严重的交流和沟通问题。这些问题不但导致听障人很难融入社会生活,大多数听障人还会很自然地会把人分为两类我们(使用手语的)和他们(不使用手语的),这成为建设平等、高效、和谐社会的一个障碍。”关忠说。 鉴于这些问题,关忠带领着4位来自特殊教育学院的学生,联合自动化学院的学生一起,开始了“联合一号”手语机器人的研发。 如今,这款机器人已具雏形,并成功入围全国“挑战杯”竞赛名单。 世界上首次尝试 近年来,国际对聋益的关注度越来越高,手语识别技术成为科技助残的一个研究方向。 然而,当“联合一号”还只停留在概念层面时,关忠惊讶地发现,自己设想的手语机器人竟然是世界首款人形手语机器人。 “这一技术还面临诸多难点,国际上对手语机器人的研发并不多见。”关忠说。 2013年,日本有研究人员设计出可穿戴式的智能手语翻译器,戴有此设备的听障人语时,翻译器就能翻译,在非障碍者说话时,声音可为文本或图像显示在设备上。 但是,“通常,当听障人与不懂手语的人交流时,会有较强烈的抵触情绪。相较于看文字或图片,听障人在看到手语时会更感亲切,交流也更加和谐。”关忠告诉记者。 长期从事手语识别算法研究的中科院计算所副研究员柴秀娟告诉记者,目前,国内外的手语识别技术识别率尚难达到大词汇量连续手语识别系统实用的需求。 早在2012年,中科院计算所和微软亚洲研究院就联合尝试用Kinect技术来对手语动作进行识别翻译。柴秀娟就是这一研究的参与人员之一。 “中国手语有5000多个标准词汇,当这些词汇连成句子时,对连续手语句子的识别会更加困难。”柴秀娟说,这一问题是全世界在手语识别应用时面临的普遍问题。 她告诉记者,当系统的用户与训练数据的采集者一致时,在1000个词汇规模上,机器对特定人进行手语识别的准确率可以达到92%以上;而通常手语识别系统的用户是不同于训练数据的采集者的,同样1000词规模的集合上,对于非特定人的识别准确率会下降到75%~80%。“这还只是对孤立词汇的识别,如果连续手语识别面临非特定人的情况,会更具有挑战性。” 识别问题靠算决 从想法产生至今,“联合一号”的研制已有一年。“我们的数据库里还只有二十几句话。”参与此研究的联合大学自动化学院三年级学生秦乾告诉记者,对于机器人打出来的每个词汇的手势、方向、,他们都要一遍遍地实验,并让来自特殊教育学院的听障学生确认是否精确。 无疑,这是一项庞大的工程。“我们正在建立基础词库,通过特定的算法把这些词连成句。”秦乾说,除了解决数据库、算法等系统设计问题之外,他们还面临着更为复杂的问题解决机器人机械臂的运动问题。 但是,该团队的8名并没有放弃。“手语识别技术暂时处于初级实验阶段,并没有实际应用。我们将在今后紧密关注有关研究动向,设计并制作出简单、可行的手语动作识别功能。”秦乾说。 关忠告诉记者,现在“联合一号”只能通过语音信息展示手语,接下来,他们还将在把手语转换回文本或声音的方向上继续努力。 “未来我们希望联合一号能先在限定应用场景中使用,如、医院等公共服务机构。”关忠说。 对于关忠提到的手语动作识别技术,柴秀娟认为,这一问题还是需要通过改进核心的算法来解决。 “中科院计算所与微软的合作正着眼于算法优化。从目前来看,研究组提出的新的算法已经最高可以让系统在识别非特定人的手语时,1000个词汇的准确率在76.3%。”她说,尽管这还只是对孤立词汇的识别性能,但与传统的HMM算法相比,已经提高了20个百分点以上。 |