您现在的位置是:首页新闻中心焦点追踪
手语识别带来无声交流乐趣

  如何在无声的世界里顺畅地交流?在北京残奥会上,中国科学院计算技术研究所的课题组历时8年开发出的手语识别与合成技术,为残障人士无声的世界提供了更多交流的通道。

  “听懂手语,看懂声音”成可能
   
  手语识别与合成技术的研发目标,就是要解决聋哑人与健全人之间相互交流的问题。所谓手语识别,是指通过计算机采集设备获得聋哑人的手语数据,采用模式识别算法,结合上下文信息,获知手语含义,进而翻译成语音,使健全人可以“听懂手语”;而手语合成则是指健全人通过语音表达自己的意图,计算机将语音翻译为手语并表现出来,使聋哑人也能够“看懂声音”。

  2003年2月27日,由中国残联召开的中国手语合成系统应用评估会上,来自残联、教育部、聋协的各界专家对该系统给予了高度评价。同年3月20日,在北京市第二聋校举行的中国手语合成系统捐赠仪式上,项目承担单位中科院计算所向全国1310所聋校赠送了价值共约1000万元的中国手语合成系统软件,使该研究成果真正服务于社会。

  从2000年至今,中科院计算所手语识别与合成项目组一直在不断创新,申请中国发明专利20余件,手语编辑、手语翻译等相关专利已获授权。对希望交流的聋哑人与健全人来说,“听懂手语,看懂声音”已不再是梦想。

  中国最大的手语词汇库
   
  尽管手语识别与合成技术的出现,使得聋哑人与健全人之间的“对话”成为可能,但要完全实现顺畅交流的目标,还有很多技术难点需要解决。   

  据介绍,手语识别系统主要分为基于数据手套的识别和基于视觉图像的手语识别系统。数据手套的手语识别系统识别率高,但打手语的人要穿戴复杂的数据手套和位置跟踪器,并且由于摄像头在将三维手语数据转为二维数据时,会丢失大量数据信息,因此手语识别与合成课题组决定主要以数据手套的方式采集数据。
 
  “我们使用了2只数据手套和3个六自由度位置跟踪器,基于运动跟踪的原理,记录真实人体演示每个手语词的运动数据,建立初始的手语词运动数据库后,再对每个手语词的运动数据进行编辑与微调,最后得到高质量的手语词运动数据库。”来自中科院计算机技术研究所普适计算机研究中心的专家指出,在10多名聋校老师和很多聋校学生的帮助下,目前,手语识别与合成课题组已建立拥有5500个词的中国最大的手语词汇库,采用手语词根建模的识别方式来解决大词汇量的识别问题。

  向更高技术迈进
   
  2007年元旦,北京卫视播出的《新闻手语》,首次启用了数字模拟机器人打手语,使手语播报更加标准化、程序化。在中科院计算技术研究所研制的电视台用手语电视节目制作系统的帮助下,新闻文本通过计算机自动合成手语视频窗口,与电视节目同步播放,方便了聋哑人“看”新闻。
   
  据了解,针对不同需要,手语识别与合成课题组还将继续整合功能日益强大的手语技术系统个人助理终端,完善软件功能,为用户提供如实时感知聋哑人所处位置和状态,向用户或监护人提供及时的视频播放服务或监护提示服务等更加新颖、更加人性化的服务。
   
  在北京残奥会举办过程中,由中科院计算技术研究所研制的奥运手语在线互动教学系统成为残奥会志愿者必备的学习软件,极大地方便了残疾运动员与志愿者。相信在不久的未来,聋哑人与健全人将会在更强大的手语识别与合成技术的帮助下,在同一片蓝天下,共享交流的乐趣。

 

来源:知识产权报 记者 张海志

资源来源:不详
相关资源列表:
【发表评论】 【打印】
地址:湖北省武汉市武昌珞瑜路546号 邮编:430079 电话:027-67880105 E-mail:whipic@126.com
版权所有:“武汉.中国光谷”知识产权信息中心 鄂ICP备05022683号
技术支持:矩阵科技