当前位置:刘伯温论坛 > 人助机译 >

科技向善!手语迎来AI翻译机助力听障人士无障碍沟通

  “科技向善,助力无障碍沟通。”一名听障人士面对普通摄像头做出以上手语表达,无需特意停顿,翻译机屏幕界面便迅速将一连串手语动作转化为文字,让普通公众也能“看”得懂手语,与听障人士正常交流……5月16日,在全球无障碍宣传日上,腾讯优图实验室宣布攻克AI手语识别技术挑战,联合深圳市信息无障碍研究会推出了“优图AI手语翻译机”,致力于用人工智能基础为听障人群搭建无障碍沟通平台。

  “手语翻译技术的核心是手语识别(SLR),通过计算机算法,可以自动区分手语表达中的各类手势、动作,并支持手势和动作之间的切换,最终将手语实时翻译成文字。”腾讯优图研究员阳赵阳告诉记者,以往也有一些团队探索过用人工智能技术环节听障人士沟通障碍,但往往需要借助一些额外的设备或传感器,不仅增加了用户使用门槛,也无法保证对复杂手语的识别率。

  记者了解到,由于手语特有的地域性、复杂性和多样性,手语识别技术即使在深度学习的帮助下也仍存很大挑战,难以实际应用。“为此我们在自研算法上下了很大功夫,除了手势识别、动作识别外,还加入了序列翻译等技术,力求包含来自不同地域的听障人士在手语表达上的不同习惯与速度,同时让用户表达时候可以连贯将整个句子表达完,无需特意停顿或设定特定起始或结束动作。”

  世界卫生组织最新数据显示,目前全球约有4.66亿人患有残疾性听力损失,超过全世界人口的5%。据北京听力协会2017年的预估数据,国内残疾性听力障碍人士也已达到7200万。“虽然我国在信息无障碍领域的投入不断增加,但听障人群的一切需求仍得不到满足,尤其是公共环境设施、服务体验等方面。”深圳市信息无障碍研究会秘书长杨骅表示,据有关数据统计,我国目前致力于听障者专业服务的人士仅约有1万名,大部门公共服务并未配备专门的便利设施。

  “我们希望将计算机视觉人工智能技术应用到手语识别场景,利用手语翻译机能实现整句识别和翻译的特性,将听障人士的手语快速识别翻译成文字,帮助解决公共服务中听障专业人士短缺的社会痛点。” 阳赵阳介绍称,目前优图实验室手语识别数据覆盖了近千句日常表达、900个常用词汇,是最大的中文手语识别数据集。

  “实验室将继续进行语料库的扩展和算法优化,进一步探索在机场、高铁、民政窗口等公共服务领域的部署场景,提供更加具体的无障碍沟通解决方案,为听障人士与普通人的日常交流提供便利。” 香港中文大学终身教授、腾讯杰出科学家贾佳亚教授表示,为进一步深入接触听障群体,了解手语和优化数据识别算法,腾讯优图实验室已和深圳市信息无障碍研究会成立AI手语识别联合项目组。

  不过,贾佳亚也坦言,AI手语翻译机在落地中也面临不少挑战。“就目前来说,优图AI手语翻译机仍处于实际应用探索阶段。主要受三个问题限制,一是需要高性能计算机,二是复杂环境背景的适应性,三是语料库进一步拓展。这几方面的问题将在未来的升级和优化中重点解决。”

http://alanhandle.com/renzhujiyi/355.html
点击次数:??更新时间2019-06-25??【打印此页】??【关闭
  • Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有  
  • 点击这里给我发消息
在线交流 
客服咨询
【我们的专业】
【效果的保证】
【百度百科】
【因为有我】
【所以精彩】