5月16日,全球无障碍宣传日之际,腾讯优图实验室宣布攻克AI手语识别技术挑战,联合深圳市信息无障碍研究会发布“优图AI手语翻译机”,致力于通过人工智能技术为听障人群搭建无障碍沟通平台。
据优图实验室AI手语识别项目组研究员阳赵阳介绍,优图AI手语翻译机以普通摄像头作为手语采集装置,依托高性能计算机进行后台运算,用户只需面对摄像头完成手语表达,翻译机屏幕界面就能快速把手语转换为文字,帮助听障人士和健听人士进行正常交流,未来有望在机场、高铁、民政窗口等公共场所部署应用,助力信息无障碍城市建设。
这也是继本月初优图实验室宣布通过人工智能技术帮助警方寻回多名被拐超过10年儿童之后,腾讯践行“科技向善”理念的又一体现,也是腾讯在计算机视觉人工智能领域的又一重大技术突破。
据世界卫生组织最新数据显示,目前全球约有4.66亿人患有残疾性听力损失,超过全世界人口的5%;据估计,到2050年这一数字将达到9亿,全球将有约十分之一的人出现残疾性听力损失。据北京听力协会2017年预估数据,我国听力障碍人士已达7200万,其中有2700万听障者需通过手语等方式进行沟通交流。
针对这一社会痛点,优图团队首次将计算机视觉人工智能技术应用到手语识别场景,而此次发布的“优图AI手语翻译机”产品,利用了普通摄像头和高性能计算机,可以识别听障人士的手语,并快速识别翻译成文字。
据腾讯优图研究员阳赵阳介绍,手语翻译的核心技术是手语识别(SLR),通过计算机算法,自动区分手语表达中的各类手势、动作、手势和动作之间的切换,最后将手语翻译成为文字。此前也有一些团队探索过用人工智能技术缓解听障人士沟通障碍,但往往需要借助一些额外的设备或传感器,不仅增加了使用门槛,而且也无法保证对复杂手语表达的识别率。不仅如此,手语特有的地域性、复杂性和多样性,使得手语识别技术即使在深度学习的帮助下也依然存在很大的挑战,难以被实际应用。
据介绍,优图实验室手语识别数据集覆盖了近千句日常表达,900个常用词汇,是最大的中文手语识别数据集。与此同时,优图对数据进行了进一步的分析和归纳,使优图AI手语翻译机能够实现整句的识别和翻译,用户表达的时候可以连贯将整个句子表达完,不需要设定特定的结束或起始动作,也无需在句中故意停顿或放慢速度。
上游新闻·重庆商报记者 孙磊
【免责声明】上游新闻客户端未标有“来源:上游新闻-重庆晨报”或“上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。