亚洲大数据可视分析峰会上,海云数据展示了黑科技唇语识别

发表于 讨论求助 2023-05-10 14:56:27

 

329日,在亚洲大数据可视分析峰会上,海云数据创始人兼CEO,并现场做了技术演示。作为人工智能的一个分支,唇语识别是个较少被涉及的领域,此前仅有英文唇语识别相关技术,而海云数据此次展示的技术问中文唇语识别,准确率已达到70%

 

唇语和语音识别非常不一样,唇语属于视觉识别和自然语言处理相结合的范畴,机器需要能识别出人脸、口型、唇部变化,之后再通过唇语识别模型将其所说的话呈现出来。唇语的应用范围相当广泛,首先能帮助听力有缺陷的人更好地与外界沟通,,人与机器的交互方式,也将在唇语技术的介入下变得效率更高。甚至有研究者认为,唇语将是最终杀死密码的一件利器。

 

与语音识别不同的是,唇语的机器识别从一开始就比人工唇语识别准确率要高好几倍。可以想象一下,随着唇语识别技术的发展,听力障碍者能够弄清电视里的播音员在说什么,,用户只需动动嘴唇不出声就可在各个场合进行登录,过门禁甚至进行消费支付。很多人会把语音作为机器与人进行交互的主要手段,事实上人机交互的方式也许多种多样,唇语也可以是其中的重要一项。

 

海云数据是国内大数据可视分析的领军者,精于将大数据成果用可视化的方式呈现出来,创建不到四年已取得优异成绩,目前在北京、重庆、硅谷、上海等地都建有基地,总部设在重庆。重庆对于新兴产业的发展当战略来做,两江新区极力在基础设施、营商环境、政策扶持、财政援助等多方面投入力量,帮助企业加速发展,海云数据就是其中的重点支持企业。

 

在唇语识别方面,谷歌的DeepMind是领先的,与牛津大学合作开发唇语识别计算机,通过判断嘴型来还原真实的语言,但距离应用还有一段距离。海运数据的唇语识别从时间上看并不比DeepMind晚多少,在英文准确度方面已经做到了80%,在中文准确度方面已经做到71%,在技术上也是领先的,在国内目前来看也是独一份,海云数据在这个领域已占得先机。

 

技术有了,应用是个问题,用在哪里需要认真选择。我们曾看到过很多黑科技,在热闹一阵后就归于沉寂,原因并不是技术不好,而是应用失当。一个好的应用场景被挖掘出来,足够带动后面更为丰富的应用场景出现,进而推动这一技术的推广普及和商业化。海云数据的唇语识别,首先是要用在公共安全领域的,这个领域对技术标准和应用的要求较高,在公共安全领域打开头阵,后面的应用面推展就会很容易,实现产品化和商业化的难度也会降低。

 

人工智能技术的研发成本是非常高的,用市场来带动研发是非常明智的选择。只有应用的范围更广泛,才能从市场上获取足够利益,自有获取了足够利益,才能带动研发的进一步发展,让产品更好用,这是个良性循环的圈子。海云数据在唇语技术的应用上,采取的是简化路径的策略,研发出来就直接投入应用,应用中发现问题随时解决,不断促进技术的发展。人工智能目前发展速度较快,投入其中的公司必须把握好研发和市场的关系才能获得最终成功。

 

如果把人工智能比作一间屋子,语音识别、视觉识别等项目就分别是通往这间屋子的入口,也是人机交互的关键。视觉识别能获取的信息维度更多,使用环境限制更少,应用范围更广。海云数据认为,下一站就是AI和可视分析的强捆绑和强结合,先应用在公共平安全领域,交通领域,军工领域,以此打开突破口,再应用到一般企业和个人。这个观点从根本上来说是符合逻辑的,智能交通等领域的交互肯定更多会依赖于机器视觉识别,而海云数据在该领域已是一枝独秀。

 

不管是语音识别还是唇语识别,都是机器识别技术的前端,后端的共同支撑是语义识别。语音识别目前要解决噪音和口音的问题,唇语识别也要解决图像质量和光线的问题,而这都是有待攻克的技术难题。在当前条件下,让唇语技术立刻发挥作用是不现实的,需要更多的优化和技术上的突破,不过好在与世界先进水平相比,中国的技术并不落后,产业发展的环境也持续向好,随着海云数据这样的创新性企业越来越多,会有越来越多的中国技术领先世界。

 


发表
26906人 签到看排名