AD
首页 > 头条 > 正文

AI读唇术!搜狗推出“唇语识别”技术 “打哑谜”也能与AI交流-科技频道-金鱼财经网

[2021-02-26 06:19:24] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: TechWeb报道12月14日消息,搜狗今日推出人机交互新技术 唇语识别。据了解,这是业内首个公开演示的唇语识别系统,通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。

TechWeb报道12月14日消息,搜狗今日推出人机交互新技术 唇语识别。据了解,这是业内首个公开演示的唇语识别系统,通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。

据介绍,唇语识别与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。搜狗首创了复杂端到端深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练,另外得益于搜狗在自然语言处理方面的强大优势,最终取得了业界领先的唇语识别效果。

据介绍,唇语识别与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。搜狗首创了复杂端到端深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练,另外得益于搜狗在自然语言处理方面的强大优势,最终取得了业界领先的唇语识别效果。

在非特定人开放口语测试集上,搜狗唇语识别系统已经达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。

在刚结束不久的乌镇世界互联网大会上,搜狗唇语识别技术亮相,在业内大多数唇语识别技术实用性尚待考证的环境下,成功完成了业内首个中文唇语识别系统的公开演示。

作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。

比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也可以保证说话内容的私密性;在安防领域,由于目前多数监控只有摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情分析带来很多难题,而唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。除此之外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。

搜狗表示,近年来一直致力于自然语言的研究,目前在语音识别、语义理解、机器翻译等方面均取得了行业领先的成果并实现产品落地。此次推出唇语识别技术,是在AI领域的高水平展示,将推动整个AI行业的技术革新。(唐文)

查看更多:

为您推荐