动嘴唇、挥手就可以唤醒智能设备? 现在实现了
人脸识别、指纹识别之外,现在融合视觉、语音的唇动唤醒黑科技来了!
天猫精灵事业部总经理库伟介绍搭载“唇动唤醒”技术的AliGenie5.0系统。
17日,天猫精灵在云栖大会上发布了全场景人机交互系统AliGenie5.0,首次将唇动、手势、语音语义等多种形态的信息输入融合在一起,可通过多模态感知的方式理解人类的交流意图,并直接给出反馈。
同时,AliGenie5.0支持分布式的微内核操作系统和云应用技术,能够覆盖更广阔的的应用场景,突破硬件的配置和性能限制,跨平台、跨终端,流畅使用Windows、Linux、Android等系统的丰富应用,用户甚至可以在天猫精灵上玩电脑游戏、上网课、体验3D渲染等。
此前,多模态交互技术多停留在学术层面,作为业内首个把“多模态唤醒”技术大规模应用在消费电子产品上的公司,阿里天猫精灵新发布的三款新产品全部搭载了AliGenie5.0,提供了唇动唤醒、挥手唤醒等多种“拟人化”的唤醒方式。
例如,用户在音箱端开启设置“自然唤醒”后,在1米左右的距离下,当机器识别到有人开始盯着它说话时,不用再喊出唤醒词,就能直接自然对话。
天猫精灵此次发布的三款新品分别为配备了10吋智能屏及大容量电池的天猫精灵CC10电池版、4吋智能屏产品天猫精灵CCMINI,以及第二代IN糖。
其中,CCMINI还集成了阿里自研的微内核操作系统,也是全球首个搭载微内核系统的智能音箱,能够在小屏的产品上实现触屏交互,把追求高效生活常用的闹钟、日程、家居控制等功能进行整合,开发了晨起、睡眠等核心场景的极简模式,让生活中的微小需求实现智能化。
天猫精灵事业部总经理库伟表示,从AliGenie5.0开始,天猫精灵将开始以服务为中心,应用微内核、多模态交互等技术,构建全场景智能化。AliGenie5.0系统同步面向开发者、智能家居合作伙伴开放。
“今年内会陆续支持汽车、房产、智能健康、儿童教育等领域的联合定制产品,覆盖80多个终端品类。未来在生态内的智能场景中,天猫精灵的用户只要使用同一个账号登录,就可以进入个人界面,无差别的使用智能助手。”
库伟表示,智能终端的设备量正处于快速爆发期,随身穿戴、车载、智能家居、智慧社区、酒店、养老院等需要终端设备来服务消费者的领域,都将逐步被智能化改造。
“智能音箱的形态,已经完成了‘AI智能助手’第一阶段的市场普及,未来将出现更多具备多种交互形态、提供AI助手能力的产品形态。当智能场景越来越繁杂时,就需要一个可动态适配所有场景的人机交互系统,来确保消费者体验的一致性。”
“天猫精灵也正在研发具备视觉交互、语音交互甚至行动能力的全场景智能设备,AliGenie也将不断升级,为机器赋予认知、理解和行动力,让每个人、每个家庭都拥有一个专属的智能助手。”库伟说。