cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

AI掌握了“读心术”?解密AI读心背后的意图理解数据

作者:数据堂 发布时间:2023-03-30

“小爱同学,给我推荐一家附近好吃的火锅店吧”,这时小爱同学或许会提示你打开手机定位,并开始对你进行“安利”。

不只有小爱,Siri、Bixby等手机语音助手近几年变得越来越“善解人意”,不仅能解答疑难,甚至逐渐掌握了排忧解难的技巧。

小爱、Siri之所以能够和你对答如流,是因为它们逐渐学会了如何“读心”,也就是学会如何理解用户的意图。


所谓意图理解,是指机器根据用户偏好、时空特性、上下文、交互,以及文本、手势、图像和视频在内的多模态信息内容,在语义级上准确理解用户的意图,并以支持高效查询推演的同一模型进行表示。

简言之,意图理解就是旨在满足用户“我就想要一个聪明且好用的智能助理”的需求。

除了智能手机语音助手,意图理解技术在家居场景下也得到了广泛的应用,智能音箱、儿童故事机、智能电视等家电都在变得越来越聪明。

 

阿里推出的天猫精灵儿童智能音箱一直以来备受家长的追捧。这款专门为儿童设计的智能音箱拥有多项为儿童设计的功能,小朋友只需要简单说出语音指令,就可以实现听歌、听故事、玩游戏的功能。



TCL V8全场景AI电视支持免遥控声控全场景AI,小T就是它的语音助手。

用户除了可以用语音来控制电视播放不同的频道节目、调节音量,还能让“小T”进行地图导航、订机票、叫外卖等等。 

当我们的座驾应用了意图理解技术后也越来越“贴心”:智能后视镜解决了驾驶员对行车记录和ADAS驾驶辅助的需求;智能中控台听到声音指令就可以为驾驶员提供导航、放音乐、报天气等等多种服务。

 

那么,能够识别人类意图的人机交互是如何实现的?

首先,机器会对用户的指令进行语音识别,例如“今天北京会不会下雨呀”。

然后,机器会进行意图理解,对于上述指令,机器的分析如下:“领域:天气;意图:查询气象-雨;城市:北京;时间:今天”。

之后,机器生成答案“今天北京晴转多云,不会下雨”。最后,语音合成答案,反馈给用户。


语言的复杂性会对上述过程带来不小的挑战。用户在提问时,同一个意图经常有各种问法,“今天北京会不会下雨呀”与“北京今儿下雨吗”、“告诉我北京今天下不下雨”、“说,北京今天是雨天吗”等问法是一样的。

但是,如何使计算机针对各种问句,识别出结构化的意图,是人工智能数据企业亟待解决的问题。


数据堂在深刻理解意图识别场景的基础上,通过对海量原始数据进行框选、提取、分类等一系列处理,将混杂无序的数据转写为机器学习可识别的专业数据,推出了《47,811句交互场景单句意图标注数据》、《28,699句交互场景单句意图标注数据》和《命名实体数据》,辅助机器在复杂多样的环境语言语境下更好地识别结构化意图。



47,811句交互场景单句意图标注数据



这是一套智能交互场景下多个领域的单句意图标注数据,数据涵盖电话、导航、翻译、闹钟、拍照、日程、设置、视频、提醒、天气、信息、音乐16个领域的问句,并标注了意图、槽位、槽值。意图识别准确率高达99%。



28,699句交互场景单句意图标注数据


这是一套意图类单句标注数据,数据均为人工编写式,标注人员对其进行意图类的标注,包含槽位和槽值信息。数据涵盖了音乐、天气、日期、闹钟、日程、音箱、蓝牙、家居设备等8个领域的的问句,可用于意图识别等相关领域研究。




命名实体数据



命名实体识别的目的是,识别出文本里的专有名词(实体)且属于哪类(实体类别)。最常见的三种命名实体类别为人名、地名、机构名。其他细分的命名实体类别包括歌名、电影名、电视剧名、球队名、书名、酒店名等。

 

数据堂的命名实体数据的数据规模高达15,900句,标注人员对名人、音乐专辑名、单曲、电影、动漫、电视剧、综艺、球队、景点、图书、餐厅、酒店、快递等13类实体进行单句标注数据。该数据能够帮助计算机识别出在交互场景下经常出现的各类实体。

 

能否做好意图理解,很大程度上决定了“人工智能”还是“人工智障”。不论是优化训练数据还是提升算法性能,都是让我们极尽所能在意图理解这个维度,无限逼近人类的种种思考。

 

意图理解还有很长的路要走,企业应最大化满足客户需求,余下的尽量去想办法去实现,如此才能够尽量去逼近伟大的产品。



口音英语语音识别技术研讨会暨挑战赛-数据堂