AI掌握了“读心术”？解密AI读心背后的意图理解数据

作者：数据堂发布时间：2023-03-30

“小爱同学，给我推荐一家附近好吃的火锅店吧”，这时小爱同学或许会提示你打开手机定位，并开始对你进行“安利”。

不只有小爱，Siri、Bixby等手机语音助手近几年变得越来越“善解人意”，不仅能解答疑难，甚至逐渐掌握了排忧解难的技巧。

小爱、Siri之所以能够和你对答如流，是因为它们逐渐学会了如何“读心”，也就是学会如何理解用户的意图。

所谓意图理解，是指机器根据用户偏好、时空特性、上下文、交互，以及文本、手势、图像和视频在内的多模态信息内容，在语义级上准确理解用户的意图，并以支持高效查询推演的同一模型进行表示。

简言之，意图理解就是旨在满足用户“我就想要一个聪明且好用的智能助理”的需求。

除了智能手机语音助手，意图理解技术在家居场景下也得到了广泛的应用，智能音箱、儿童故事机、智能电视等家电都在变得越来越聪明。

阿里推出的天猫精灵儿童智能音箱一直以来备受家长的追捧。这款专门为儿童设计的智能音箱拥有多项为儿童设计的功能，小朋友只需要简单说出语音指令，就可以实现听歌、听故事、玩游戏的功能。

TCL V8全场景AI电视支持免遥控声控全场景AI，小T就是它的语音助手。

用户除了可以用语音来控制电视播放不同的频道节目、调节音量，还能让“小T”进行地图导航、订机票、叫外卖等等。

当我们的座驾应用了意图理解技术后也越来越“贴心”：智能后视镜解决了驾驶员对行车记录和ADAS驾驶辅助的需求；智能中控台听到声音指令就可以为驾驶员提供导航、放音乐、报天气等等多种服务。

那么，能够识别人类意图的人机交互是如何实现的？

首先，机器会对用户的指令进行语音识别，例如“今天北京会不会下雨呀”。

然后，机器会进行意图理解，对于上述指令，机器的分析如下：“领域：天气；意图：查询气象-雨；城市：北京；时间：今天”。

之后，机器生成答案，“今天北京晴转多云，不会下雨”。最后，语音合成答案，反馈给用户。

语言的复杂性会对上述过程带来不小的挑战。用户在提问时，同一个意图经常有各种问法，“今天北京会不会下雨呀”与“北京今儿下雨吗”、“告诉我北京今天下不下雨”、“说，北京今天是雨天吗”等问法是一样的。

但是，如何使计算机针对各种问句，识别出结构化的意图，是人工智能数据企业亟待解决的问题。

数据堂在深刻理解意图识别场景的基础上，通过对海量原始数据进行框选、提取、分类等一系列处理，将混杂无序的数据转写为机器学习可识别的专业数据，推出了《47,811句交互场景单句意图标注数据》、《28,699句交互场景单句意图标注数据》和《命名实体数据》，辅助机器在复杂多样的环境语言语境下更好地识别结构化意图。

47,811句交互场景单句意图标注数据

这是一套智能交互场景下多个领域的单句意图标注数据，数据涵盖电话、导航、翻译、闹钟、拍照、日程、设置、视频、提醒、天气、信息、音乐等16个领域的问句，并标注了意图、槽位、槽值。意图识别准确率高达99%。

28,699句交互场景单句意图标注数据

这是一套意图类单句标注数据，数据均为人工编写式，标注人员对其进行意图类的标注，包含槽位和槽值信息。数据涵盖了音乐、天气、日期、闹钟、日程、音箱、蓝牙、家居设备等8个领域的的问句，可用于意图识别等相关领域研究。

命名实体数据

命名实体识别的目的是，识别出文本里的专有名词（实体）且属于哪类（实体类别）。最常见的三种命名实体类别为人名、地名、机构名。其他细分的命名实体类别包括歌名、电影名、电视剧名、球队名、书名、酒店名等。

数据堂的命名实体数据的数据规模高达15,900句，标注人员对名人、音乐专辑名、单曲、电影、动漫、电视剧、综艺、球队、景点、图书、餐厅、酒店、快递等13类实体进行单句标注数据。该数据能够帮助计算机识别出在交互场景下经常出现的各类实体。

能否做好意图理解，很大程度上决定了“人工智能”还是“人工智障”。不论是优化训练数据还是提升算法性能，都是让我们极尽所能在意图理解这个维度，无限逼近人类的种种思考。

意图理解还有很长的路要走，企业应最大化满足客户需求，余下的尽量去想办法去实现，如此才能够尽量去逼近伟大的产品。

阅读更多内容

告别“人工智障”：智能电视如何巧用场景化数据

智能家居作为AI落地的重要场景之一，得到了越来越多企业和研究机构的关注。而电视作为家居设备最重要的电器之一，多项人工智能技术在其中得到了集中体现，承载了智能家居的重要部分。

自动驾驶点云分割和图像分割区别｜数据堂

近年来，自动驾驶领域的各项下游任务基本上都要求了对场景的语义理解，比如自动驾驶车辆要能够理解哪个是路面、哪个是交通灯、哪个是行人、哪个是树木，因此点云分割的作用就不言而喻。

AI掌握了“读心术”？解密AI读心背后的意图理解数据

上一篇

告别“人工智障”：智能电视如何巧用场景化数据

下一篇

自动驾驶点云分割和图像分割区别｜数据堂

AI掌握了“读心术”？解密AI读心背后的意图理解数据

近期内容

数据驱动进化：AI Agent如何重构手机交互范式？

垂域大模型时代：专业数据铸就行业智能底座

案例分享|高质量数据服务赋能智慧医疗3.0时代

上一篇

告别“人工智障”：智能电视如何巧用场景化数据

下一篇

自动驾驶点云分割和图像分割区别｜数据堂