cn
数据解决方案
请输入姓名
手机号码格式错误
请输入联系电话
请输入公司名称
请输入正确的工作邮箱
请输入数据需求
提交成功!感谢您支持数据堂。
填写格式错误请重新填写
确定
数据需求不能小于5个字且不能为纯数字
https://www.datatang.com
https://www.datatang.ai
m.datatang.ai
作者:数据堂 发布时间:2023-03-30
“小爱同学,给我推荐一家附近好吃的火锅店吧”,这时小爱同学或许会提示你打开手机定位,并开始对你进行“安利”。
不只有小爱,Siri、Bixby等手机语音助手近几年变得越来越“善解人意”,不仅能解答疑难,甚至逐渐掌握了排忧解难的技巧。
小爱、Siri之所以能够和你对答如流,是因为它们逐渐学会了如何“读心”,也就是学会如何理解用户的意图。
所谓意图理解,是指机器根据用户偏好、时空特性、上下文、交互,以及文本、手势、图像和视频在内的多模态信息内容,在语义级上准确理解用户的意图,并以支持高效查询推演的同一模型进行表示。
简言之,意图理解就是旨在满足用户“我就想要一个聪明且好用的智能助理”的需求。
除了智能手机语音助手,意图理解技术在家居场景下也得到了广泛的应用,智能音箱、儿童故事机、智能电视等家电都在变得越来越聪明。
阿里推出的天猫精灵儿童智能音箱一直以来备受家长的追捧。这款专门为儿童设计的智能音箱拥有多项为儿童设计的功能,小朋友只需要简单说出语音指令,就可以实现听歌、听故事、玩游戏的功能。
TCL V8全场景AI电视支持免遥控声控全场景AI,小T就是它的语音助手。
用户除了可以用语音来控制电视播放不同的频道节目、调节音量,还能让“小T”进行地图导航、订机票、叫外卖等等。
当我们的座驾应用了意图理解技术后也越来越“贴心”:智能后视镜解决了驾驶员对行车记录和ADAS驾驶辅助的需求;智能中控台听到声音指令就可以为驾驶员提供导航、放音乐、报天气等等多种服务。
那么,能够识别人类意图的人机交互是如何实现的?
首先,机器会对用户的指令进行语音识别,例如“今天北京会不会下雨呀”。
然后,机器会进行意图理解,对于上述指令,机器的分析如下:“领域:天气;意图:查询气象-雨;城市:北京;时间:今天”。
之后,机器生成答案,“今天北京晴转多云,不会下雨”。最后,语音合成答案,反馈给用户。
语言的复杂性会对上述过程带来不小的挑战。用户在提问时,同一个意图经常有各种问法,“今天北京会不会下雨呀”与“北京今儿下雨吗”、“告诉我北京今天下不下雨”、“说,北京今天是雨天吗”等问法是一样的。
但是,如何使计算机针对各种问句,识别出结构化的意图,是人工智能数据企业亟待解决的问题。
数据堂在深刻理解意图识别场景的基础上,通过对海量原始数据进行框选、提取、分类等一系列处理,将混杂无序的数据转写为机器学习可识别的专业数据,推出了《47,811句交互场景单句意图标注数据》、《28,699句交互场景单句意图标注数据》和《命名实体数据》,辅助机器在复杂多样的环境语言语境下更好地识别结构化意图。
47,811句交互场景单句意图标注数据
这是一套智能交互场景下多个领域的单句意图标注数据,数据涵盖电话、导航、翻译、闹钟、拍照、日程、设置、视频、提醒、天气、信息、音乐等16个领域的问句,并标注了意图、槽位、槽值。意图识别准确率高达99%。
28,699句交互场景单句意图标注数据
这是一套意图类单句标注数据,数据均为人工编写式,标注人员对其进行意图类的标注,包含槽位和槽值信息。数据涵盖了音乐、天气、日期、闹钟、日程、音箱、蓝牙、家居设备等8个领域的的问句,可用于意图识别等相关领域研究。
命名实体数据
命名实体识别的目的是,识别出文本里的专有名词(实体)且属于哪类(实体类别)。最常见的三种命名实体类别为人名、地名、机构名。其他细分的命名实体类别包括歌名、电影名、电视剧名、球队名、书名、酒店名等。
数据堂的命名实体数据的数据规模高达15,900句,标注人员对名人、音乐专辑名、单曲、电影、动漫、电视剧、综艺、球队、景点、图书、餐厅、酒店、快递等13类实体进行单句标注数据。该数据能够帮助计算机识别出在交互场景下经常出现的各类实体。
能否做好意图理解,很大程度上决定了“人工智能”还是“人工智障”。不论是优化训练数据还是提升算法性能,都是让我们极尽所能在意图理解这个维度,无限逼近人类的种种思考。
意图理解还有很长的路要走,企业应最大化满足客户需求,余下的尽量去想办法去实现,如此才能够尽量去逼近伟大的产品。