大模型训练数据集
计算机视觉训练数据集
语音识别训练数据集
语音合成训练数据集
OCR训练数据集
发音词典训练数据集
自然语言理解训练数据集
多模态数据定制
激光雷达点云数据定制
街景数据定制
OCR数据定制
行为识别数据定制
身份识别数据定制
语音识别数据定制
语音合成数据定制
大模型解决方案
智能驾驶解决方案
智能娱乐解决方案
智能客服解决方案
智能家居解决方案
新零售解决方案
智能医疗解决方案
数据标注平台
数据标注实训平台
企业介绍
人才招募
新闻中心
数据竞赛
训练数据集
数据定制服务
行业解决方案
数据标注平台
关于我们
咨询销售
客户服务系统
首页
数据集聚合页
大模型训练数据集
9万组多领域客服对话文本数据
9万组多领域客服对话文本数据
多领域客服对话文本数据总计9万组;涉及领域为电信、电商、金融、生活、商业、教育、医疗和娱乐;每组数据为一轮或多轮对话;该数据可用于大型语言模型(LLM)训练、chatgpt等任务
数据堂如何保障数据质量与安全
获取样例
购买咨询
数据规格
数据内容
电信、电商、金融、生活、商业、教育、医疗、娱乐和其他领域的多轮客服对话文本数据
数据规模
8.3万组,1,717,841条
采集方式
客户与客服之间的多轮对话文本,所有文本都经过了人工校对和补充,确保文本内容的通顺性和完整性;所有数据均经过脱敏处理
存储格式
jsonl
语言
中文
数据处理
人工扮演客户和客服角色,撰写多轮对话
样例展示
客服
留言
电话
邮件