• 大模型训练数据集
  • 计算机视觉训练数据集
  • 语音识别训练数据集
  • 语音合成训练数据集
  • OCR训练数据集
  • 发音词典训练数据集
  • 自然语言理解训练数据集
  • 多模态数据定制
  • 激光雷达点云数据定制
  • 街景数据定制
  • OCR数据定制
  • 行为识别数据定制
  • 身份识别数据定制
  • 语音识别数据定制
  • 语音合成数据定制
  • 大模型解决方案
  • 智能驾驶解决方案
  • 智能娱乐解决方案
  • 智能客服解决方案
  • 智能家居解决方案
  • 新零售解决方案
  • 智能医疗解决方案
  • 数据标注平台
  • 数据标注实训平台
  • 企业介绍
  • 人才招募
  • 新闻中心
  • 数据竞赛
  • 训练数据集
  • 数据定制服务
  • 行业解决方案
  • 数据标注平台
  • 关于我们
数据竞赛活动

数据竞赛活动

为积极促进数据科学、机器学习和人工智能技术快速发展,数据堂携手全球合作伙伴不定期推出数据竞赛活动,为人工智能技术爱好者提供展示、交流、合作平台,激发技术创新活力,培养实践人才,助力人工智能产业生态高质量发展。
INTERSPEECH2025 多语言会话语音语言模型研讨会
INTERSPEECH2025 多语言会话语音语言模型研讨会
大语言模型(LLMs)在多种下游任务中展示了卓越的能力,成为语言理解和生成的强大基础模型。此外,越来越多的研究关注将大语言模型应用于语音和音频处理任务,如自动语音识别(ASR)、音频描述和语音对话模型等新兴领域。 然而,现实世界的对话语音数据对于开发基于LLM的语音对话模型至关重要,因为这些数据能够体现人类交流的复杂性,包括自然的停顿、打断、说话者重叠以及多样的对话风格。此类数据的稀缺性,尤其是在多语言环境下,成为推动该领域发展的重大挑战。 现实世界对话语音的重要性不仅限于技术进步——它对于构建能够在多语言、动态和丰富语境的环境中自然理解和响应的人工智能系统至关重要。对于下一代人机交互系统尤为重要,因为在这些系统中,口语对话是主要的交流方式。 因此,本次研讨会旨在通过举办构建多语言对话语音语言模型的挑战,并发布一个真实世界的多语言对话语音数据集,来弥合这一差距。
正在报名
ICPR 2022:Multimodal Subtitle Recognition
ICPR 2022:Multimodal Subtitle Recognition
字幕是视频数据中最重要的文本信息之一,访谈节目或电视剧等视频一般会把人们交谈的内容以视觉字幕的形式呈现出来。近年来,字幕识别被广泛应用于视频推荐、检索和理解系统中,但大家一般会通过语音识别或OCR识别等单一模态的识别来获得文本形式的字幕信息。为了更好的促进字幕识别技术的发展,我们将在ICPR2022举办多模态的字幕识别竞赛,欢迎大家报名参加!
已结束
汉语长短视频直播语音关键词
汉语长短视频直播语音关键词
2021年第十六届全国人机语音通讯学术会议(National Conference on Man-Machine Speech Communication,NCMMSC2021)将于2021年10月15-18日在江苏徐州举行。本次会议由中国中文信息学会和中国计算机学会联合主办。 针对本次会议,由腾讯科技 ASR&OCR oteam联合发起围绕时下在工业界最为关注的三类媒体形式---长视频、短视频、直播场景进行比赛。 本次比赛由易到难,Task1将关注模型场景失配下长短视频及直播中汉语关键词的检测问题;Task2则扩展到Task1的多语种和多方言关键词场景;Task3会根据视频画面里的字幕信息和语音识别信息。共同打造SOTA的长、短视频、直播场景的字幕语音内容识别多模态工业级解决方案。
已结束
2020AESRC口音英语语音识别技术挑战赛
2020AESRC口音英语语音识别技术挑战赛
Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,2020年Interspeech以“Cognitive Intelligence for Speech Processing”为主题,汇聚来自全球语音领域的研究人员、人工智能从业者、业内知名企业等,在语音方面如信号处理和语音识别语言方面如NLP、翻译等进行深入交流与探讨。
已结束
ASRU2019中英混杂语音识别挑战赛
ASRU2019中英混杂语音识别挑战赛
Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,2020年Interspeech以“Cognitive Intelligence for Speech Processing”为主题,汇聚来自全球语音领域的研究人员、人工智能从业者、业内知名企业等,在语音方面如信号处理和语音识别语言方面如NLP、翻译等进行深入交流与探讨。
已结束
客服
客服
留言
留言
电话
电话
邮件
邮件
训练数据集大模型训练数据集计算机视觉训练数据集语音识别训练数据集语音合成训练数据集OCR训练数据集发音词典训练数据集自然语言理解训练数据集
数据定制服务多模态数据定制激光雷达点云数据定制街景数据定制OCR数据定制行为识别数据定制身份识别数据定制语音识别数据定制语音合成数据定制
行业解决方案大模型解决方案智能驾驶解决方案智能娱乐解决方案智能客服解决方案智能家居解决方案新零售解决方案智能医疗解决方案
数据标注平台数据标注平台数据标注实训平台
资源中心助研数据集数据质量与安全
关于我们企业介绍人才招募新闻中心数据竞赛
友情链接openMPD数加加帕依提提
logo更高质量的数据 更有竞争力的AI
联系电话:13051623904
邮箱:services@datatang.com
地址:北京市海淀区奥北科技园11号楼

Copyright © 2023 DATATANG 数据堂(北京)科技股份有限公司 京ICP备11010828号 京公网安备 11010802026079号

网站地图法律声明与隐私权益