数据竞赛 | 2nd MLC-SLM竞赛火热报名中:基线系统已发布,20000美金奖金开放角逐
第二届多语种对话语音语言模型竞赛(MLC-SLM Challenge 2026)正在火热报名中。继训练集与开发集发布后,本届竞赛迎来关键进展:官方基线系统已正式发布。参赛团队现可基于官方参考系统快速开展基线复现、实验验证与模型优化,赛事正式进入技术实战阶段。
随着大语言模型(LLM)与语音大模型(Speech LLM)的快速发展,语音识别与口语理解正在走向统一建模。但在真实多语种对话场景中,系统仍面临语言多样性、口音差异、说话人交替、对话结构复杂和语义理解不足等挑战。MLC-SLM Challenge 2026正是围绕这些关键问题展开,重点推动Speech LLM在说话人分离与识别、声学理解和语义理解方向上的能力提升。
本届竞赛训练数据在第一届基础上继续扩展,数据规模达到约2100小时,覆盖约14个语种,并进一步加入加拿大法语、墨西哥西班牙语、巴西葡萄牙语等语言变体与地区口音,为参赛团队探索跨语种泛化、口音鲁棒性和复杂对话建模提供更贴近真实应用场景的数据基础。
对参赛团队而言,基线系统不仅是参考方案,更是快速起步的工程入口。参赛者可以先完成基线复现,再围绕模型结构、训练策略、数据处理、跨语种泛化、口音鲁棒性与复杂对话理解等方向展开优化。
Task 1 基线系统面向多语种对话语音说话人分离与识别,基于 Microsoft 开源模型 VibeVoice-ASR,并结合竞赛训练集进行微调。
Task 2 基线系统面向多语种对话语音理解,利用 Gemini 2.5 Pro 构建声学与语义理解单选题,并基于 Qwen2.5-Omni-7B 与 ms-swift 工具链进行微调。
官方基线系统的发布,将帮助参赛团队更高效地完成环境配置、数据处理、模型训练与结果验证,也为后续系统优化和创新探索提供了清晰起点。
本届竞赛设置总额达 20000 美金(或等值其他币种)的优秀团队奖金,两个任务均设有奖励名次。每项任务奖金如下:
无论是聚焦说话人分离与识别,还是探索多语种对话语音理解,参赛团队都有机会通过优秀的技术方案获得奖励,并在国际竞赛平台上展示研究成果与系统能力。
随着竞赛持续推进,本届MLC-SLM竞赛正吸引全球范围内的优秀团队加入。值得关注的是,众多国内外顶尖企业、知名高校纷纷组队报名,展现出国际头部科技企业与金融机构相关技术人才对多语种语音大模型方向的高度关注。
从 AI 基础设施、智能客服,到会议理解、跨语言协作与金融服务,多语种对话语音语言模型正在成为产业界重点关注的技术方向。头部机构相关技术人才的参与,也进一步提升了本届竞赛的国际化程度、技术竞争强度与行业影响力。
即刻加入,抢占实验优化窗口
基线系统已发布,奖金激励已公布,实验窗口已经开启。现在报名参赛,可以更早复现基线结果、规划技术路线,并为后续评测集发布、排行榜提交和论文产出预留更充分的优化时间。
欢迎高校、科研机构、企业团队及个人研究者参与本届MLC-SLM竞赛,在真实多语种对话语音场景中验证技术实力,展示研究成果,冲击排行榜与优秀团队奖励。
期待你的加入!
欲了解更多竞赛信息,请点击☛竞赛官网链接,或扫描下方二维码加入官方竞赛群。
