权威发布 | 数据堂教育行业案例入选北京市行业高质量数据集典型案例
作者:数据堂发布时间:2025-07-16
近期,2025年全球数字经济大会在北京隆重召开。北京市政数据局主办的第四届数据要素发展论坛围绕“以改革创新加速数据价值释放”为主题,通过创新成果展示、中外嘉宾思想碰撞、圆桌对话交流、区域合作等形式,系统展示了我市在数据要素市场高质量发展的创新实践成果。数据堂《教育高质量数据集关键技术、平台研发及应用》案例成功入选北京市行业高质量数据集典型案例,并在本论坛公开发布。

此次评选是由北京市政务服务和数据管理局组织发起,经权威专家严格评审筛选,最终形成19项高质量数据典型案例和34项高质量数据集资源成果,涵盖科技创新、医疗、政务、交通、教育等重点领域,集中展现了北京市在数据采集标准化、标注规范化、应用场景化等方面的实践成果。

数据堂《教育高质量数据集关键技术、平台研发及应用》案例主要围绕教育多模态大模型训练数据的多模态语义表征对齐、半自动数据智能标注、多维度训练数据集质量评测等关键技术进行研究,突破高质量的中文多模态训练数据资源生产关键技术瓶颈,研发形成了中文多模态大模型训练数据分布式自动采集、标注工具及平台,构建教育行业高质量多模态高质量数据集。本案例实现了教育行业多模态大模型数据集建设技术、平台创新及应用落地和教育行业多模态大模型训练数据自主保障。
本次成功入选,彰显了数据堂在教育行业数据的领先优势与行业标杆地位。未来,数据堂将持续深耕教育场景,迭代技术平台,携手生态伙伴共建标准化、可持续的高质量数据服务,为我国教育数字化转型提供坚实的数据基座与范式引领。