cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

1625

_AI数据集产品_数据堂

3,100万条东南亚语种新闻文本数据_3,100万条东南亚语种新闻文本数据

3,100万条东南亚语种新闻文本数据

  • 经授权许可的成品数据集助力快速启动AI项目

本数据集为东南亚多语种新闻数据,涵盖印尼语、马来语、泰语和越南语四种语言。数据总量超过3100万条,数据以JSONL格式存储,每条记录独立成行,便于高效读取与处理。数据来源广泛,涉及各类新闻主题,能够全面反映东南亚地区的社会动态、文化热点与经济趋势。本数据集可助力大模型提升多语言能力,丰富文化知识,优化性能,拓展东南亚行业应用,推动跨语言研究。

购买咨询 获取样例

数据规格

语种
印尼语,马来语,泰语,越南语
数据量
印尼语14447771条,马来语1239420条,泰语6467564条,越南语8942813条,总量3100万+条
字段
URL,title,published_time,article_content,category
格式
JSONL

样例展示

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

335,000组东南亚语种多轮对话文本数据
335,000组东南亚语种多轮对话文本数据
1,000万道英文试题文本数据结构化解析处理数据
1,000万道英文试题文本数据结构化解析处理数据
1.2亿条多编程语言代码数据集
1.2亿条多编程语言代码数据集
9万组多领域客服对话文本数据
9万组多领域客服对话文本数据

数据亮点

3,100万条东南亚语种新闻文本数据

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

3,100万条东南亚语种新闻文本数据