1,282万组中韩平行语料数据
1282万组中韩平行互译语料,数据存储格式为txt文档,覆盖口语、旅游、新闻、金融等多个领域。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。
数据规格
存储格式
txt
数据内容
中韩平行语料
数据规模
1,282万对中韩平行语料数据,中文部分平均句长25.7字
语言
汉语、韩语
准确率
90%
应用场景
机器翻译
样例展示

1282万组中韩平行互译语料,数据存储格式为txt文档,覆盖口语、旅游、新闻、金融等多个领域。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。