10万组汉维平行语料数据

汉维平行语料数据包括10万组汉语、维语平行互译语料,数据存储格式为txt文档,数据流利度和忠诚度在80%以上。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。

数据规格

存储格式
TXT
数据内容
汉维平行语料
数据规模
10万对汉维平行语料
语言
汉语、维语
应用场景
机器翻译

样例展示