100万组中俄平行语料数据
100万组中俄平行互译语料,数据存储格式为txt文档,覆盖旅游、医药、日常、电视剧等多个领域。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。
数据规格
储存格式
TXT
数据内容
中俄平行语料
数据规模
100万对中俄平行语料数据,中文句长平均14.6个字符
语言
汉语,俄语
应用场景
机器翻译
样例展示

100万组中俄平行互译语料,数据存储格式为txt文档,覆盖旅游、医药、日常、电视剧等多个领域。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。