1.3亿道小学到大学中文试题文本结构化解析处理数据
1.3亿道小学到大学中文试题文本数据,K12试题数据总量2,087万道(其中带解析1,600万道),大学和职业试题数据总量1.17亿道(其中带解析700万道);K12试题包含数据质量级别,题型,学段,题目难度,年级,科目,答案,解析等字段;大学和职业试题包含答案,解析,类别等字段;K12试题学段为小学、初中和高中,科目为语文、数学、英语、历史、地理、政治、生物、物理、化学和科学;大学和职业试题领域为公安、公考、医学、外语、学历、工程、教育、法律、经济、职业、计算机、资格和金融等;题型包含多项选择题、单项选择题、判断题、填空题等;该数据可用于大模型学科知识增强任务
数据规格
数据内容
K12试题数据+大学和职业试题数据
数据规模
K12试题数据总量1763万道(其中带解析1636万道);大学和职业试题数据总量1.17亿道
数据字段
K12试题包含数据质量级别,题型,学段,题目难度,年级,科目,问题,答案,解析等字段;大学和职业试题包含问题,答案,解析等字段
专业类别
K12试题学段为小学、初中和高中,科目为语文、数学、英语、历史、地理、政治、生物、物理、化学和科学;大学和职业试题领域为公安、公考、医学、外语、学历、工程、教育、法律、经济、职业、计算机、资格和金融
K12试题学段为小学、初中和高中,科目为语文、数学、英语、历史、地理、政治、生物、物理、化学和科学;大学和职业试题领域为公安、公考、医学、外语、学历、工程、教育、法律、经济、职业、计算机、资格和金融
题型类别
多项选择题、单项选择题、判断题、填空题等
存储格式
Jsonl
语言
中文
数据处理
解析了分类、题干、选项、答案、解析过程等,做了公式latex转换和表格格式转换,内容也做了清洗
样例展示


