100万道中文编程试题数据集 | 覆盖Python/C++/Java/JS等多种语言

本数据集提供超过100万道高质量中文编程试题,涵盖Python、Java、C/C++、JavaScript等多种主流语言。每道试题均包含问题、代码答案、详细解析及语言标签,经过深度结构化处理,是训练和增强代码大模型、构建智能编程辅助工具与自动化评测系统的核心数据集。

数据规格

数据内容
代码试题文本数据
数据规模
约100万道
数据字段
包含问题、答案和语言字段
数据类别
c, c++, java, python, javascript
存储格式
Jsonl
语言
中文
数据处理
解析了问题及答案等字段,内容也做了清洗

样例展示