维普中文学术期刊语料数据

维普拥有7800万高质量中文学术期刊数据,覆盖全科学领域,拥有合规版权,可用于各类基础大模型、垂类/细分行业模型训练。

行业:
全行业领域
国标分类:
通识数据集
15
172
2025-11-19

数据集介绍

数据属性

数据模态
文本 表格
数据格式
JSON PDF
记录数/样本数
7800万篇
文件数量
7800万
总大小
60TB
数据语言
中文简体
地理覆盖范围
中国大陆
时间覆盖范围
1989年至今
数据更新频率
每日
数据采集方式
版权签约+自有加工
预期用途
预训练 微调
标注状态
完全标注
标注类型
分类标签 关系标注
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
数 据 驱 动 未 来
Data Drives The Future