中英双语数据集

中英双语数据集为汉语学习(HSK)和机器翻译设计的中英双语平行语料库。包含超过20,000条英文句子及其对应的中文翻译。每条数据都额外标注了汉语拼音和句子核心词汇所属的HSK等级。

行业:
教育
国标分类:
通识数据集
59
50
2026-01-12

数据集介绍

数据属性

数据模态
文本
数据格式
TXT
记录数/样本数
111820
文件数量
3
总大小
3.31MB
地理覆盖范围
中国大陆
时间覆盖范围
至今
数据更新频率
静态(不再更新)
数据采集方式
公开网络爬取
预期用途
预训练
标注状态
完全未标注
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future