东盟国家本地人文SFT数据集

本数据集涵盖:缅甸、越南、柬埔寨、马来西亚、印度尼西亚、泰国、老挝、新加坡、菲律宾、文莱等国家的通识类SFT。所有数据都基于本地人文、历史、通识类数据构成,不掺杂非本国内容的公共内容,每国SFT存储量超过15万条。

行业:
人文历史通识
国标分类:
通识数据集
41
50
2025-12-14

数据集介绍

数据属性

数据模态
文本
数据格式
JSON Parquet
记录数/样本数
150万条
文件数量
10
总大小
1GB
地理覆盖范围
东盟国家:缅甸、越南、柬埔寨、马来西亚、印度尼西亚、泰国、老挝、新加坡、菲律宾、文莱
时间覆盖范围
2024年至今
数据更新频率
每季度
数据采集方式
用户生成内容(UGC) 公开网络爬取 数据合成 线下采集
预期用途
微调
标注状态
完全标注
标注类型
分类标签
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future