罗马乌尔都语-NLP-情感数据集

罗马乌尔都语-NLP-情感数据集是目前最大的开源罗马乌尔都语情感数据集,含134,052条样本,涵盖积极、中性、消极三种情感类别。数据源自社交媒体和聊天文本,包含俚语、混合英语等真实语言特征,采用模型辅助+人工验证的混合标注方式,质量可靠。适用于情感分析、低资源语言建模等NLP任务,支持学术与商业使用,填补了罗马乌尔都语情感数据集的空白。

行业:
教育
国标分类:
行业通识数据集
17
16
2026-03-12

数据集介绍

数据属性

数据模态
文本 表格
数据格式
CSV
记录数/样本数
134052条记录
文件数量
1
总大小
11.71 MB
时长
不适用
数据语言
英文
地理覆盖范围
不适用
时间覆盖范围
不适用
数据更新频率
静态(不再更新)
数据采集方式
公开网络爬取
预期用途
预训练 微调
标注状态
完全标注
标注类型
文本情感分类
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future