大型语言模型越狱攻击风险评测中文数据集

JailBench 是针对大型语言模型在中文语境下越狱攻击风险的综合性多领域安全评测数据集,面向《网络安全技术 生成式人工智能服务安全基本要求》 训练数据及生成内容的主要安全风险 标准分类设计,是目前公开发布题库规模最大,越狱攻击手段覆盖最为广泛的中文评测数据集。

行业:
社会治理
国标分类:
行业专识数据集
6
8
2025-12-03

数据集介绍

数据属性

数据模态
文本 表格
数据格式
CSV
记录数/样本数
约2160
文件数量
1
总大小
约3MB
时长
1212
数据语言
中国
地理覆盖范围
中国大陆
时间覆盖范围
2024年至今
数据更新频率
静态(不再更新)
数据采集方式
公共数据集获取 线下采集
预期用途
评估
标注状态
完全标注
标注类型
分类标签 目标检测框
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future