真假人类语音-深度伪造音频数据集

数据集包含 5000 个音频文件,涵盖真实人类录音与 AI 生成的语音样本,涉及 4 位说话者,支持 M4A、MP3 格式。主要用于深度伪造检测、生成语音分析、真假语音识别等任务,适用于网络安全、语音认证、媒体诚信等场景的模型开发与技术研究。

行业:
社会治理
国标分类:
行业通识数据集
0
12
2026-06-12

数据集介绍

数据属性

数据模态
音频
数据格式
MP4 MP3
记录数/样本数
5000个音频
文件数量
5000个文件
总大小
约2.5GB
时长
约70h
地理覆盖范围
不适用
时间覆盖范围
无特定时间点
数据更新频率
静态(不再更新)
数据采集方式
数据合成
预期用途
微调
标注状态
完全标注
标注类型
分类标签 语音转写
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future