平衡特征 URL 数据集

数据集含 16 万个 URL 样本,良性与恶意样本各 8 万,实现完美平衡。数据集经精心构建,含 24 个特征,基于词汇、结构和熵等,无需预处理即可用于训练评估机器学习模型检测网络钓鱼 URL。适用于高精度分类、特征分析及对抗性研究等,助力提升网络安全威胁检测能力。

行业:
教育
国标分类:
行业通识数据集
0
4
2026-04-30

数据集介绍

数据属性

数据模态
文本 表格
数据格式
CSV
记录数/样本数
16万条记录
文件数量
1
总大小
23.77 MB
数据语言
英文
地理覆盖范围
不适用
时间覆盖范围
不适用
数据更新频率
静态(不再更新)
数据采集方式
数据合成
预期用途
微调
标注状态
完全标注
标注类型
分类标签 实例分割 关键点标注
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future