本数据集包含 1,500 条均衡样本,覆盖正常、单元损坏、长度偏差、接触不良、形变、湿度 6 类状态,提供 S11、VSWR、增益、效率等 7 项射频电磁特征。数据已标准化、标签编码,无缺失值与泄露风险,可直接用于天线故障分类、故障类型识别、射频设备智能监测、预测性维护与通信设备机器学习建模。
制造
文本
表格
本数据集涵盖全球 50 个国家五年每日数据,共约 91000 行,整合气候、能源、工业等多维度指标。数据模拟真实季节趋势与变量关联,无缺失值,适用于能源消耗预测、气候与能源关联分析、二氧化碳排放建模、可持续发展研究及机器学习回归、可视化等场景,是环保与能源领域数据分析的优质实战数据集。
能源
文本
表格
本数据集共 5000 条记录,基于临床逻辑仿真构建,涵盖人口、社会经济、饮食、睡眠、运动、环境等 25 个特征,目标变量为抑郁严重程度。数据含统计显著关联、缺失值与高斯噪声,适用于心理健康分类建模、特征工程、生活方式风险分析、临床统计学习与数据科学教学实践。
医疗
文本
表格
本数据集模拟真实场景的借款人财务、人口统计与行为特征数据,包含年龄、收入、信用评分、学历、就业类型等关键指标,目标变量为贷款是否获批。数据结构规范、贴近金融机构实际风控逻辑。适用于违约预测、信用评分、自动化审批、金融风险建模、分类算法训练与教学科研等场景。
金融
文本
表格
本数据集包含 20000 块锂离子电芯的生产、传感、电气与 NLP 文本数据,模拟真实电池制造因果逻辑与传感器噪声。数据含缺失值、时序漂移、多模态文本与分类目标,可用于预测性维护、缺陷分类、数据插补、多模态建模与智能制造质量预测研究,是工业质检与机器学习实战的优质数据集
制造
文本
表格
本数据集覆盖 200 余个国家,包含多年度全球贸易核心指标与货币汇率数据,形成标准化宏观面板数据。数据结构清晰、质量均衡,适用于贸易分析、汇率建模、国际收支研究与金融风险评估,可直接用于面板回归、时间序列预测、深度学习模型及宏观经济类竞赛与学术研究。
金融
文本
表格
本数据集为全球漫画数据集(2000–2026),共收录 10,000 条漫画记录,覆盖日漫、韩漫、国漫、漫威、DC、独立漫画及欧洲漫画。包含 17 个结构化字段,涵盖作品信息、作者、出版社、年份、类型、评分、页数、色彩风格等。数据来源规范、格式简洁、覆盖地域广泛、时间跨度长,适用于探索性分析、可视化、机器学习建模与文化产业研究。
其他
文本
表格
本数据集为中东经济与油价平衡面板数据集(1990–2024),覆盖 13 个国家 35 年连续观测数据,包含 GDP、进出口、外资、通胀、失业率、预期寿命等宏观指标,并匹配同期布伦特原油价格。数据来源权威、结构规范、时序完整,可用于分析油价波动、地区冲突与战争对经济的影响,适用于时间序列建模、区域经济研究、政策分析与可视化展示。
能源
文本
表格
本数据集为汽车燃油效率与 CO₂排放数据集,包含 600 条标准化行程记录,覆盖 25 辆汽车与 3 种燃油类型。每条记录包含行驶距离、时长、平均速度、油耗、燃油成本、每公里成本、二氧化碳排放及效率指标。数据已清洗、结构清晰、指标丰富,适合燃油效率分析、排放建模、成本优化、可视化展示与机器学习预测,是交通与环保方向数据分析的优质实战数据集。
交通
文本
表格
罗马乌尔都语-NLP-情感数据集是目前最大的开源罗马乌尔都语情感数据集,含134,052条样本,涵盖积极、中性、消极三种情感类别。数据源自社交媒体和聊天文本,包含俚语、混合英语等真实语言特征,采用模型辅助+人工验证的混合标注方式,质量可靠。适用于情感分析、低资源语言建模等NLP任务,支持学术与商业使用,填补了罗马乌尔都语情感数据集的空白。
教育
文本
表格
本数据集提供多台电机在真实工况下的时序传感器数据,包含正常运行与多种典型故障状态。数据带时间戳,涵盖电流、电压、温度、振动等关键监测指标与运行参数,可直接用于故障检测、效率分析、寿命预测与异常识别,是工业物联网、设备预测性维护与机器学习建模的优质数据集。
制造
文本
表格
本数据集是 UCI 开源的字母识别专用数据集,专为支持向量机解决 26 个英文字母的多分类任务打造,含 20000 条样本、16 个整数型特征。样本由 20 种字体经随机畸变生成,通过图像处理提取字符外接框、像素分布、边缘计数等特征,无缺失值,数据规范,是字符识别、机器学习多分类任务的经典基准数据集。可用于字符识别算法性能验证、多分类模型调优及机器学习教学案例开发等场景。
教育
文本
表格
本数据集为战争经济与民生影响数据集,含 10 万条合成数据,覆盖二战至 2025–2026 年各类冲突。包含冲突信息、失业、贫困、GDP、通胀、货币贬值、黑市规模等多维度指标,真实反映战争对经济与民生的冲击。数据结构完整、指标关联合理,适用于经济建模、人道主义援助分析、机器学习预测、学术研究与政策制定。
社会治理
文本
表格
本数据集收录多平台网红营销活动数据,涵盖 Instagram、YouTube、TikTok、Twitter 等渠道。每条记录包含活动信息、网红垂类、互动量、触达人数、销量、活动时长等关键字段,数据规范完整,可直接用于 ROI 计算、效果对比、趋势分析与投放策略优化,适合营销分析、市场研究与机器学习建模使用。
其他
文本
表格
本数据集是一个大规模、多来源的人类癌症单细胞RNA测序数据集,以标准化的H5AD格式和统一的本体映射(UBERON/MONDO)组织,旨在为肿瘤微环境解析、跨图谱整合及计算方法开发提供高质量、可互操作的数据资源。
医疗
生物&化学
本数据集专注研究背景噪声与人类专注力的关联,包含多组不同噪声环境下的注意力与认知表现观测数据,涵盖噪声强度、声音类型、专注度得分、任务完成效率等维度。数据结构规范、格式干净,支持探索性分析、可视化与机器学习建模,适用于心理学、环境科学、数据科学等领域的研究与教学。
教育
文本
表格
本数据集为竞赛数学问题数据集,包含 12000 + 道覆盖代数等知识点的竞赛数学题,每条数据均含题目描述、1-5 级难度标注、题目类型及分步详细解答。题目难度从基础计算到复杂多步骤竞赛题梯度分布,数据维度完整、标注规范,可直接用于 AI 模型的数学解题、推理能力训练,以及模型解题效果的评估验证。
教育
文本
表格
数据集聚焦 “自然语言 Python 问题 - 代码” 匹配场景,包含 13000 + 条唯一数据样本,核心由 “人类易懂的 Python 问题描述” 和 “对应可执行的 Python 代码” 两列构成。数据覆盖多样化的 Python 编程问题场景,标注精准且无重复样本,专为大语言模型(LLM)的 Python 代码相关能力训练打造,可直接用于模型的训练、微调与效果验证。
教育
文本
表格
本数据集含10000 张验证码图片,每张图片对应10 位随机字符串,文件名即为验证码文本标注,无需额外标签。验证码字符颜色随机、对齐随机,贴近真实场景。数据规范、质量稳定,可直接用于验证码识别、OCR 模型训练、字符检测与算法验证,使用便捷、适用性广。
教育
图像
本数据集包含10000条以上零售业务交易记录,涵盖详细的销售信息,核心包括营收、成本、利润、商品类别、客户细分及支付方式等关键维度,数据完整且贴合零售业务场景。该数据集非常适用于:商业智能项目、Power BI和Tableau仪表盘制作、销售业绩分析、盈利能力分析、机器学习实践,为各类相关任务及商业决策提供精准、实用的基础数据支撑。
消费
表格
航空业是全球成本最高的行业之一。理解航线特征、运营成本与盈利能力之间的关系,对航线网络规划、机队优化和收益管理至关重要。本数据集模拟了一家以迪拜(DXB)为枢纽的中东大型航空公司一整年的航班级财务数据,涵盖 30 条航线,包括短途、中途和长途航线。可用于航司收益管理建模、航线效益评估与枢纽网络运营优化等研究与决策场景。
交通
文本
表格
本数据集包含 1,500 条均衡样本,覆盖正常、单元损坏、长度偏差、接触不良、形变、湿度 6 类状态,提供 S11、VSWR、增益、效率等 7 项射频电磁特征。数据已标准化、标签编码,无缺失值与泄露风险,可直接用于天线故障分类、故障类型识别、射频设备智能监测、预测性维护与通信设备机器学习建模。
制造
文本
表格
本数据集涵盖全球 50 个国家五年每日数据,共约 91000 行,整合气候、能源、工业等多维度指标。数据模拟真实季节趋势与变量关联,无缺失值,适用于能源消耗预测、气候与能源关联分析、二氧化碳排放建模、可持续发展研究及机器学习回归、可视化等场景,是环保与能源领域数据分析的优质实战数据集。
能源
文本
表格
本数据集共 5000 条记录,基于临床逻辑仿真构建,涵盖人口、社会经济、饮食、睡眠、运动、环境等 25 个特征,目标变量为抑郁严重程度。数据含统计显著关联、缺失值与高斯噪声,适用于心理健康分类建模、特征工程、生活方式风险分析、临床统计学习与数据科学教学实践。
医疗
文本
表格
本数据集模拟真实场景的借款人财务、人口统计与行为特征数据,包含年龄、收入、信用评分、学历、就业类型等关键指标,目标变量为贷款是否获批。数据结构规范、贴近金融机构实际风控逻辑。适用于违约预测、信用评分、自动化审批、金融风险建模、分类算法训练与教学科研等场景。
金融
文本
表格
本数据集包含 20000 块锂离子电芯的生产、传感、电气与 NLP 文本数据,模拟真实电池制造因果逻辑与传感器噪声。数据含缺失值、时序漂移、多模态文本与分类目标,可用于预测性维护、缺陷分类、数据插补、多模态建模与智能制造质量预测研究,是工业质检与机器学习实战的优质数据集
制造
文本
表格
本数据集覆盖 200 余个国家,包含多年度全球贸易核心指标与货币汇率数据,形成标准化宏观面板数据。数据结构清晰、质量均衡,适用于贸易分析、汇率建模、国际收支研究与金融风险评估,可直接用于面板回归、时间序列预测、深度学习模型及宏观经济类竞赛与学术研究。
金融
文本
表格
本数据集为全球漫画数据集(2000–2026),共收录 10,000 条漫画记录,覆盖日漫、韩漫、国漫、漫威、DC、独立漫画及欧洲漫画。包含 17 个结构化字段,涵盖作品信息、作者、出版社、年份、类型、评分、页数、色彩风格等。数据来源规范、格式简洁、覆盖地域广泛、时间跨度长,适用于探索性分析、可视化、机器学习建模与文化产业研究。
其他
文本
表格
本数据集为中东经济与油价平衡面板数据集(1990–2024),覆盖 13 个国家 35 年连续观测数据,包含 GDP、进出口、外资、通胀、失业率、预期寿命等宏观指标,并匹配同期布伦特原油价格。数据来源权威、结构规范、时序完整,可用于分析油价波动、地区冲突与战争对经济的影响,适用于时间序列建模、区域经济研究、政策分析与可视化展示。
能源
文本
表格
本数据集为汽车燃油效率与 CO₂排放数据集,包含 600 条标准化行程记录,覆盖 25 辆汽车与 3 种燃油类型。每条记录包含行驶距离、时长、平均速度、油耗、燃油成本、每公里成本、二氧化碳排放及效率指标。数据已清洗、结构清晰、指标丰富,适合燃油效率分析、排放建模、成本优化、可视化展示与机器学习预测,是交通与环保方向数据分析的优质实战数据集。
交通
文本
表格
罗马乌尔都语-NLP-情感数据集是目前最大的开源罗马乌尔都语情感数据集,含134,052条样本,涵盖积极、中性、消极三种情感类别。数据源自社交媒体和聊天文本,包含俚语、混合英语等真实语言特征,采用模型辅助+人工验证的混合标注方式,质量可靠。适用于情感分析、低资源语言建模等NLP任务,支持学术与商业使用,填补了罗马乌尔都语情感数据集的空白。
教育
文本
表格
本数据集提供多台电机在真实工况下的时序传感器数据,包含正常运行与多种典型故障状态。数据带时间戳,涵盖电流、电压、温度、振动等关键监测指标与运行参数,可直接用于故障检测、效率分析、寿命预测与异常识别,是工业物联网、设备预测性维护与机器学习建模的优质数据集。
制造
文本
表格
本数据集是 UCI 开源的字母识别专用数据集,专为支持向量机解决 26 个英文字母的多分类任务打造,含 20000 条样本、16 个整数型特征。样本由 20 种字体经随机畸变生成,通过图像处理提取字符外接框、像素分布、边缘计数等特征,无缺失值,数据规范,是字符识别、机器学习多分类任务的经典基准数据集。可用于字符识别算法性能验证、多分类模型调优及机器学习教学案例开发等场景。
教育
文本
表格
本数据集为战争经济与民生影响数据集,含 10 万条合成数据,覆盖二战至 2025–2026 年各类冲突。包含冲突信息、失业、贫困、GDP、通胀、货币贬值、黑市规模等多维度指标,真实反映战争对经济与民生的冲击。数据结构完整、指标关联合理,适用于经济建模、人道主义援助分析、机器学习预测、学术研究与政策制定。
社会治理
文本
表格
本数据集收录多平台网红营销活动数据,涵盖 Instagram、YouTube、TikTok、Twitter 等渠道。每条记录包含活动信息、网红垂类、互动量、触达人数、销量、活动时长等关键字段,数据规范完整,可直接用于 ROI 计算、效果对比、趋势分析与投放策略优化,适合营销分析、市场研究与机器学习建模使用。
其他
文本
表格
本数据集是一个大规模、多来源的人类癌症单细胞RNA测序数据集,以标准化的H5AD格式和统一的本体映射(UBERON/MONDO)组织,旨在为肿瘤微环境解析、跨图谱整合及计算方法开发提供高质量、可互操作的数据资源。
医疗
生物&化学
本数据集专注研究背景噪声与人类专注力的关联,包含多组不同噪声环境下的注意力与认知表现观测数据,涵盖噪声强度、声音类型、专注度得分、任务完成效率等维度。数据结构规范、格式干净,支持探索性分析、可视化与机器学习建模,适用于心理学、环境科学、数据科学等领域的研究与教学。
教育
文本
表格
本数据集为竞赛数学问题数据集,包含 12000 + 道覆盖代数等知识点的竞赛数学题,每条数据均含题目描述、1-5 级难度标注、题目类型及分步详细解答。题目难度从基础计算到复杂多步骤竞赛题梯度分布,数据维度完整、标注规范,可直接用于 AI 模型的数学解题、推理能力训练,以及模型解题效果的评估验证。
教育
文本
表格
数据集聚焦 “自然语言 Python 问题 - 代码” 匹配场景,包含 13000 + 条唯一数据样本,核心由 “人类易懂的 Python 问题描述” 和 “对应可执行的 Python 代码” 两列构成。数据覆盖多样化的 Python 编程问题场景,标注精准且无重复样本,专为大语言模型(LLM)的 Python 代码相关能力训练打造,可直接用于模型的训练、微调与效果验证。
教育
文本
表格
本数据集含10000 张验证码图片,每张图片对应10 位随机字符串,文件名即为验证码文本标注,无需额外标签。验证码字符颜色随机、对齐随机,贴近真实场景。数据规范、质量稳定,可直接用于验证码识别、OCR 模型训练、字符检测与算法验证,使用便捷、适用性广。
教育
图像
本数据集包含10000条以上零售业务交易记录,涵盖详细的销售信息,核心包括营收、成本、利润、商品类别、客户细分及支付方式等关键维度,数据完整且贴合零售业务场景。该数据集非常适用于:商业智能项目、Power BI和Tableau仪表盘制作、销售业绩分析、盈利能力分析、机器学习实践,为各类相关任务及商业决策提供精准、实用的基础数据支撑。
消费
表格
航空业是全球成本最高的行业之一。理解航线特征、运营成本与盈利能力之间的关系,对航线网络规划、机队优化和收益管理至关重要。本数据集模拟了一家以迪拜(DXB)为枢纽的中东大型航空公司一整年的航班级财务数据,涵盖 30 条航线,包括短途、中途和长途航线。可用于航司收益管理建模、航线效益评估与枢纽网络运营优化等研究与决策场景。
交通
文本
表格