温室作物产量数据集含超 10000 条模拟记录,20 个结构化字段,涵盖 4 种常见作物。数据模拟真实缺陷,如缺失值、重复值等。适用于农业科研人员建模预测产量,分析环境及管理因素影响;也适合数据处理学习者练习清理数据,提升技能;还能助力高校教学实践,加深学生对农业数据处理的理解 。
农业
文本
表格
该数据集模拟类Netflix流媒体平台用户行为,包含5万名用户、20个行为及人口统计特征,涵盖用户人口信息、订阅详情、设备使用、观看习惯及流失指标等。数据为真实模拟生成,适用于机器学习、推荐系统开发、用户行为分析、流失预测、观众聚类细分等场景,可支撑有监督与无监督学习任务,供教育和研究使用。
其他
文本
表格
该数据集整合QS 2026、THE 2026、ARWU 2025三大主流世界大学排名,包含57所院校、20个国家、30个数据列,涵盖院校基本信息、各项排名及细分指标、诺奖得主等数据,18所院校同时入选三大排名。使用场景广泛,可用于机器学习、院校对比分析、地理分布可视化、择校推荐及学术研究、政策制定等。
教育
文本
表格
本数据集包含联合国教科文组织认证的全球1200多处世界遗产信息,覆盖168个国家,涵盖遗产名称、所在国家、类别、列入年份、经纬度、保护面积、濒危状态、区域分类及简介等核心字段。数据官方权威、结构完整、覆盖面广,适用于地理可视化、分布规律分析、文化与自然遗产研究、时空趋势挖掘及濒危遗产评估。
能源
文本
表格
本数据集包含 121 只患病猫咪在家庭环境下采集的 6783 条血糖记录,涵盖血糖值、时间、胰岛素剂量与类型等信息,数据为长期纵向实测。数据真实、场景贴近日常饲养环境,可用于血糖时序分析、低血糖风险预测、昼夜节律研究及兽医数字健康、生理数据机器学习建模,是动物医疗与 AI 健康领域的典型数据集。
医疗
文本
表格
本数据集包含多个城市水源(自来水、过滤水等)中分离出的微塑料带标签显微镜图像,经专业实验室处理获得。适用于计算机视觉领域的图像分割、目标检测、形态分类模型训练,以及环境AI研究,为微塑料自动化监测与环境治理提供数据支撑。
医疗
图像
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集是面向开发者与金融机构的全球金融市场一站式数据集,覆盖沪深港美股、外汇、指数及宏观经济领域,包含 K 线、分时、Tick、财务报表、基本面等多维金融数据,依托 100 + 国家 / 地区数据源构建,具备毫秒级更新、99.9% SLA 稳定性、金融级加密的特性,可一站式满足金融投研、量化交易、金融产品开发等场景的全维度数据需求
金融
文本
本数据集收录2020–2026年arXiv平台的10,000篇人工智能与机器学习论文,包含论文编号、标题、作者、发表时间、研究分类、摘要、PDF链接等12项信息,通过官方API采集,数据权威规范。适用于文本分类、AI研究趋势分析、学术推荐系统搭建、NLP实验与机器学习建模,是人工智能领域科研、教学与实践的优质标准化数据集。
教育
文本
表格
本数据集收录投保人年龄、性别、BMI、吸烟情况、子女数量、居住区域及实际医疗花费等结构化信息。数据干净规整、变量具备现实意义,主要用于医疗花费预测、保险风险评估、特征影响分析与回归建模,是医疗健康分析、保险金融、机器学习教学与科研中常用的经典基准数据。
金融
文本
表格
本数据集覆盖2015年3月至2026年3月,包含2762个严格对齐的交易日、43个结构化特征,涵盖七大科技巨头股票数据、市场基准指数及核心宏观经济指标,经专业预处理后无任何缺失值。该数据集适用于定量建模、时间序列预测、波动率分析及市场趋势研判,也可以为金融分析、AI建模与宏观经济交叉的研究提供优质数据支撑。
金融
文本
表格
本数据集包含 211,043 条网络流记录与 44 个特征,覆盖正常流量及后门、DDoS、注入、XSS 等 10 类攻击数据。支持二分类与多分类任务,可用于训练入侵检测模型、开展异常检测研究及特征工程实践,是网络安全领域机器学习建模与教学的优质数据集。
其他
文本
表格
本数据集包含 2026 年 2 月约 2500 条合成热门话题记录,涵盖来源、语言、国家、话题分类、情感、互动量与趋势评分等信息。数据字段定义清晰,CSV 格式标准化,适用于文本分类、情感分析、趋势可视化、互动量建模等 NLP 与数据分析场景。
其他
文本
表格
本数据集为心理健康障碍风险评估数据集,包含 25,000 条合成记录,涵盖人口统计、生活方式、工作学业压力、心理指标、医疗史等多维度特征,目标为三级风险分类。数据结构清晰、特征丰富,适用于心理健康风险预测、早期筛查、AI 辅助评估及心理研究等。
医疗
文本
表格
数据集包含开普勒太空望远镜观测的10000个系外行星候选体记录,涵盖候选体定位、置信度、观测特征等核心信息,配套详细数据字典。适用于天文研究、系外行星特征分析、行星确认验证及天体物理相关学术探索等。
教育
文本
表格
数据集涵盖1946至2025年全球武装冲突相关数据,聚焦战斗死亡人数、区域冲突强度、冲突参与方等核心信息,配套完成数据清洗、趋势分析等预处理工作。适用于地缘政治研究、全球安全分析、冲突预测建模、国际关系学术研究及人道主义相关课题。
教育
文本
表格
本数据集包含1000组高质量信息图与详细文本指令,覆盖布局、字体等设计细节。专为视觉–语言模型与文生图模型设计,可直接用于生成式模型微调、信息图自动生成、布局规划及多模态研究,是信息图AI生成领域的专业训练数据集。
教育
图像
本数据集包含 15,000 条合成重症监护记录,涵盖生命体征、治疗干预、器官功能及预后标签。数据模拟真实 ICU 监测场景,目标为患者死亡状态,适用于死亡率预测、病情恶化预警、临床风险建模、不平衡分类学习及医疗 AI 研究。
医疗
文本
表格
本数据集含 10,000+ 条合成对话,覆盖煤气灯效应、道德绑架、被动攻击等 6 类操控及中性对话,标注情绪评分、人格特征与操控类型。数据结构完整、类别均衡,是对话 AI 安全与心理健康领域的优质数据集。适用于操控文本二分类 / 多分类、实时检测、情绪分析、对话安全建模及社交心理研究。
教育
文本
本数据集包含 50,000 条结构化商务文本记录,涵盖邮件、报告、谈判对话等多种形式,覆盖金融、物流等多个商务领域,附带文档类型、受众水平等场景属性。数据专业规范,适用于商务英语语料分类、语言模式研究、教学资源开发、NLP 文本建模及商务沟通风格分析,是语言学习与自然语言处理的优质数据集。
教育
文本
表格
温室作物产量数据集含超 10000 条模拟记录,20 个结构化字段,涵盖 4 种常见作物。数据模拟真实缺陷,如缺失值、重复值等。适用于农业科研人员建模预测产量,分析环境及管理因素影响;也适合数据处理学习者练习清理数据,提升技能;还能助力高校教学实践,加深学生对农业数据处理的理解 。
农业
文本
表格
该数据集模拟类Netflix流媒体平台用户行为,包含5万名用户、20个行为及人口统计特征,涵盖用户人口信息、订阅详情、设备使用、观看习惯及流失指标等。数据为真实模拟生成,适用于机器学习、推荐系统开发、用户行为分析、流失预测、观众聚类细分等场景,可支撑有监督与无监督学习任务,供教育和研究使用。
其他
文本
表格
该数据集整合QS 2026、THE 2026、ARWU 2025三大主流世界大学排名,包含57所院校、20个国家、30个数据列,涵盖院校基本信息、各项排名及细分指标、诺奖得主等数据,18所院校同时入选三大排名。使用场景广泛,可用于机器学习、院校对比分析、地理分布可视化、择校推荐及学术研究、政策制定等。
教育
文本
表格
本数据集包含联合国教科文组织认证的全球1200多处世界遗产信息,覆盖168个国家,涵盖遗产名称、所在国家、类别、列入年份、经纬度、保护面积、濒危状态、区域分类及简介等核心字段。数据官方权威、结构完整、覆盖面广,适用于地理可视化、分布规律分析、文化与自然遗产研究、时空趋势挖掘及濒危遗产评估。
能源
文本
表格
本数据集包含 121 只患病猫咪在家庭环境下采集的 6783 条血糖记录,涵盖血糖值、时间、胰岛素剂量与类型等信息,数据为长期纵向实测。数据真实、场景贴近日常饲养环境,可用于血糖时序分析、低血糖风险预测、昼夜节律研究及兽医数字健康、生理数据机器学习建模,是动物医疗与 AI 健康领域的典型数据集。
医疗
文本
表格
本数据集包含多个城市水源(自来水、过滤水等)中分离出的微塑料带标签显微镜图像,经专业实验室处理获得。适用于计算机视觉领域的图像分割、目标检测、形态分类模型训练,以及环境AI研究,为微塑料自动化监测与环境治理提供数据支撑。
医疗
图像
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集是面向开发者与金融机构的全球金融市场一站式数据集,覆盖沪深港美股、外汇、指数及宏观经济领域,包含 K 线、分时、Tick、财务报表、基本面等多维金融数据,依托 100 + 国家 / 地区数据源构建,具备毫秒级更新、99.9% SLA 稳定性、金融级加密的特性,可一站式满足金融投研、量化交易、金融产品开发等场景的全维度数据需求
金融
文本
本数据集收录2020–2026年arXiv平台的10,000篇人工智能与机器学习论文,包含论文编号、标题、作者、发表时间、研究分类、摘要、PDF链接等12项信息,通过官方API采集,数据权威规范。适用于文本分类、AI研究趋势分析、学术推荐系统搭建、NLP实验与机器学习建模,是人工智能领域科研、教学与实践的优质标准化数据集。
教育
文本
表格
本数据集收录投保人年龄、性别、BMI、吸烟情况、子女数量、居住区域及实际医疗花费等结构化信息。数据干净规整、变量具备现实意义,主要用于医疗花费预测、保险风险评估、特征影响分析与回归建模,是医疗健康分析、保险金融、机器学习教学与科研中常用的经典基准数据。
金融
文本
表格
本数据集覆盖2015年3月至2026年3月,包含2762个严格对齐的交易日、43个结构化特征,涵盖七大科技巨头股票数据、市场基准指数及核心宏观经济指标,经专业预处理后无任何缺失值。该数据集适用于定量建模、时间序列预测、波动率分析及市场趋势研判,也可以为金融分析、AI建模与宏观经济交叉的研究提供优质数据支撑。
金融
文本
表格
本数据集包含 211,043 条网络流记录与 44 个特征,覆盖正常流量及后门、DDoS、注入、XSS 等 10 类攻击数据。支持二分类与多分类任务,可用于训练入侵检测模型、开展异常检测研究及特征工程实践,是网络安全领域机器学习建模与教学的优质数据集。
其他
文本
表格
本数据集包含 2026 年 2 月约 2500 条合成热门话题记录,涵盖来源、语言、国家、话题分类、情感、互动量与趋势评分等信息。数据字段定义清晰,CSV 格式标准化,适用于文本分类、情感分析、趋势可视化、互动量建模等 NLP 与数据分析场景。
其他
文本
表格
本数据集为心理健康障碍风险评估数据集,包含 25,000 条合成记录,涵盖人口统计、生活方式、工作学业压力、心理指标、医疗史等多维度特征,目标为三级风险分类。数据结构清晰、特征丰富,适用于心理健康风险预测、早期筛查、AI 辅助评估及心理研究等。
医疗
文本
表格
数据集包含开普勒太空望远镜观测的10000个系外行星候选体记录,涵盖候选体定位、置信度、观测特征等核心信息,配套详细数据字典。适用于天文研究、系外行星特征分析、行星确认验证及天体物理相关学术探索等。
教育
文本
表格
数据集涵盖1946至2025年全球武装冲突相关数据,聚焦战斗死亡人数、区域冲突强度、冲突参与方等核心信息,配套完成数据清洗、趋势分析等预处理工作。适用于地缘政治研究、全球安全分析、冲突预测建模、国际关系学术研究及人道主义相关课题。
教育
文本
表格
本数据集包含1000组高质量信息图与详细文本指令,覆盖布局、字体等设计细节。专为视觉–语言模型与文生图模型设计,可直接用于生成式模型微调、信息图自动生成、布局规划及多模态研究,是信息图AI生成领域的专业训练数据集。
教育
图像
本数据集包含 15,000 条合成重症监护记录,涵盖生命体征、治疗干预、器官功能及预后标签。数据模拟真实 ICU 监测场景,目标为患者死亡状态,适用于死亡率预测、病情恶化预警、临床风险建模、不平衡分类学习及医疗 AI 研究。
医疗
文本
表格
本数据集含 10,000+ 条合成对话,覆盖煤气灯效应、道德绑架、被动攻击等 6 类操控及中性对话,标注情绪评分、人格特征与操控类型。数据结构完整、类别均衡,是对话 AI 安全与心理健康领域的优质数据集。适用于操控文本二分类 / 多分类、实时检测、情绪分析、对话安全建模及社交心理研究。
教育
文本
本数据集包含 50,000 条结构化商务文本记录,涵盖邮件、报告、谈判对话等多种形式,覆盖金融、物流等多个商务领域,附带文档类型、受众水平等场景属性。数据专业规范,适用于商务英语语料分类、语言模式研究、教学资源开发、NLP 文本建模及商务沟通风格分析,是语言学习与自然语言处理的优质数据集。
教育
文本
表格