本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格
本数据集是一个合成数据集,旨在研究人工智能在教育领域应用的影响。数据整合了学生的人口背景、学习习惯、AI工具使用模式以及课程成绩、考试成绩等学业表现,构建了学生个体层面的完整画像。其核心目标是探究AI工具采纳的群体差异、使用强度与学习成效的关联,并识别影响学业表现的关键因素。本数据集适用于探索性分析、相关性研究、可视化及构建分类或回归预测模型,是评估教育技术与开展数据驱动教学研究的实用工具。
教育
图像
表格
图&网络
本数据集源自联合国粮农组织的官方数据,追踪了2017-2024年全球175个国家健康饮食成本的动态变化。数据以购买力平价美元为单位,提供了每日及年度健康饮食成本、蔬菜与水果成本分量等指标,并包含国家代码、区域分类及成本等级等多维信息。借此,研究者可深入分析全球食物安全、营养经济学、贫困与饮食可负担性等议题,尤其适用于评估可持续发展目标的进展,以及量化研究新冠疫情和全球通胀对食品价格的冲击效应。
其他
图像
表格
本数据集是一个合成生成的全球气候模拟数据集,提供了涵盖温度变化、温室气体排放及海平面上升等多维指标。其模拟了全球各国/地区的平均气温、CO₂排放、海平面上升、洪旱风险、降雨变异及空气质量等多维指标,并集成了综合性气候风险评分。通过高度仿真的结构化数据,其旨在支持气候变化趋势分析、极端天气风险评估、环境政策模拟以及相关机器学习预测模型的开发与教学,为理解和应对气候危机提供一个安全可控的数据分析平台。
其他
图像
表格
本数据集是一个合成生成的全球性死亡记录集合,旨在安全地模拟现实世界的死亡统计模式。其覆盖多国、多年龄段、不同性别群体,变量包括地区、年份、年龄、性别、主要死因、死亡人数及标准化死亡率。通过构建涵盖癌症、伤害、传染病等主要死因的模拟记录,为探索死因趋势、仿真公共卫生场景、进行人口统计学可视化以及训练机器学习分类与聚类模型提供了结构化、无隐私风险的数据基础,是开展流行病学与数据科学交叉研究的理想工具。
其他
图像
表格
本数据集是一个专为时间序列预测与金融分析任务设计的结构化数据集,包含近五年黄金期货市场的每日交易数据。数据除提供开盘价、最高价、最低价、收盘价及成交量等基础信息外,还集成了移动平均线、波动率、RSI、MACD及布林带等十余种预计算技术指标。其旨在为构建统计预测模型、训练深度学习网络、分析市场波动模式及评估量化策略提供高质量、可直接建模的标准化数据,是金融数据分析与机器学习的理想实践资源。
金融
图像
表格
本数据集是一个合成生成的全球面板数据集,追踪了2015至2025年间全球主要大学毕业生的就业趋势与市场价值演化。数据覆盖多地区知名学府,核心指标包括起薪、短期就业率、热门技能需求指数、雇主声誉及远程工作占比。通过仿真数据,本数据集旨在量化分析数字经济时代技能溢价的变化、评估教育回报、预测就业市场走势,并为研究高等教育与劳动力市场需求匹配度提供关键支撑,是教育经济学与劳动力市场研究的综合工具。
人力资源
图像
表格
本数据集是为客户流失预测建模设计的结构化数据集,旨在通过分析银行客户的人口统计学特征、账户状态、产品使用行为及交易模式,构建能识别高风险流失客户的机器学习模型。数据集的变量明确标识了客户是否已离开银行。通过整合地理分布、信用评分、账户余额、持有产品数量等信息,其为银行提供了一个数据驱动的决策工具,以支持个性化客户挽留策略、资源优化配置及客户生命周期价值管理,是金融科技与客户关系管理领域的经典案例。
金融
图像
表格
本数据集是一个基于世界银行官方指标构建的全球人口面板数据集,收录了1960至2024年间全球、区域及国家三个层面的年度人口统计,形成了长期、一致的面板数据。数据清晰展现了世界人口总量的增长轨迹、不同区域增长差异与各国人口结构的长期演变,为人口趋势分析、公共政策研究、城市规划及可持续发展评估提供了权威的数据基础。本数据集适用于时间序列预测、空间可视化及相关性研究,是理解全球人口变迁的核心资源。
社会治理
图像
表格
本数据集是一个完全合成的行为模拟数据集,旨在探究睡眠习惯、兴奋剂摄入与日间表现间的非线性关联。数据包含30000条记录,通过8个特征变量描述了个体的睡眠时长与质量、当日咖啡因等兴奋剂摄入情况,以及基于标准化任务评估的日间认知与体能表现。通过模拟多因素交互效应,本数据集为探索性数据分析、构建表现预测模型、实践特征工程及研究行为因果关系提供了一个安全、可控且数据质量极高的,适合机器学习与行为科学研究。
其他
图像
表格
本数据集源自联合国粮农组织,记录了1990-2021年全球所有国家及地区由农业生产活动产生的温室气体排放量。数据涵盖了甲烷、二氧化碳、氧化亚氮三种温室气体在农业用地上的年度排放值,采用标准化核算方法,确保跨区域与跨时间的高度可比性。其为量化评估农业对气候变化的贡献、追踪各国减排进展、分析排放结构演变以及支持气候政策模拟与预测建模提供了坚实、标准化的核心数据基础,是农业与气候交叉领域的权威分析资源。
其他
图像
表格
本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格
本数据集是一个合成数据集,旨在研究人工智能在教育领域应用的影响。数据整合了学生的人口背景、学习习惯、AI工具使用模式以及课程成绩、考试成绩等学业表现,构建了学生个体层面的完整画像。其核心目标是探究AI工具采纳的群体差异、使用强度与学习成效的关联,并识别影响学业表现的关键因素。本数据集适用于探索性分析、相关性研究、可视化及构建分类或回归预测模型,是评估教育技术与开展数据驱动教学研究的实用工具。
教育
图像
表格
图&网络
本数据集源自联合国粮农组织的官方数据,追踪了2017-2024年全球175个国家健康饮食成本的动态变化。数据以购买力平价美元为单位,提供了每日及年度健康饮食成本、蔬菜与水果成本分量等指标,并包含国家代码、区域分类及成本等级等多维信息。借此,研究者可深入分析全球食物安全、营养经济学、贫困与饮食可负担性等议题,尤其适用于评估可持续发展目标的进展,以及量化研究新冠疫情和全球通胀对食品价格的冲击效应。
其他
图像
表格
本数据集是一个合成生成的全球气候模拟数据集,提供了涵盖温度变化、温室气体排放及海平面上升等多维指标。其模拟了全球各国/地区的平均气温、CO₂排放、海平面上升、洪旱风险、降雨变异及空气质量等多维指标,并集成了综合性气候风险评分。通过高度仿真的结构化数据,其旨在支持气候变化趋势分析、极端天气风险评估、环境政策模拟以及相关机器学习预测模型的开发与教学,为理解和应对气候危机提供一个安全可控的数据分析平台。
其他
图像
表格
本数据集是一个合成生成的全球性死亡记录集合,旨在安全地模拟现实世界的死亡统计模式。其覆盖多国、多年龄段、不同性别群体,变量包括地区、年份、年龄、性别、主要死因、死亡人数及标准化死亡率。通过构建涵盖癌症、伤害、传染病等主要死因的模拟记录,为探索死因趋势、仿真公共卫生场景、进行人口统计学可视化以及训练机器学习分类与聚类模型提供了结构化、无隐私风险的数据基础,是开展流行病学与数据科学交叉研究的理想工具。
其他
图像
表格
本数据集是一个专为时间序列预测与金融分析任务设计的结构化数据集,包含近五年黄金期货市场的每日交易数据。数据除提供开盘价、最高价、最低价、收盘价及成交量等基础信息外,还集成了移动平均线、波动率、RSI、MACD及布林带等十余种预计算技术指标。其旨在为构建统计预测模型、训练深度学习网络、分析市场波动模式及评估量化策略提供高质量、可直接建模的标准化数据,是金融数据分析与机器学习的理想实践资源。
金融
图像
表格
本数据集是一个合成生成的全球面板数据集,追踪了2015至2025年间全球主要大学毕业生的就业趋势与市场价值演化。数据覆盖多地区知名学府,核心指标包括起薪、短期就业率、热门技能需求指数、雇主声誉及远程工作占比。通过仿真数据,本数据集旨在量化分析数字经济时代技能溢价的变化、评估教育回报、预测就业市场走势,并为研究高等教育与劳动力市场需求匹配度提供关键支撑,是教育经济学与劳动力市场研究的综合工具。
人力资源
图像
表格
本数据集是为客户流失预测建模设计的结构化数据集,旨在通过分析银行客户的人口统计学特征、账户状态、产品使用行为及交易模式,构建能识别高风险流失客户的机器学习模型。数据集的变量明确标识了客户是否已离开银行。通过整合地理分布、信用评分、账户余额、持有产品数量等信息,其为银行提供了一个数据驱动的决策工具,以支持个性化客户挽留策略、资源优化配置及客户生命周期价值管理,是金融科技与客户关系管理领域的经典案例。
金融
图像
表格
本数据集是一个基于世界银行官方指标构建的全球人口面板数据集,收录了1960至2024年间全球、区域及国家三个层面的年度人口统计,形成了长期、一致的面板数据。数据清晰展现了世界人口总量的增长轨迹、不同区域增长差异与各国人口结构的长期演变,为人口趋势分析、公共政策研究、城市规划及可持续发展评估提供了权威的数据基础。本数据集适用于时间序列预测、空间可视化及相关性研究,是理解全球人口变迁的核心资源。
社会治理
图像
表格
本数据集是一个完全合成的行为模拟数据集,旨在探究睡眠习惯、兴奋剂摄入与日间表现间的非线性关联。数据包含30000条记录,通过8个特征变量描述了个体的睡眠时长与质量、当日咖啡因等兴奋剂摄入情况,以及基于标准化任务评估的日间认知与体能表现。通过模拟多因素交互效应,本数据集为探索性数据分析、构建表现预测模型、实践特征工程及研究行为因果关系提供了一个安全、可控且数据质量极高的,适合机器学习与行为科学研究。
其他
图像
表格
本数据集源自联合国粮农组织,记录了1990-2021年全球所有国家及地区由农业生产活动产生的温室气体排放量。数据涵盖了甲烷、二氧化碳、氧化亚氮三种温室气体在农业用地上的年度排放值,采用标准化核算方法,确保跨区域与跨时间的高度可比性。其为量化评估农业对气候变化的贡献、追踪各国减排进展、分析排放结构演变以及支持气候政策模拟与预测建模提供了坚实、标准化的核心数据基础,是农业与气候交叉领域的权威分析资源。
其他
图像
表格