数据集涵盖 1970 年至 2022 年发布的乐高套装信息,包含每套的主题、零件数、推荐年龄、零售价格及图片。适用于分析乐高套装发布数量趋势,探究价格与零件数的关系,挖掘各十年最热门主题,以及研究乐高小人仔与授权套装的关联。为乐高爱好者、市场研究者、行业分析人员等提供数据支持,助力了解乐高产品发展与市场偏好。
消费
文本
表格
数据集涵盖 2015 至 2025 年,卡拉奇中等教育委员会 12 年级计算机科学试卷题目。包含选择题、简答题和长答题,聚焦试卷二理论部分。适用于备考学生系统复习,熟悉题型与考点,教师用于出题、调整教学,研究人员分析出题规律,开发人员构建教育工具,助力计算机科学教学与学习。
教育
文本
表格
现代艺术博物馆(MoMA)馆藏数据集包含 157,630 条记录,覆盖 MoMA 收藏并录入数据库的所有作品。数据集涵盖作品标题、艺术家、创作日期、媒介、尺寸及收购日期等基本元数据,部分记录信息标注 “未经批准”。适用于分析艺术品的 “现代性”、热门艺术家、收购日期趋势及常见艺术品类型等,助力深入了解 MoMA 馆藏特点与艺术发展脉络。
文旅
文本
表格
全球茶与咖啡生活方式数据集为合成数据集,模拟 200 个国家在 2015 - 2024 年的茶与咖啡消费行为。含超 15,000 条记录,具备多维度行为洞察、经济指标等关键特征,有地区偏向性。适用于机器学习、消费者行为分析等场景,数据经清理结构化,适合初、中、高级用户用于相关分析与模型开发。
消费
文本
表格
本数据集是一个包含约5000条记录的综合性数据集,旨在全景式追踪与分析国际学生的流动轨迹与生涯发展。数据整合了学生从来源国、目的地与大学专业等起点信息,到入学年份、奖学金、成绩等学习过程指标,并延伸至毕业就业状态、起薪及签证转换等关键结果。通过覆盖留学决策、学业表现到职业开端的完整链条,本数据集为探究全球人才流动规律、评估教育政策成效以及理解个人背景与发展结果间的复杂关联提供了宝贵的实证研究基础。
教育
图像
表格
本数据集收录了至2026年451款智能手表产品详情。内容涵盖价格、品牌、功能配置、用户评分及评论数量等关键维度,系统呈现市场定价策略、品牌竞争格局与产品特性分布。数据包含屏幕类型、健康监测功能、续航时间、防水等级等具体参数,并记录实时折扣信息与历史价格波动。适用于价格预测模型构建、市场趋势分析、竞品对标研究及消费者偏好洞察,为区域市场战略制定、产品定位分析与学术实证研究提供高质量的结构化数据支持。
制造
文本
表格
玩具店电子商务数据库专为销售泰迪熊的在线零售商 打造。数据涵盖用户网站会话、页面浏览量、订单及退货等详细营销信息。可用于分析优化营销渠道、评估网站转化性能、了解新品推出影响。通过分析网站会话与订单量趋势、转化率、成功营销渠道及收入变化等,助力电商运营决策。
消费
文本
表格
数据集聚焦音乐情感分类与情感感知推荐系统研究。它涵盖音乐属性结构化数据、上下文及用户相关信息,为每条音乐实例标记七种情感类别之一。数据集含曲目 ID、节奏、能量等多维度数据,可用于情感分类、识别及个性化推荐,助力挖掘音乐情感与用户行为的关联。
教育
文本
表格
数据集整合 6 个权威数据源,涵盖 44 国 1995 - 2025 年的相关数据,含 67,900 多个充电站与 32 家超级工厂信息。该数据集填补行业空白,为能源转型等领域提供支持。可用于电池需求预测、供应链风险分析等多方面,适用于研究人员、数据科学家等专业人士开展相关研究与分析工作。
其他
文本
表格
国家太阳能辐射数据库(NSRDB)提供用于太阳能与可再生能源研究的高分辨率数据。数据集含大气条件、太阳辐射指标等时间序列测量数据,按年、月、日及时间间隔结构化。可用于太阳能资源评估、光伏系统性能建模等,也支持统计分析等数据科学任务,助力研究人员等开展相关研究与模型构建。
能源
文本
表格
该数据集聚焦于合成数学问题,旨在提升大语言模型在数论和几何领域的推理能力。它精心收集内容,同时涵盖正确与有缺陷的推理过程,共 2000 对。主要应用于基于人类反馈的强化学习及直接偏好优化训练,也可作为评估奖励模型与数学验证器的基准,助力构建更可靠的人工智能数学推理系统。
教育
文本
表格
数据集专为科研与教育领域设计,聚焦于夫妻生育健康相关信息。数据集全面涵盖了夫妻双方的健康状况、生活方式特点以及医疗干预等多维度指标,像年龄、BMI、精子质量等关键因素均有涉及,并已进行完全匿名化处理。其核心用途是借助机器学习手段预测妊娠结局,在医疗保健研究、探索性数据分析、教育教学等方面也具有重要应用价值,有力推动对生育影响因素的深入剖析以及预测模型的构建。
教育
文本
表格
数据集聚焦企业人工智能应用,为研究人员、分析师及政策制定者提供重要数据支撑。它以结构化形式呈现各行业、各国公司的人工智能应用状况,及其对生产力、劳动力和运营成果的影响。数据集适用于人工智能应用研究、商业分析等领域,助力洞察人工智能在企业中的作用,为相关决策提供依据。
人力资源
文本
表格
癫痫数据集专注于基于脑电图(EEG)信号特征,运用机器学习方法实现对癫痫的精确检测与分析。该数据集由训练数据集与测试数据集构成,前者用于机器学习模型的训练,后者则用以评估模型性能。主要应用于医学科研及临床诊断领域,助力开发高准确性的癫痫检测模型,辅助医生提升癫痫诊断效率与精准度,为癫痫患者的及时治疗与干预提供关键支持。
医疗
文本
表格
隐私感知智能电网运行数据集(PASGOD)收集自分布式电力系统实时运行节点,含电压、频率等电气参数,及温度、湿度等环境因素数据。涵盖正常与异常运行场景,反映智能电网多区域多节点的运行情况。适用于电力领域研究电网可靠性、稳定性,辅助制定电网运行策略,提升电力系统运行效率。
其他
文本
表格
客户支持聊天数据集含 25,000 条合成对话,模拟客户与支持人员真实互动。支持多语言,覆盖电商、金融科技等多个行业。适用于对话式人工智能研发,如优化聊天机器人回复;可辅助大语言模型微调,提升其在客户支持场景的表现;也能用于情感分析,了解客户在对话中的情感变化,助力企业改善服务。
其他
文本
表格
水稻数据集围绕提高水稻产量展开,利用结合包装器特征选择技术的混合机器学习模型,通过五种特征选择方法优化数据,训练多种机器学习模型。数据集涵盖农业地块、品种、土壤类型等种植相关信息,以及气象、施肥、除草防虫等数据。适用于农业研究领域,助于预测水稻产量、推荐品种,为提高水稻生产力提供支持。
农业
文本
表格
情感简化数据集源于谷歌 GoEmotions 数据集,含 53994 条类似 Reddit 风格的英文短评,标注了 0 - 27 的主要情感索引,另有文件映射索引与情感名称。适用于自然语言处理领域训练多类别模型,社交媒体情感分析,助力企业了解用户对产品或服务的情感态度,也可用于研究人员探索文本情感分类技术。
其他
文本
表格
健康指标数据集是基于逻辑构建的模拟健身相关数据集合,旨在全面反映健身状态受多种习惯因素交互影响的实际情况。数据集通过一系列复杂计算生成健身分数,并经调整转化为健康水平标签。涵盖年龄、日常活动、睡眠、饮食等多类特征,模拟了现实中各健康因素间的因果及隐藏关系。适用于健身与健康管理领域的研究,为训练相关模型、探究习惯对健康的影响以及制定科学健康管理策略提供有力支持。
医疗
文本
表格
数据集涵盖训练与测试数据,包含患者人口统计、生命体征、实验室检测结果及病史等全面医学信息。旨在助力分析肾脏健康,构建预测 CKD 及其阶段的机器学习模型。适用于医疗研究人员开展疾病研究,通过分析数据提升对 CKD 的认知;也便于开发人员优化模型,以实现 CKD 的早期发现与准确分类。
医疗
文本
表格
英伟达股票数据集包含 1999 年 1 月 22 日至 2026 年 3 月 11 日共 7079 个交易日的股票数据,设有 16 个字段,涵盖股价、成交量、市值、营收等多维度信息,并标注 6 次拆股情况及关键事件。此数据集适用于金融研究人员剖析英伟达股价走势及公司发展对股价影响;也可供高校金融教学,辅助学生理解金融市场与科技公司的关联;投资者还能借此评估投资风险与收益。
金融
文本
表格
数据集涵盖 1970 年至 2022 年发布的乐高套装信息,包含每套的主题、零件数、推荐年龄、零售价格及图片。适用于分析乐高套装发布数量趋势,探究价格与零件数的关系,挖掘各十年最热门主题,以及研究乐高小人仔与授权套装的关联。为乐高爱好者、市场研究者、行业分析人员等提供数据支持,助力了解乐高产品发展与市场偏好。
消费
文本
表格
数据集涵盖 2015 至 2025 年,卡拉奇中等教育委员会 12 年级计算机科学试卷题目。包含选择题、简答题和长答题,聚焦试卷二理论部分。适用于备考学生系统复习,熟悉题型与考点,教师用于出题、调整教学,研究人员分析出题规律,开发人员构建教育工具,助力计算机科学教学与学习。
教育
文本
表格
现代艺术博物馆(MoMA)馆藏数据集包含 157,630 条记录,覆盖 MoMA 收藏并录入数据库的所有作品。数据集涵盖作品标题、艺术家、创作日期、媒介、尺寸及收购日期等基本元数据,部分记录信息标注 “未经批准”。适用于分析艺术品的 “现代性”、热门艺术家、收购日期趋势及常见艺术品类型等,助力深入了解 MoMA 馆藏特点与艺术发展脉络。
文旅
文本
表格
全球茶与咖啡生活方式数据集为合成数据集,模拟 200 个国家在 2015 - 2024 年的茶与咖啡消费行为。含超 15,000 条记录,具备多维度行为洞察、经济指标等关键特征,有地区偏向性。适用于机器学习、消费者行为分析等场景,数据经清理结构化,适合初、中、高级用户用于相关分析与模型开发。
消费
文本
表格
本数据集是一个包含约5000条记录的综合性数据集,旨在全景式追踪与分析国际学生的流动轨迹与生涯发展。数据整合了学生从来源国、目的地与大学专业等起点信息,到入学年份、奖学金、成绩等学习过程指标,并延伸至毕业就业状态、起薪及签证转换等关键结果。通过覆盖留学决策、学业表现到职业开端的完整链条,本数据集为探究全球人才流动规律、评估教育政策成效以及理解个人背景与发展结果间的复杂关联提供了宝贵的实证研究基础。
教育
图像
表格
本数据集收录了至2026年451款智能手表产品详情。内容涵盖价格、品牌、功能配置、用户评分及评论数量等关键维度,系统呈现市场定价策略、品牌竞争格局与产品特性分布。数据包含屏幕类型、健康监测功能、续航时间、防水等级等具体参数,并记录实时折扣信息与历史价格波动。适用于价格预测模型构建、市场趋势分析、竞品对标研究及消费者偏好洞察,为区域市场战略制定、产品定位分析与学术实证研究提供高质量的结构化数据支持。
制造
文本
表格
玩具店电子商务数据库专为销售泰迪熊的在线零售商 打造。数据涵盖用户网站会话、页面浏览量、订单及退货等详细营销信息。可用于分析优化营销渠道、评估网站转化性能、了解新品推出影响。通过分析网站会话与订单量趋势、转化率、成功营销渠道及收入变化等,助力电商运营决策。
消费
文本
表格
数据集聚焦音乐情感分类与情感感知推荐系统研究。它涵盖音乐属性结构化数据、上下文及用户相关信息,为每条音乐实例标记七种情感类别之一。数据集含曲目 ID、节奏、能量等多维度数据,可用于情感分类、识别及个性化推荐,助力挖掘音乐情感与用户行为的关联。
教育
文本
表格
数据集整合 6 个权威数据源,涵盖 44 国 1995 - 2025 年的相关数据,含 67,900 多个充电站与 32 家超级工厂信息。该数据集填补行业空白,为能源转型等领域提供支持。可用于电池需求预测、供应链风险分析等多方面,适用于研究人员、数据科学家等专业人士开展相关研究与分析工作。
其他
文本
表格
国家太阳能辐射数据库(NSRDB)提供用于太阳能与可再生能源研究的高分辨率数据。数据集含大气条件、太阳辐射指标等时间序列测量数据,按年、月、日及时间间隔结构化。可用于太阳能资源评估、光伏系统性能建模等,也支持统计分析等数据科学任务,助力研究人员等开展相关研究与模型构建。
能源
文本
表格
该数据集聚焦于合成数学问题,旨在提升大语言模型在数论和几何领域的推理能力。它精心收集内容,同时涵盖正确与有缺陷的推理过程,共 2000 对。主要应用于基于人类反馈的强化学习及直接偏好优化训练,也可作为评估奖励模型与数学验证器的基准,助力构建更可靠的人工智能数学推理系统。
教育
文本
表格
数据集专为科研与教育领域设计,聚焦于夫妻生育健康相关信息。数据集全面涵盖了夫妻双方的健康状况、生活方式特点以及医疗干预等多维度指标,像年龄、BMI、精子质量等关键因素均有涉及,并已进行完全匿名化处理。其核心用途是借助机器学习手段预测妊娠结局,在医疗保健研究、探索性数据分析、教育教学等方面也具有重要应用价值,有力推动对生育影响因素的深入剖析以及预测模型的构建。
教育
文本
表格
数据集聚焦企业人工智能应用,为研究人员、分析师及政策制定者提供重要数据支撑。它以结构化形式呈现各行业、各国公司的人工智能应用状况,及其对生产力、劳动力和运营成果的影响。数据集适用于人工智能应用研究、商业分析等领域,助力洞察人工智能在企业中的作用,为相关决策提供依据。
人力资源
文本
表格
癫痫数据集专注于基于脑电图(EEG)信号特征,运用机器学习方法实现对癫痫的精确检测与分析。该数据集由训练数据集与测试数据集构成,前者用于机器学习模型的训练,后者则用以评估模型性能。主要应用于医学科研及临床诊断领域,助力开发高准确性的癫痫检测模型,辅助医生提升癫痫诊断效率与精准度,为癫痫患者的及时治疗与干预提供关键支持。
医疗
文本
表格
隐私感知智能电网运行数据集(PASGOD)收集自分布式电力系统实时运行节点,含电压、频率等电气参数,及温度、湿度等环境因素数据。涵盖正常与异常运行场景,反映智能电网多区域多节点的运行情况。适用于电力领域研究电网可靠性、稳定性,辅助制定电网运行策略,提升电力系统运行效率。
其他
文本
表格
客户支持聊天数据集含 25,000 条合成对话,模拟客户与支持人员真实互动。支持多语言,覆盖电商、金融科技等多个行业。适用于对话式人工智能研发,如优化聊天机器人回复;可辅助大语言模型微调,提升其在客户支持场景的表现;也能用于情感分析,了解客户在对话中的情感变化,助力企业改善服务。
其他
文本
表格
水稻数据集围绕提高水稻产量展开,利用结合包装器特征选择技术的混合机器学习模型,通过五种特征选择方法优化数据,训练多种机器学习模型。数据集涵盖农业地块、品种、土壤类型等种植相关信息,以及气象、施肥、除草防虫等数据。适用于农业研究领域,助于预测水稻产量、推荐品种,为提高水稻生产力提供支持。
农业
文本
表格
情感简化数据集源于谷歌 GoEmotions 数据集,含 53994 条类似 Reddit 风格的英文短评,标注了 0 - 27 的主要情感索引,另有文件映射索引与情感名称。适用于自然语言处理领域训练多类别模型,社交媒体情感分析,助力企业了解用户对产品或服务的情感态度,也可用于研究人员探索文本情感分类技术。
其他
文本
表格
健康指标数据集是基于逻辑构建的模拟健身相关数据集合,旨在全面反映健身状态受多种习惯因素交互影响的实际情况。数据集通过一系列复杂计算生成健身分数,并经调整转化为健康水平标签。涵盖年龄、日常活动、睡眠、饮食等多类特征,模拟了现实中各健康因素间的因果及隐藏关系。适用于健身与健康管理领域的研究,为训练相关模型、探究习惯对健康的影响以及制定科学健康管理策略提供有力支持。
医疗
文本
表格
数据集涵盖训练与测试数据,包含患者人口统计、生命体征、实验室检测结果及病史等全面医学信息。旨在助力分析肾脏健康,构建预测 CKD 及其阶段的机器学习模型。适用于医疗研究人员开展疾病研究,通过分析数据提升对 CKD 的认知;也便于开发人员优化模型,以实现 CKD 的早期发现与准确分类。
医疗
文本
表格
英伟达股票数据集包含 1999 年 1 月 22 日至 2026 年 3 月 11 日共 7079 个交易日的股票数据,设有 16 个字段,涵盖股价、成交量、市值、营收等多维度信息,并标注 6 次拆股情况及关键事件。此数据集适用于金融研究人员剖析英伟达股价走势及公司发展对股价影响;也可供高校金融教学,辅助学生理解金融市场与科技公司的关联;投资者还能借此评估投资风险与收益。
金融
文本
表格