本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
数据集源于高能粒子物理实验,记录质子 - 质子碰撞产生粒子的运动学特性,像运行编号、动量分量、总能量等,可用性高。适用于粒子物理研究,如质量重建、信号与背景分类及异常检测,助力探索新物理现象,为相关领域科研提供重要数据支撑。
教育
文本
表格
数据集包含 120,000 条合成但高度逼真的医疗保险索赔数据,专为收入周期管理(RCM)、医疗保健人工智能及拒赔预测建模打造。数据涵盖 CPT 手术代码、ICD - 10 诊断代码等多类信息,且有独特的拒赔智能层,含 X12 拒赔原因代码等内容。适用于索赔拒赔预测、RCM 自动化等场景,为医疗领域相关人员提供有力数据支持。
医疗
文本
数据集由 Greenformance 公司为 GreenformanceOptimizer 项目创建,含一台 3D 打印机的真实世界时间序列数据,涵盖功耗与机器状态信息,并在 AIRoV 会议展示。可用于研究 3D 打印机功耗规律、优化能源利用及分析机器状态与功耗关系,助力 3D 打印行业绿色发展。
制造
文本
表格
数据集包含 47707 条官方车辆安全召回记录,覆盖多年、众多品牌与制造商。数据结合原始文件与 20 多个分析列,涵盖召回各关键信息。适用于消费者购车参考、制造商评估、监管分析等场景,助力提升车辆安全管理水平。
交通
文本
表格
数据集源自世界卫生组织全球卫生观察站,含 67,438 条观测,覆盖 200 个国家 34 年,整合 40 个相关指标。数据呈现三种疾病不同发展态势,可用于流行病学建模、负担评分等多领域,助力于了解全球性传播感染状况,制定针对性防控策略。
医疗
文本
表格
数据集含 16 万个 URL 样本,良性与恶意样本各 8 万,实现完美平衡。数据集经精心构建,含 24 个特征,基于词汇、结构和熵等,无需预处理即可用于训练评估机器学习模型检测网络钓鱼 URL。适用于高精度分类、特征分析及对抗性研究等,助力提升网络安全威胁检测能力。
教育
文本
表格
数据集是大规模合成医疗数据集,含 120,000 条患者记录与 26 个结构化特征,模拟真实可穿戴健康监测和患者风险评估场景。数据覆盖生命体征、生活方式等多方面,专为预测性医疗分析、早期疾病风险检测等设计,且针对多种常用数据处理和机器学习库优化,方便相关研究与应用。
医疗
文本
表格
数据集包含 2498 张 720p 分辨率的工业用小型载物箱堆垛的逼真合成图像,通过 NVIDIA Omniverse SORDI.ai 进行渲染。数据集利用不同级别的域随机化设置,从对象外观到背景环境再到光照进行随机化处理,同时具备多种数据采集设置。适用于计算机视觉相关研究,如模型训练,提升模型对不同场景的适应性。
制造
图像
数据集提供时间同步的同步相量通信数据,主要用于智能电网网络安全研究。数据涵盖正常通信及 FDI、TSA 攻击场景下 3 小时的网络流量,具备原始捕获、结构化表格及预处理的机器学习可用等多种数据形式,基于模拟智能电网测试平台构建并经文献与模型验证。适用于异常检测、入侵检测、智能电网网络安全研究等多个领域。
教育
文本
表格
数据集是大规模的模拟数据集,筛选后提供一个平衡的 5 万样本数据集。数据集涵盖材料属性、器件结构等多方面 48 个特征,用于可再生能源等研究。适用于机器学习模型训练、特征分析等任务,助力钙钛矿太阳能电池效率提升与结构优化,推动可再生能源领域发展。
能源
文本
表格
数据集围绕尼泊尔易受水文气象灾害的背景构建,以 2021 年梅拉姆奇洪水事件为契机开发,旨在为早期灾害预测系统提供支撑。数据源于尼泊尔 BIPAD 门户和 NASA POWER API,涵盖日降水量、土壤湿度等关键特征。适用于训练随机森林模型,助力提升滑坡和洪水灾害的预警能力,保护生命与基础设施。
社会治理
文本
表格
数据集聚焦 12 个非洲城市,为解决蛇咬伤问题而构建。数据集引入城市蛇类迁徙风险指数(USDRI),结合四种机制评估风险。数据源于 iNaturalist、GBIF 等,涉及蛇类目击、物种、医院距离等信息。适用于研究蛇类迁徙与城市发展关系,助力制定蛇咬伤预防策略,提升非洲城市蛇类安全管理水平。
社会治理
文本
表格
数据集拥有超 100 万高质量教育问答对话,专为训练 AI 聊天机器人、教育辅助工具和语言模型打造。数据覆盖 8 个教育类别,涵盖中小学及大学多样学术科目,答案经严格验证,采用便于使用的 CSV 格式,还会定期更新。适用于 AI 教育应用开发、语言模型优化等,助力提升 AI 教育服务质量。
其他
文本
表格
数据集包含 20万条标本观测记录,涉及100多种水生生物,覆盖地球各大水生生物群落。数据涵盖分类学、栖息地、生态学等多方面,源于多个权威生物数据库。适用于物种分类、保护状态预测、生物多样性研究等,助力水生生态研究与海洋保护。
其他
文本
表格
数据集涵盖一家美国全国性糖果经销商从工厂到客户的销售及地理空间运输信息。包含客户与工厂位置、销售订单与目标、产品细节等数据。适用于分析运输路线效率、产品利润率及优化产品线布局,助力经销商提升物流效率、降低成本、提高利润。
消费
文本
表格
数据集源于一家虚构的计算机硬件销售公司的 B2B 销售管道。它涵盖客户账户、产品、销售团队和销售机会等信息,可用于评估销售团队及个人表现、分析销售趋势和产品赢单率等。通过这些分析,能帮助企业优化销售策略、提升业绩、合理分配资源。
消费
文本
表格
本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
数据集源于高能粒子物理实验,记录质子 - 质子碰撞产生粒子的运动学特性,像运行编号、动量分量、总能量等,可用性高。适用于粒子物理研究,如质量重建、信号与背景分类及异常检测,助力探索新物理现象,为相关领域科研提供重要数据支撑。
教育
文本
表格
数据集包含 120,000 条合成但高度逼真的医疗保险索赔数据,专为收入周期管理(RCM)、医疗保健人工智能及拒赔预测建模打造。数据涵盖 CPT 手术代码、ICD - 10 诊断代码等多类信息,且有独特的拒赔智能层,含 X12 拒赔原因代码等内容。适用于索赔拒赔预测、RCM 自动化等场景,为医疗领域相关人员提供有力数据支持。
医疗
文本
数据集由 Greenformance 公司为 GreenformanceOptimizer 项目创建,含一台 3D 打印机的真实世界时间序列数据,涵盖功耗与机器状态信息,并在 AIRoV 会议展示。可用于研究 3D 打印机功耗规律、优化能源利用及分析机器状态与功耗关系,助力 3D 打印行业绿色发展。
制造
文本
表格
数据集包含 47707 条官方车辆安全召回记录,覆盖多年、众多品牌与制造商。数据结合原始文件与 20 多个分析列,涵盖召回各关键信息。适用于消费者购车参考、制造商评估、监管分析等场景,助力提升车辆安全管理水平。
交通
文本
表格
数据集源自世界卫生组织全球卫生观察站,含 67,438 条观测,覆盖 200 个国家 34 年,整合 40 个相关指标。数据呈现三种疾病不同发展态势,可用于流行病学建模、负担评分等多领域,助力于了解全球性传播感染状况,制定针对性防控策略。
医疗
文本
表格
数据集含 16 万个 URL 样本,良性与恶意样本各 8 万,实现完美平衡。数据集经精心构建,含 24 个特征,基于词汇、结构和熵等,无需预处理即可用于训练评估机器学习模型检测网络钓鱼 URL。适用于高精度分类、特征分析及对抗性研究等,助力提升网络安全威胁检测能力。
教育
文本
表格
数据集是大规模合成医疗数据集,含 120,000 条患者记录与 26 个结构化特征,模拟真实可穿戴健康监测和患者风险评估场景。数据覆盖生命体征、生活方式等多方面,专为预测性医疗分析、早期疾病风险检测等设计,且针对多种常用数据处理和机器学习库优化,方便相关研究与应用。
医疗
文本
表格
数据集包含 2498 张 720p 分辨率的工业用小型载物箱堆垛的逼真合成图像,通过 NVIDIA Omniverse SORDI.ai 进行渲染。数据集利用不同级别的域随机化设置,从对象外观到背景环境再到光照进行随机化处理,同时具备多种数据采集设置。适用于计算机视觉相关研究,如模型训练,提升模型对不同场景的适应性。
制造
图像
数据集提供时间同步的同步相量通信数据,主要用于智能电网网络安全研究。数据涵盖正常通信及 FDI、TSA 攻击场景下 3 小时的网络流量,具备原始捕获、结构化表格及预处理的机器学习可用等多种数据形式,基于模拟智能电网测试平台构建并经文献与模型验证。适用于异常检测、入侵检测、智能电网网络安全研究等多个领域。
教育
文本
表格
数据集是大规模的模拟数据集,筛选后提供一个平衡的 5 万样本数据集。数据集涵盖材料属性、器件结构等多方面 48 个特征,用于可再生能源等研究。适用于机器学习模型训练、特征分析等任务,助力钙钛矿太阳能电池效率提升与结构优化,推动可再生能源领域发展。
能源
文本
表格
数据集围绕尼泊尔易受水文气象灾害的背景构建,以 2021 年梅拉姆奇洪水事件为契机开发,旨在为早期灾害预测系统提供支撑。数据源于尼泊尔 BIPAD 门户和 NASA POWER API,涵盖日降水量、土壤湿度等关键特征。适用于训练随机森林模型,助力提升滑坡和洪水灾害的预警能力,保护生命与基础设施。
社会治理
文本
表格
数据集聚焦 12 个非洲城市,为解决蛇咬伤问题而构建。数据集引入城市蛇类迁徙风险指数(USDRI),结合四种机制评估风险。数据源于 iNaturalist、GBIF 等,涉及蛇类目击、物种、医院距离等信息。适用于研究蛇类迁徙与城市发展关系,助力制定蛇咬伤预防策略,提升非洲城市蛇类安全管理水平。
社会治理
文本
表格
数据集拥有超 100 万高质量教育问答对话,专为训练 AI 聊天机器人、教育辅助工具和语言模型打造。数据覆盖 8 个教育类别,涵盖中小学及大学多样学术科目,答案经严格验证,采用便于使用的 CSV 格式,还会定期更新。适用于 AI 教育应用开发、语言模型优化等,助力提升 AI 教育服务质量。
其他
文本
表格
数据集包含 20万条标本观测记录,涉及100多种水生生物,覆盖地球各大水生生物群落。数据涵盖分类学、栖息地、生态学等多方面,源于多个权威生物数据库。适用于物种分类、保护状态预测、生物多样性研究等,助力水生生态研究与海洋保护。
其他
文本
表格
数据集涵盖一家美国全国性糖果经销商从工厂到客户的销售及地理空间运输信息。包含客户与工厂位置、销售订单与目标、产品细节等数据。适用于分析运输路线效率、产品利润率及优化产品线布局,助力经销商提升物流效率、降低成本、提高利润。
消费
文本
表格
数据集源于一家虚构的计算机硬件销售公司的 B2B 销售管道。它涵盖客户账户、产品、销售团队和销售机会等信息,可用于评估销售团队及个人表现、分析销售趋势和产品赢单率等。通过这些分析,能帮助企业优化销售策略、提升业绩、合理分配资源。
消费
文本
表格