本数据集是一个全面的全球机场目录,收录了7859个全球机场的核心信息。每条记录代表一个独立的机场,包含其广泛用于航空、旅行和物流系统的三字IATA代码、机场全称、所在城市、州/省、国家以及精确的地理坐标。数据经过标准化处理,为整合航班时刻、航线分析、交通物流及地理空间应用提供了统一的参考基准,非常适合用于地图可视化、旅行规划或物流网络分析等任务。
交通
文本
图像
表格
该数据集整合了患者层面的人口统计学特征、生活方式习惯(如详细吸烟史)、环境暴露因素及临床健康指标等多维度信息,并包含用于标识高风险个体的二分类目标变量。其结构化数据适用于构建肺癌风险预测模型,支持从探索性分析(如风险因子关联挖掘)到机器学习分类任务(如逻辑回归、随机森林)的全流程研究,可为疾病早期筛查、风险分层及预防性医疗策略制定提供数据驱动的决策依据。
医疗
文本
图像
表格
本数据集汇集了全球194个国家和地区在2012年至2024年间每年的海洋健康指数综合评分。该指数是一项全面评估海洋生态系统健康状况的权威指标,它通过整合食物供应、清洁水域、生物多样性、海岸保护等十个关键社会与生态目标的达成情况,计算出一个0到100分的综合评分,以衡量海洋可持续地为人类提供福祉的能力。数据集已移除冗余信息,结构清晰,便于研究人员直接进行跨国比较、趋势分析和海洋保护政策的成效评估。
其他
图像
表格
图&网络
本数据集系统探讨了快餐消费习惯与多维度健康指标间的潜在关联,它通过合成但贴近现实的数据,整合了个人的饮食习惯(特别是快餐摄入频率与类型)、日常身体活动水平、睡眠质量与时长,以及血压、BMI、心理健康评分等综合健康结果。该数据适用于研究饮食行为对健康的综合影响,支持开展相关性分析、健康风险预测建模,并可为公共卫生干预策略的制定提供数据驱动的洞察,是进行营养流行病学或健康行为研究的实用基础数据。
其他
图像
表格
图&网络
该数据集系统整合了品牌、型号、生产年份、发动机规格、行驶里程、综合车况及市场价格等决定汽车价值的关键结构化属性。它专为基于回归的机器学习任务设计,非常适合用于训练线性回归、随机森林等模型进行精准的价格预测,并支持开展探索性数据分析以揭示各特征与价格间的关联。该数据集可直接应用于教学演示、学术研究,以及为二手车评估等实际场景提供数据驱动的估价基准。
交通
图像
表格
图&网络
本数据集源自额尔古纳森林-草原交错带温带草甸草原的氮磷双因子添加实验。通过设置不同氮磷处理,测定了群落地上初级生产力、叶片氮磷比、叶片磷组分及光合速率等指标,旨在探究植物在贫瘠土壤中的养分适应策略。研究重点检验了光合磷利用效率(PPUE)的提升是否源于细胞内磷在生化组分间的优化分配,并分析了以质量为基础的光合固碳速率与各磷组分的关系。数据集为解析植物磷高效利用的生理机制提供了关键实证。
农业
表格
本数据集包含300条专为机器学习回归任务设计的合成房屋记录,数据以整洁的CSV格式提供。其关键特征涵盖了综合质量、居住面积、建造年份、房间数量及地块面积等决定房产价值的核心属性。目标变量“销售价格”基于与这些特征的真实统计关联生成,模拟了市场定价逻辑。该数据集已完全清洗,无需预处理,非常适合初学者系统练习从探索性数据分析、特征工程到构建与评估线性回归、决策树等预测模型的全流程。
建筑
表格
本数据集覆盖数学分析的核心知识体系,包括极限、连续性、级数收敛、函数空间等关键内容,强调严格证明与逻辑上的完备性。其价值在于为模型提供“严谨数学语言 + 形式化证明”的高密度、结构化训练样本,旨在从根本上解决模型在理解复杂定理、构建逻辑链条与组织证明结构时面临的瓶颈问题。该资源专为高端数学推理任务及科研级 AI 训练设计,可显著提升模型在形式化推理、定理自动证明及深层数学问题求解中的能力与可靠性。
教育
文本
本数据集聚焦线性代数与抽象代数核心基础,系统涵盖矩阵理论、向量空间、线性映射、特征值与特征向量,并延伸至群、环、域等抽象结构。其核心价值在于为AI模型提供高密度、结构化的代数思维训练样本,通过严谨的形式化定义、定理证明与实例演算,着力提升模型对向量化表达、线性空间结构、抽象运算规则及同态映射的深度理解能力,为机器学习、计算机图形学、量子计算等现代科学与AI领域奠定坚实的数学基础。
教育
文本
本数据集系统覆盖常微分方程与偏微分方程的经典问题与求解方法,包括分离变量法、特征值问题、傅里叶展开、格林函数等核心内容。其核心价值在于为AI模型提供从“连续系统建模”到“方程求解”的完整推理样本,重点增强模型对动力学系统的数学描述能力、解析方法选取与边界条件处理的规范性。本数据集适用于AI for Science、物理建模、工程仿真及科学推理等前沿领域的模型训练与评估。
教育
文本
本数据集是基于美团平台官方、月度更新的脱敏商业数据生成的深度分析报告集合。核心产品包括为线下拓展定制的选址报告以及为策略制定服务的行业消费报告。报告数据准确,对敏感排名信息采用指数化处理。其核心价值在于将多维数据转化为可直接指导开店、选品、营销的决策依据。此外,该数据集也是训练AI大模型商业推理能力、构建专业商业智能体的高质量结构化语料。
消费
文本
图像
本数据集覆盖研究生入学考试生物学核心知识,涵盖分子生物学、细胞生物学、生物化学与遗传调控等方向。其核心价值在于为 AI 提供高密度生命科学知识与因果链推理样本,解决模型在复杂生物过程、调控网络与实验逻辑理解方面的不足,广泛应用于生命科学教育 AI 与生物智能模型训练。
教育
文本
本数据集覆盖高中生物核心模块,包括细胞生物学、生态学与生命活动调节等内容,设计上强调对核心概念的深入理解、对动态过程的逻辑分析以及知识体系的系统关联。其价值是为AI模型提供大量结构化生物事实与蕴含因果关系的推理样本,旨在弥补AI在理解复杂生物过程、精确区分易混淆概念以及跨章节综合推理方面的常见短板。该数据集适用于开发K12生物智能辅导模型,也能为构建更通用的生命科学认知与推理模型提供关键训练基础。
教育
文本
本数据集覆盖高中物理竞赛题目,内容深度远超普通教学,覆盖电磁学、热力学、光学及现代物理等核心领域。设计着重训练高阶物理建模、多步骤逻辑推导以及微积分等复杂数学工具的综合运用。其核心在于提供大量高难度、非标准化推理样本,旨在突破AI在长链推理、抽象建模及解决非模板化问题方面的能力上限。该数据集适用于训练高阶推理模型、科研辅助AI以及物理竞赛智能辅导系统,为AI在深层次科学推理领域的发展提供关键支持。
教育
文本
本数据集覆盖了函数极限、导数、积分等微积分核心内容及其应用,是数学与工程建模的基础。核心价值在于为 AI 提供大量的连续数学对象与符号推导的标准训练样本,专门用于弥补模型在连续极限理解、多步计算和严格推导方面的能力短板。通过强化AI对形式化数学语言与运算规则的理解,该数据集能有效提升数学推理的可靠性,广泛应用于数学推理模型、科学计算辅助系统及 AI for Science 基础能力训练。
教育
文本
该数据集涵盖多项式、方程、不等式及初等代数结构问题等核心内容,强调符号操作与逻辑变形。其核心价值在于为 AI 模型提供离散符号系统下的规则推理的大量样本,例如展示如何通过因式分解、配方或不等式缩放等方法,将复杂表达式转化为可解形式。这是使其成为提升模型数学抽象能力与形式化推理能力的重要基础,因此被广泛用于训练专用数学解题模型,并作为构建通用推理模型时不可或缺的底层数学逻辑训练组件。
教育
文本
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集源自城市级数字资产监测平台,通过对全市政务云机房服务器流量的实时无感采集,汇聚了政务信息系统在访问量、资源使用率及网络行为等方面的核心运行数据。它不仅能动态感知系统活跃度,更能通过“僵尸系统识别”、“无主IP归集”等智能模型,为信息化资产的效能审计、财政资金节约与数据价值挖掘提供精准、客观的数据洞察与决策依据
金融
图像
表格
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
这是一个专门用于中文隐喻识别与理解研究的数据集。它通过人工标注,为自然语言处理任务提供了结构化的隐喻样本。
教育
文本
本数据集是一个全面的全球机场目录,收录了7859个全球机场的核心信息。每条记录代表一个独立的机场,包含其广泛用于航空、旅行和物流系统的三字IATA代码、机场全称、所在城市、州/省、国家以及精确的地理坐标。数据经过标准化处理,为整合航班时刻、航线分析、交通物流及地理空间应用提供了统一的参考基准,非常适合用于地图可视化、旅行规划或物流网络分析等任务。
交通
文本
图像
表格
该数据集整合了患者层面的人口统计学特征、生活方式习惯(如详细吸烟史)、环境暴露因素及临床健康指标等多维度信息,并包含用于标识高风险个体的二分类目标变量。其结构化数据适用于构建肺癌风险预测模型,支持从探索性分析(如风险因子关联挖掘)到机器学习分类任务(如逻辑回归、随机森林)的全流程研究,可为疾病早期筛查、风险分层及预防性医疗策略制定提供数据驱动的决策依据。
医疗
文本
图像
表格
本数据集汇集了全球194个国家和地区在2012年至2024年间每年的海洋健康指数综合评分。该指数是一项全面评估海洋生态系统健康状况的权威指标,它通过整合食物供应、清洁水域、生物多样性、海岸保护等十个关键社会与生态目标的达成情况,计算出一个0到100分的综合评分,以衡量海洋可持续地为人类提供福祉的能力。数据集已移除冗余信息,结构清晰,便于研究人员直接进行跨国比较、趋势分析和海洋保护政策的成效评估。
其他
图像
表格
图&网络
本数据集系统探讨了快餐消费习惯与多维度健康指标间的潜在关联,它通过合成但贴近现实的数据,整合了个人的饮食习惯(特别是快餐摄入频率与类型)、日常身体活动水平、睡眠质量与时长,以及血压、BMI、心理健康评分等综合健康结果。该数据适用于研究饮食行为对健康的综合影响,支持开展相关性分析、健康风险预测建模,并可为公共卫生干预策略的制定提供数据驱动的洞察,是进行营养流行病学或健康行为研究的实用基础数据。
其他
图像
表格
图&网络
该数据集系统整合了品牌、型号、生产年份、发动机规格、行驶里程、综合车况及市场价格等决定汽车价值的关键结构化属性。它专为基于回归的机器学习任务设计,非常适合用于训练线性回归、随机森林等模型进行精准的价格预测,并支持开展探索性数据分析以揭示各特征与价格间的关联。该数据集可直接应用于教学演示、学术研究,以及为二手车评估等实际场景提供数据驱动的估价基准。
交通
图像
表格
图&网络
本数据集源自额尔古纳森林-草原交错带温带草甸草原的氮磷双因子添加实验。通过设置不同氮磷处理,测定了群落地上初级生产力、叶片氮磷比、叶片磷组分及光合速率等指标,旨在探究植物在贫瘠土壤中的养分适应策略。研究重点检验了光合磷利用效率(PPUE)的提升是否源于细胞内磷在生化组分间的优化分配,并分析了以质量为基础的光合固碳速率与各磷组分的关系。数据集为解析植物磷高效利用的生理机制提供了关键实证。
农业
表格
本数据集包含300条专为机器学习回归任务设计的合成房屋记录,数据以整洁的CSV格式提供。其关键特征涵盖了综合质量、居住面积、建造年份、房间数量及地块面积等决定房产价值的核心属性。目标变量“销售价格”基于与这些特征的真实统计关联生成,模拟了市场定价逻辑。该数据集已完全清洗,无需预处理,非常适合初学者系统练习从探索性数据分析、特征工程到构建与评估线性回归、决策树等预测模型的全流程。
建筑
表格
本数据集覆盖数学分析的核心知识体系,包括极限、连续性、级数收敛、函数空间等关键内容,强调严格证明与逻辑上的完备性。其价值在于为模型提供“严谨数学语言 + 形式化证明”的高密度、结构化训练样本,旨在从根本上解决模型在理解复杂定理、构建逻辑链条与组织证明结构时面临的瓶颈问题。该资源专为高端数学推理任务及科研级 AI 训练设计,可显著提升模型在形式化推理、定理自动证明及深层数学问题求解中的能力与可靠性。
教育
文本
本数据集聚焦线性代数与抽象代数核心基础,系统涵盖矩阵理论、向量空间、线性映射、特征值与特征向量,并延伸至群、环、域等抽象结构。其核心价值在于为AI模型提供高密度、结构化的代数思维训练样本,通过严谨的形式化定义、定理证明与实例演算,着力提升模型对向量化表达、线性空间结构、抽象运算规则及同态映射的深度理解能力,为机器学习、计算机图形学、量子计算等现代科学与AI领域奠定坚实的数学基础。
教育
文本
本数据集系统覆盖常微分方程与偏微分方程的经典问题与求解方法,包括分离变量法、特征值问题、傅里叶展开、格林函数等核心内容。其核心价值在于为AI模型提供从“连续系统建模”到“方程求解”的完整推理样本,重点增强模型对动力学系统的数学描述能力、解析方法选取与边界条件处理的规范性。本数据集适用于AI for Science、物理建模、工程仿真及科学推理等前沿领域的模型训练与评估。
教育
文本
本数据集是基于美团平台官方、月度更新的脱敏商业数据生成的深度分析报告集合。核心产品包括为线下拓展定制的选址报告以及为策略制定服务的行业消费报告。报告数据准确,对敏感排名信息采用指数化处理。其核心价值在于将多维数据转化为可直接指导开店、选品、营销的决策依据。此外,该数据集也是训练AI大模型商业推理能力、构建专业商业智能体的高质量结构化语料。
消费
文本
图像
本数据集覆盖研究生入学考试生物学核心知识,涵盖分子生物学、细胞生物学、生物化学与遗传调控等方向。其核心价值在于为 AI 提供高密度生命科学知识与因果链推理样本,解决模型在复杂生物过程、调控网络与实验逻辑理解方面的不足,广泛应用于生命科学教育 AI 与生物智能模型训练。
教育
文本
本数据集覆盖高中生物核心模块,包括细胞生物学、生态学与生命活动调节等内容,设计上强调对核心概念的深入理解、对动态过程的逻辑分析以及知识体系的系统关联。其价值是为AI模型提供大量结构化生物事实与蕴含因果关系的推理样本,旨在弥补AI在理解复杂生物过程、精确区分易混淆概念以及跨章节综合推理方面的常见短板。该数据集适用于开发K12生物智能辅导模型,也能为构建更通用的生命科学认知与推理模型提供关键训练基础。
教育
文本
本数据集覆盖高中物理竞赛题目,内容深度远超普通教学,覆盖电磁学、热力学、光学及现代物理等核心领域。设计着重训练高阶物理建模、多步骤逻辑推导以及微积分等复杂数学工具的综合运用。其核心在于提供大量高难度、非标准化推理样本,旨在突破AI在长链推理、抽象建模及解决非模板化问题方面的能力上限。该数据集适用于训练高阶推理模型、科研辅助AI以及物理竞赛智能辅导系统,为AI在深层次科学推理领域的发展提供关键支持。
教育
文本
本数据集覆盖了函数极限、导数、积分等微积分核心内容及其应用,是数学与工程建模的基础。核心价值在于为 AI 提供大量的连续数学对象与符号推导的标准训练样本,专门用于弥补模型在连续极限理解、多步计算和严格推导方面的能力短板。通过强化AI对形式化数学语言与运算规则的理解,该数据集能有效提升数学推理的可靠性,广泛应用于数学推理模型、科学计算辅助系统及 AI for Science 基础能力训练。
教育
文本
该数据集涵盖多项式、方程、不等式及初等代数结构问题等核心内容,强调符号操作与逻辑变形。其核心价值在于为 AI 模型提供离散符号系统下的规则推理的大量样本,例如展示如何通过因式分解、配方或不等式缩放等方法,将复杂表达式转化为可解形式。这是使其成为提升模型数学抽象能力与形式化推理能力的重要基础,因此被广泛用于训练专用数学解题模型,并作为构建通用推理模型时不可或缺的底层数学逻辑训练组件。
教育
文本
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集源自城市级数字资产监测平台,通过对全市政务云机房服务器流量的实时无感采集,汇聚了政务信息系统在访问量、资源使用率及网络行为等方面的核心运行数据。它不仅能动态感知系统活跃度,更能通过“僵尸系统识别”、“无主IP归集”等智能模型,为信息化资产的效能审计、财政资金节约与数据价值挖掘提供精准、客观的数据洞察与决策依据
金融
图像
表格
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
这是一个专门用于中文隐喻识别与理解研究的数据集。它通过人工标注,为自然语言处理任务提供了结构化的隐喻样本。
教育
文本