该数据集包含超过 20,000 张宝可梦集换式卡牌(TCG)卡牌图像。 它适用于计算机视觉、图像分类、OCR、相似性搜索和卡牌识别任务
消费
图像
自1750年以来的全球温度,由伯克利地球 (隶属于劳伦斯伯克利国家实验室)最新汇编的数据。整合了 16 个现有档案中的 16 亿条温度记录
其他
文本
表格
该数据集包含各种水果和蔬菜的图像,为图像识别任务提供了多样化的集合。包含的食物包括: 水果 :香蕉、苹果、梨、葡萄、橙子、猕猴桃、西瓜、石榴、菠萝、芒果 蔬菜 :黄瓜、胡萝卜、甜椒、洋葱、土豆、柠檬、番茄、萝卜、甜菜、卷心菜、生菜、菠菜、大豆、花椰菜、甜椒、辣椒、芜菁、玉米、甜玉米、红薯、辣椒粉、墨西哥辣椒、生姜、大蒜、豌豆、茄子
农业
图像
该数据集包含约 7,800 篇新闻文章,根据内容安全性标记为安全/不安全/敏感 ,特别适用于 6-12 岁儿童 。它旨在帮助训练和评估模型,以识别适合年轻受众的内容。
教育
文本
表格
一个用于深度学习灾害检测的精选多类别视觉数据集。该数据集是一个精心策划的真实灾难图像集合,旨在训练和基准测试深度学习模型,进行损害分类和灾害识别任务。
其他
图像
该数据集包含 260 万张来自 86 个国家的车辆车牌图像,为 OCR、 交通分析和自动驾驶系统提供全面的资源。它专注于车牌识别和相关检测系统 ,提供关于车牌号码 、 国家 、 边界框标签和其他数据的详细信息,以及用于识别任务的相应掩码
交通
图像
表格
10,000次高保真72小时监测的真实住院数据,该数据集没有缺失值,所有行都是完全模拟的, 不代表真实患者。
医疗
表格
这个数据集核心目标是收集各类意图识别数据集,并将其重新组织成提示词(prompt)格式,专门用于支持大语言模型在小样本学习场景下的意图识别研究。
其他
文本
这是一个专门为 “高中化学垂直大模型微调” 而构建的中文问答与文本生成数据集。主要来源是三种主流教科书和常见教辅资料,包括苏教版、人教版、鲁教版等,还有化学方程式和畅销教辅如“一本涂书”、“教材帮”。
教育
文本
中英双语数据集为汉语学习(HSK)和机器翻译设计的中英双语平行语料库。包含超过20,000条英文句子及其对应的中文翻译。每条数据都额外标注了汉语拼音和句子核心词汇所属的HSK等级。
教育
文本
这是一个用于计算机视觉(CV)任务的开放源合成数据集,特别设计用于 跌倒检测 、 姿态估计 和 事件监控 ,数据来源于顶置闭路电视视角。
社会治理
文本
图像
本数据集面向机电一体化系统齿轮故障诊断的机器学习研究,采集了1 个正常齿轮与5 个故障齿轮在不同转速、载荷工况下的振动数据,以 6 个 CSV 文件分别对应 6 种齿轮状态。数据集可支撑两类核心任务:一是相同或任意工况下的齿轮故障分类,二是基于振动测量数据的转速与载荷回归分析,为设备故障预警与健康管理提供数据支撑。
制造
表格
该大型数据集包含一百万条个体的健康相关信息,聚焦与登革热预测相关的各类因素。每条记录涵盖个体姓名、发热、头痛、关节痛、出血等症状的有无,以及登革热患病状态等详细信息。精准标注了对应的登革热感染确诊状态,为登革热预测模型的研发提供全面、系统的数据支撑。
医疗
表格
该数据集包含195,000+条大肠杆菌临床分离株及其抗菌药敏感性测试结果的原始记录。每个条目都记录了特定大肠杆菌基因组对特定抗生素的反应,以及表型解释、实验室方法、测量值等。
医疗
表格
根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。该数据集用于根据性别、年龄、各类疾病及吸烟状况等输入参数预测患者发生中风的可能性。本数据集可用于医疗风险预测和中风相关的学术研究。
医疗
文本
该数据集包含2015-2025 年全球80,000+ 次重大地震事件(震级 4.5+),可用于地震风险分析与预测。
交通
文本
该数据集包含1万笔为欺诈检测研究和模型开发设计的合成金融交易。它模拟真实的用户行为和欺诈模式,为测试机器学习模型提供安全的环境,同时不暴露任何真实敏感数据。
金融
文本
该数据集包含500+张高质量的常见水果图片,苹果、香蕉和草莓,分类为新鲜或腐烂。它旨在训练和验证计算机视觉模型,用于水果质量检测、自动分拣和基于人工智能的新鲜度监测。该数据集非常适合图像分类任务、深度学习应用和智能农业系统。
其他
图像
本数据集是一个为计算机视觉和机器学习任务专门收集的精选鹦鹉图像集。它旨在提供多样化的鹦鹉视觉样本,以支持相关模型的训练与评估。
其他
图像
本数据集是一个用于二分类任务的带标签图像数据集,专门设计用于训练和评估计算机视觉模型,使其能够在真实交通环境中准确区分救护车与非救护车车辆。
其他
图像
该数据集包含超过 20,000 张宝可梦集换式卡牌(TCG)卡牌图像。 它适用于计算机视觉、图像分类、OCR、相似性搜索和卡牌识别任务
消费
图像
自1750年以来的全球温度,由伯克利地球 (隶属于劳伦斯伯克利国家实验室)最新汇编的数据。整合了 16 个现有档案中的 16 亿条温度记录
其他
文本
表格
该数据集包含各种水果和蔬菜的图像,为图像识别任务提供了多样化的集合。包含的食物包括: 水果 :香蕉、苹果、梨、葡萄、橙子、猕猴桃、西瓜、石榴、菠萝、芒果 蔬菜 :黄瓜、胡萝卜、甜椒、洋葱、土豆、柠檬、番茄、萝卜、甜菜、卷心菜、生菜、菠菜、大豆、花椰菜、甜椒、辣椒、芜菁、玉米、甜玉米、红薯、辣椒粉、墨西哥辣椒、生姜、大蒜、豌豆、茄子
农业
图像
该数据集包含约 7,800 篇新闻文章,根据内容安全性标记为安全/不安全/敏感 ,特别适用于 6-12 岁儿童 。它旨在帮助训练和评估模型,以识别适合年轻受众的内容。
教育
文本
表格
一个用于深度学习灾害检测的精选多类别视觉数据集。该数据集是一个精心策划的真实灾难图像集合,旨在训练和基准测试深度学习模型,进行损害分类和灾害识别任务。
其他
图像
该数据集包含 260 万张来自 86 个国家的车辆车牌图像,为 OCR、 交通分析和自动驾驶系统提供全面的资源。它专注于车牌识别和相关检测系统 ,提供关于车牌号码 、 国家 、 边界框标签和其他数据的详细信息,以及用于识别任务的相应掩码
交通
图像
表格
10,000次高保真72小时监测的真实住院数据,该数据集没有缺失值,所有行都是完全模拟的, 不代表真实患者。
医疗
表格
这个数据集核心目标是收集各类意图识别数据集,并将其重新组织成提示词(prompt)格式,专门用于支持大语言模型在小样本学习场景下的意图识别研究。
其他
文本
这是一个专门为 “高中化学垂直大模型微调” 而构建的中文问答与文本生成数据集。主要来源是三种主流教科书和常见教辅资料,包括苏教版、人教版、鲁教版等,还有化学方程式和畅销教辅如“一本涂书”、“教材帮”。
教育
文本
中英双语数据集为汉语学习(HSK)和机器翻译设计的中英双语平行语料库。包含超过20,000条英文句子及其对应的中文翻译。每条数据都额外标注了汉语拼音和句子核心词汇所属的HSK等级。
教育
文本
这是一个用于计算机视觉(CV)任务的开放源合成数据集,特别设计用于 跌倒检测 、 姿态估计 和 事件监控 ,数据来源于顶置闭路电视视角。
社会治理
文本
图像
本数据集面向机电一体化系统齿轮故障诊断的机器学习研究,采集了1 个正常齿轮与5 个故障齿轮在不同转速、载荷工况下的振动数据,以 6 个 CSV 文件分别对应 6 种齿轮状态。数据集可支撑两类核心任务:一是相同或任意工况下的齿轮故障分类,二是基于振动测量数据的转速与载荷回归分析,为设备故障预警与健康管理提供数据支撑。
制造
表格
该大型数据集包含一百万条个体的健康相关信息,聚焦与登革热预测相关的各类因素。每条记录涵盖个体姓名、发热、头痛、关节痛、出血等症状的有无,以及登革热患病状态等详细信息。精准标注了对应的登革热感染确诊状态,为登革热预测模型的研发提供全面、系统的数据支撑。
医疗
表格
该数据集包含195,000+条大肠杆菌临床分离株及其抗菌药敏感性测试结果的原始记录。每个条目都记录了特定大肠杆菌基因组对特定抗生素的反应,以及表型解释、实验室方法、测量值等。
医疗
表格
根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。该数据集用于根据性别、年龄、各类疾病及吸烟状况等输入参数预测患者发生中风的可能性。本数据集可用于医疗风险预测和中风相关的学术研究。
医疗
文本
该数据集包含2015-2025 年全球80,000+ 次重大地震事件(震级 4.5+),可用于地震风险分析与预测。
交通
文本
该数据集包含1万笔为欺诈检测研究和模型开发设计的合成金融交易。它模拟真实的用户行为和欺诈模式,为测试机器学习模型提供安全的环境,同时不暴露任何真实敏感数据。
金融
文本
该数据集包含500+张高质量的常见水果图片,苹果、香蕉和草莓,分类为新鲜或腐烂。它旨在训练和验证计算机视觉模型,用于水果质量检测、自动分拣和基于人工智能的新鲜度监测。该数据集非常适合图像分类任务、深度学习应用和智能农业系统。
其他
图像
本数据集是一个为计算机视觉和机器学习任务专门收集的精选鹦鹉图像集。它旨在提供多样化的鹦鹉视觉样本,以支持相关模型的训练与评估。
其他
图像
本数据集是一个用于二分类任务的带标签图像数据集,专门设计用于训练和评估计算机视觉模型,使其能够在真实交通环境中准确区分救护车与非救护车车辆。
其他
图像