销售模拟数据集是一个为模拟客户购买行为而人工生成的数据集。该数据集包含客户人口统计特征、购买详情、忠诚度计划参与情况以及交易结果的详细信息,非常适用于客户行为分析、忠诚度计划评估和购买模式预测,可用于客户分群、销售预测、营销策略优化等业务场景。
消费
表格
本数据集提供国家尺度的历史数据,涵盖二氧化碳排放量、温室气体、人口、国内生产总值(GDP)及温度相关指标。时间跨度覆盖1750 年至近年,适用于长期趋势分析、政策研究及气候模型构建。
能源
文本
智能题库数据集,全量含 1100 万道习题数据,其中 570 万道为深度结构化精品数据,可支撑 K12 同步练习、升学备考、专题强化等场景,适配教育平台 API 对接与 AI 个性化学习服务,为教与学效率提升、学情分析决策及教育产品数据化升级提供核心数据支撑,推动优质习题数据标准化普惠
教育
文本
图像
数据集覆盖了环境科学中的五个核心领域(每类都有大量样本): 气候变化与大气科学 生态系统与生物多样性保护 水资源与水环境 土壤与与土地使用管理 可再生能源与环境管理
其他
文本
用简介 (introduction) + metadata(title / author / publisher) 训练模型生成小说简介、封面 blurb、短推荐语等。
教育
文本
一个中文文本分类/翻译任务 数据集,主要包含约 98 万条中文句子对,结构简单,适合做现代文本翻译成文言文、文本风格转换或语言学习相关任务
教育
文本
本数据集面向火灾安全与应急监测场景,聚焦火焰、烟雾及人员三类关键目标的联合检测问题。通过对复杂真实场景中火情与人员分布的精细标注,可有效提升智能视觉系统在火灾早期预警、人员受困识别与风险评估中的准确性与实用性。数据集适用于智慧消防、工业安全监控、无人机巡检及应急救援辅助决策等典型应用场景,为构建高可靠性安全感知模型提供高质量数据支撑。
其他
图像
该数据集源于一个旨在降低高等教育辍学率和学业失败率的研究项目,数据来源葡萄牙一所高等教育机构,整合自多个离散数据库。。其核心目标是利用学生入学时即可获取的数据,构建预测模型,在学术生涯的早期阶段识别出“高风险”学生。这样,学校就可以有针对性地实施辅导、经济援助或心理支持等策略,从而提高整体毕业率。
教育
文本
表格
BitcoinHeist数据集是一个高质量、具有挑战性且极具实用价值的区块链安全数据集。 它的核心价值在于将复杂的比特币交易行为转化为可量化的图拓扑特征,为利用机器学习技术打击加密货币相关的金融犯罪提供了强大的数据基础。任何基于此数据集的研究都必须重点关注其时间序列特性和类别不平衡问题,以确保模型评估结果的可靠性和泛化能力。
其他
文本
时序
表格
高清AI图片真人写真集,古代生活坐卧行走,包含汉服各种设计元素和应用灵感,是丰富设计经验和汉服制作的生动样本。
其他
图像
专业准确的人物关系数据信息,所有信息均由本人校验,由此把各行业信任汇集在一个平台上,最终实现任何人都是“数字熟人”
其他
文本
这是一个专门为训练和评估能够进行多轮对话的AI聊天机器人而设计的高质量对话数据集。它包含了用户与AI之间模拟真实世界聊天模式的对话,覆盖了从问候、问答到情感交流、技术咨询等55种以上的对话意图。
其他
文本
表格
这是一个精心策划的高质量人脸图像数据集,专为现代人工智能应用设计。该数据集提供了多样化的人脸图像集合,涵盖不同年龄、性别、种族和表情特征,为计算机视觉和深度学习研究提供了优质的训练素材。
其他
图像
该数据集是一个综合性的合成数据集,旨在模拟2020年至2024年五年间,全球50个国家的每日气候条件与能源经济指标,为研究气候变化、能源消费和工业活动之间的复杂关系提供高质量的数据基础。
能源
文本
表格
本数据集收录多部经典与现代英文小说的TXT全文,经净化处理移除所有网址,提供高质量、可直接使用的纯文本资源。
其他
文本
POS机、保险、抵押理财、股票、基金、理财、信贷、保险、贷款、基金金融理财、信用卡、3C数码、电商、共享单车、酒店预订、客服、大数据、购物等场景的对话中文语音数据
其他
音频
我们将YouTube全站的数据整合为数据集,目前youtube视频每日新增 10PB+,覆盖字幕、音视频/图片等数据,该数据集可用于ai多模态数据训练,科研与教育数据支撑等;
其他
图像
音频
视频
我们可提供社交媒体数据集涵盖 Facebook、Instagram、X(Twitter)、Linkedln、YouTube、Tik Tok等平台对应账号的发布内容、点赞数、标签、转发、评论情感适用于舆情分析、多模态训练、内容审核模型训练。
其他
文本
图像
视频
我们可提供电商Amazon、Walmart 、Shopee等平台数据集用于电商市场调研。支持通过 SFTP 等接收CSV、JSON 格式数据。
其他
文本
图像
视频
我们可提供 Google、Bing、DuckDuckGo、Yandex等全球搜索引擎获取的精准数据,整合为数据集模块用于ai多模态数据训练。
其他
文本
图像
视频
销售模拟数据集是一个为模拟客户购买行为而人工生成的数据集。该数据集包含客户人口统计特征、购买详情、忠诚度计划参与情况以及交易结果的详细信息,非常适用于客户行为分析、忠诚度计划评估和购买模式预测,可用于客户分群、销售预测、营销策略优化等业务场景。
消费
表格
本数据集提供国家尺度的历史数据,涵盖二氧化碳排放量、温室气体、人口、国内生产总值(GDP)及温度相关指标。时间跨度覆盖1750 年至近年,适用于长期趋势分析、政策研究及气候模型构建。
能源
文本
智能题库数据集,全量含 1100 万道习题数据,其中 570 万道为深度结构化精品数据,可支撑 K12 同步练习、升学备考、专题强化等场景,适配教育平台 API 对接与 AI 个性化学习服务,为教与学效率提升、学情分析决策及教育产品数据化升级提供核心数据支撑,推动优质习题数据标准化普惠
教育
文本
图像
数据集覆盖了环境科学中的五个核心领域(每类都有大量样本): 气候变化与大气科学 生态系统与生物多样性保护 水资源与水环境 土壤与与土地使用管理 可再生能源与环境管理
其他
文本
用简介 (introduction) + metadata(title / author / publisher) 训练模型生成小说简介、封面 blurb、短推荐语等。
教育
文本
一个中文文本分类/翻译任务 数据集,主要包含约 98 万条中文句子对,结构简单,适合做现代文本翻译成文言文、文本风格转换或语言学习相关任务
教育
文本
本数据集面向火灾安全与应急监测场景,聚焦火焰、烟雾及人员三类关键目标的联合检测问题。通过对复杂真实场景中火情与人员分布的精细标注,可有效提升智能视觉系统在火灾早期预警、人员受困识别与风险评估中的准确性与实用性。数据集适用于智慧消防、工业安全监控、无人机巡检及应急救援辅助决策等典型应用场景,为构建高可靠性安全感知模型提供高质量数据支撑。
其他
图像
该数据集源于一个旨在降低高等教育辍学率和学业失败率的研究项目,数据来源葡萄牙一所高等教育机构,整合自多个离散数据库。。其核心目标是利用学生入学时即可获取的数据,构建预测模型,在学术生涯的早期阶段识别出“高风险”学生。这样,学校就可以有针对性地实施辅导、经济援助或心理支持等策略,从而提高整体毕业率。
教育
文本
表格
BitcoinHeist数据集是一个高质量、具有挑战性且极具实用价值的区块链安全数据集。 它的核心价值在于将复杂的比特币交易行为转化为可量化的图拓扑特征,为利用机器学习技术打击加密货币相关的金融犯罪提供了强大的数据基础。任何基于此数据集的研究都必须重点关注其时间序列特性和类别不平衡问题,以确保模型评估结果的可靠性和泛化能力。
其他
文本
时序
表格
高清AI图片真人写真集,古代生活坐卧行走,包含汉服各种设计元素和应用灵感,是丰富设计经验和汉服制作的生动样本。
其他
图像
专业准确的人物关系数据信息,所有信息均由本人校验,由此把各行业信任汇集在一个平台上,最终实现任何人都是“数字熟人”
其他
文本
这是一个专门为训练和评估能够进行多轮对话的AI聊天机器人而设计的高质量对话数据集。它包含了用户与AI之间模拟真实世界聊天模式的对话,覆盖了从问候、问答到情感交流、技术咨询等55种以上的对话意图。
其他
文本
表格
这是一个精心策划的高质量人脸图像数据集,专为现代人工智能应用设计。该数据集提供了多样化的人脸图像集合,涵盖不同年龄、性别、种族和表情特征,为计算机视觉和深度学习研究提供了优质的训练素材。
其他
图像
该数据集是一个综合性的合成数据集,旨在模拟2020年至2024年五年间,全球50个国家的每日气候条件与能源经济指标,为研究气候变化、能源消费和工业活动之间的复杂关系提供高质量的数据基础。
能源
文本
表格
本数据集收录多部经典与现代英文小说的TXT全文,经净化处理移除所有网址,提供高质量、可直接使用的纯文本资源。
其他
文本
POS机、保险、抵押理财、股票、基金、理财、信贷、保险、贷款、基金金融理财、信用卡、3C数码、电商、共享单车、酒店预订、客服、大数据、购物等场景的对话中文语音数据
其他
音频
我们将YouTube全站的数据整合为数据集,目前youtube视频每日新增 10PB+,覆盖字幕、音视频/图片等数据,该数据集可用于ai多模态数据训练,科研与教育数据支撑等;
其他
图像
音频
视频
我们可提供社交媒体数据集涵盖 Facebook、Instagram、X(Twitter)、Linkedln、YouTube、Tik Tok等平台对应账号的发布内容、点赞数、标签、转发、评论情感适用于舆情分析、多模态训练、内容审核模型训练。
其他
文本
图像
视频
我们可提供电商Amazon、Walmart 、Shopee等平台数据集用于电商市场调研。支持通过 SFTP 等接收CSV、JSON 格式数据。
其他
文本
图像
视频
我们可提供 Google、Bing、DuckDuckGo、Yandex等全球搜索引擎获取的精准数据,整合为数据集模块用于ai多模态数据训练。
其他
文本
图像
视频