我们可提供 Google、Bing、DuckDuckGo、Yandex等全球搜索引擎获取的精准数据,整合为数据集模块用于ai多模态数据训练。
其他
文本
图像
视频
数据涉及全国行政村数据,包含:省、市、区、镇、村五级名称、邮编、行政区划代码等字段。是任何涉及中国地理位置分析、区域管理或地址处理的系统和应用的重要基础数据
政务服务
表格
卫星遥感数据具备优秀的客观性、时效性与颗粒度,并且不受人为偏差和报告滞后影响,尔特数科将原始卫星遥感影像转化为结构化、可直接用于时间序列分析的数据集、统计指标。覆盖336个中国地级行政区域以及95个主要G20国家城市,适用于金融、经济增长、投资与交易、供应链监控、ESG风险评估、宏观经济追踪等多元化应用场景,并可提供数据分析报告等定制化数据服务。
其他
3D&空间
图&网络
其他
全网最全面的微积分习题详细解答。 八大主题: 极限与连续、一元函数微分学、一元函数微分学、多元函数微分学、多元函数积分学、无穷级数、微分方程、高阶数学内容。 本数据集适合用作: 大模型基准能力测试,难度适中,标准化极高。 知识库平台搭建:本数据构建的腾讯ima知识库:微积分每日一题,已被评选为精品数据集。 学术研究:为学生高频难题、网红题、答疑常见题,有助于发现试题难度与知识点之间的隐藏关系。
教育
文本
图像
试题网聚焦新高考、新课标、新教材、整合全学段优质测评资源,日更新速度1万+,目前平台以开放生态合作的方式,面向教育机构、学校、教培企业、教育科技公司等各类合作伙伴,提供灵活多元的合作模式:包括试题资源 API 接口对接、定制化题库共建、联合产品开发、品牌合作推广等。合作伙伴可借助平台成熟的资源体系、技术支撑与运营经验,快速补充优质内容供给、降低研发成本、提升产品竞争力,精准触达目标用户群体。
人力资源
文本
图像
生物&化学
本数据集系统收录了1750年至2021年全球分国别的化石燃料二氧化碳排放量,并与同年度、同国家的人口统计数据精确配对。历史碳排放数据基于各时期的工业活动水平进行科学重建,确保近三个世纪数据序列的连续性与可比性,为研究人类活动对气候变化的长期影响提供权威定量基础。
社会治理
文本
本数据集是一部记录现代奥林匹克运动会百年历程的“数字编年史”,囊括了从1896年雅典首届奥运会至2016年里约奥运会的全部赛事记录。每一行数据不仅代表一位参与个体赛事的运动员,更是一段微观历史的承载,细致刻画了运动员的个人特征(如性别、年龄、身体形态、国籍)及其参与赛事的具体信息(如届次、年份、举办城市、运动项目、比赛项目及获奖情况)。
其他
文本
本数据集提供了一个宝贵的窗口,让我们得以深入探究美国银行在2017年至2023年间所受理的消费者金融产品与服务投诉。数据源自美国消费者金融保护局的官方记录,详尽记录了每起投诉的完整生命周期——从消费者提交、CFPB受理并转交公司,到公司最终做出回应。通过分析这些真实反馈,我们可以精准洞察消费者在信贷、储蓄、抵押贷款等核心业务领域遇到的主要痛点、银行的响应效率及典型的争议解决模式。
金融
文本
本项目基于从12万多名航空乘客收集的详尽满意度调查数据,深入剖析旅客体验核心要素。数据集囊括乘客基础信息、旅行特征(如客户类型、出行目的、舱位等级)以及涵盖清洁度、舒适度、服务水平等16个维度的精细化评价指标。通过机器学习与统计分析,本项目旨在揭示航空服务质量的关键驱动因素,为航司精准优化服务体验提供数据支撑。
交通
文本
表格
本数据集收录了2017年末从Goodreads.com用户公开书架抓取的超过100万条书评数据,涵盖13,000余本图书。核心包含两个数据表:"works"表提供了每本书的详细元数据,如作者、出版年份、页数、体裁、评分等;"reviews"表则包含了"works"表中对应图书的英文文本评论子集,评论中的剧透内容已在原始文本中进行了特殊标记。
其他
文本
表格
全语种自动语音识别(ASR)语料库是一套覆盖数百种低资源与长尾语言的大规模语音转录数据,旨在解决全球语音技术在“小语种缺乏训练数据”这一长期瓶颈。数据涵盖自然对话、真实发音特点及多语种标注,可用于训练通用语音识别模型、语种识别系统,以及研究跨语言迁移、低资源语音建模等问题。该语料库大幅降低多语言 ASR 开发门槛,为构建面向全球、多语种应用的语音系统提供了关键基础。
其他
文本
音频
该数据集提供了1905年至2024年尼泊尔喜马拉雅山脉登山探险的全面记录。该报告包含89,000+名成员、11,000+次探险和480座山峰的详细信息,包括日期、成功案例和重要事件。该数据集旨在全面、结构化地记录在喜马拉雅山脉进行的登山探险活动的所有相关信息。它不仅是登山历史的档案,更是进行学术研究、安全分析、商业运营和公共知识普及的基础。
文旅
文本
本古诗词数据集涵盖经典诗作(如王之涣《登鹳雀楼》),包含诗歌原文、作者、创作时间、主题标签(写景、励志等)、译文、注释、赏析及背景等多维度信息,核心价值在于为文化研究、教育教学、AI文本生成等场景提供结构化素材。可解决古诗知识普及、传统文化数字化传承、诗词主题分类与情感分析等问题,适用于中小学古诗教学辅助、古典文学科研数据支撑及文旅内容开发。
教育
文本
从2014年1月2日到2024年1月10日的纳斯达克指数每分钟K线数据,包含开盘价,最高价,最低价,收盘价
金融
文本
提供高清小学教科书PDF资源,覆盖全学科核心知识点,支持随时随地在线查阅、离线下载与精准检索,助力构建便捷高效的数字化学习环境。 1. 解决家长辅导缺乏教材参考、学生课前预习/课后复习无实体书的痛点; 2. 适配教师备课查资料、课堂投屏展示等教学场景,降低教具准备成本; 3. 满足偏远地区学子、临时急需教材用户的资源获取需求。
教育
其他
本数据集对 2015 至 2025 年间特斯拉在全球范围内的电动汽车(EV)表现进行了全面分析。内容详细涵盖了交付量、生产数量、平均车辆成本、电池容量、续航里程,以及各车型和地区的二氧化碳减排量等指标。 这些信息展示了特斯拉在过去十年中的增长趋势、技术进步和环境成效。该数据集可用于电动汽车领域的预测分析、数据建模、可视化以及可持续发展研究。
能源
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
维普拥有7800万高质量中文学术期刊数据,覆盖全科学领域,拥有合规版权,可用于各类基础大模型、垂类/细分行业模型训练。
其他
文本
表格
我们可提供 Google、Bing、DuckDuckGo、Yandex等全球搜索引擎获取的精准数据,整合为数据集模块用于ai多模态数据训练。
其他
文本
图像
视频
数据涉及全国行政村数据,包含:省、市、区、镇、村五级名称、邮编、行政区划代码等字段。是任何涉及中国地理位置分析、区域管理或地址处理的系统和应用的重要基础数据
政务服务
表格
卫星遥感数据具备优秀的客观性、时效性与颗粒度,并且不受人为偏差和报告滞后影响,尔特数科将原始卫星遥感影像转化为结构化、可直接用于时间序列分析的数据集、统计指标。覆盖336个中国地级行政区域以及95个主要G20国家城市,适用于金融、经济增长、投资与交易、供应链监控、ESG风险评估、宏观经济追踪等多元化应用场景,并可提供数据分析报告等定制化数据服务。
其他
3D&空间
图&网络
其他
全网最全面的微积分习题详细解答。 八大主题: 极限与连续、一元函数微分学、一元函数微分学、多元函数微分学、多元函数积分学、无穷级数、微分方程、高阶数学内容。 本数据集适合用作: 大模型基准能力测试,难度适中,标准化极高。 知识库平台搭建:本数据构建的腾讯ima知识库:微积分每日一题,已被评选为精品数据集。 学术研究:为学生高频难题、网红题、答疑常见题,有助于发现试题难度与知识点之间的隐藏关系。
教育
文本
图像
试题网聚焦新高考、新课标、新教材、整合全学段优质测评资源,日更新速度1万+,目前平台以开放生态合作的方式,面向教育机构、学校、教培企业、教育科技公司等各类合作伙伴,提供灵活多元的合作模式:包括试题资源 API 接口对接、定制化题库共建、联合产品开发、品牌合作推广等。合作伙伴可借助平台成熟的资源体系、技术支撑与运营经验,快速补充优质内容供给、降低研发成本、提升产品竞争力,精准触达目标用户群体。
人力资源
文本
图像
生物&化学
本数据集系统收录了1750年至2021年全球分国别的化石燃料二氧化碳排放量,并与同年度、同国家的人口统计数据精确配对。历史碳排放数据基于各时期的工业活动水平进行科学重建,确保近三个世纪数据序列的连续性与可比性,为研究人类活动对气候变化的长期影响提供权威定量基础。
社会治理
文本
本数据集是一部记录现代奥林匹克运动会百年历程的“数字编年史”,囊括了从1896年雅典首届奥运会至2016年里约奥运会的全部赛事记录。每一行数据不仅代表一位参与个体赛事的运动员,更是一段微观历史的承载,细致刻画了运动员的个人特征(如性别、年龄、身体形态、国籍)及其参与赛事的具体信息(如届次、年份、举办城市、运动项目、比赛项目及获奖情况)。
其他
文本
本数据集提供了一个宝贵的窗口,让我们得以深入探究美国银行在2017年至2023年间所受理的消费者金融产品与服务投诉。数据源自美国消费者金融保护局的官方记录,详尽记录了每起投诉的完整生命周期——从消费者提交、CFPB受理并转交公司,到公司最终做出回应。通过分析这些真实反馈,我们可以精准洞察消费者在信贷、储蓄、抵押贷款等核心业务领域遇到的主要痛点、银行的响应效率及典型的争议解决模式。
金融
文本
本项目基于从12万多名航空乘客收集的详尽满意度调查数据,深入剖析旅客体验核心要素。数据集囊括乘客基础信息、旅行特征(如客户类型、出行目的、舱位等级)以及涵盖清洁度、舒适度、服务水平等16个维度的精细化评价指标。通过机器学习与统计分析,本项目旨在揭示航空服务质量的关键驱动因素,为航司精准优化服务体验提供数据支撑。
交通
文本
表格
本数据集收录了2017年末从Goodreads.com用户公开书架抓取的超过100万条书评数据,涵盖13,000余本图书。核心包含两个数据表:"works"表提供了每本书的详细元数据,如作者、出版年份、页数、体裁、评分等;"reviews"表则包含了"works"表中对应图书的英文文本评论子集,评论中的剧透内容已在原始文本中进行了特殊标记。
其他
文本
表格
全语种自动语音识别(ASR)语料库是一套覆盖数百种低资源与长尾语言的大规模语音转录数据,旨在解决全球语音技术在“小语种缺乏训练数据”这一长期瓶颈。数据涵盖自然对话、真实发音特点及多语种标注,可用于训练通用语音识别模型、语种识别系统,以及研究跨语言迁移、低资源语音建模等问题。该语料库大幅降低多语言 ASR 开发门槛,为构建面向全球、多语种应用的语音系统提供了关键基础。
其他
文本
音频
该数据集提供了1905年至2024年尼泊尔喜马拉雅山脉登山探险的全面记录。该报告包含89,000+名成员、11,000+次探险和480座山峰的详细信息,包括日期、成功案例和重要事件。该数据集旨在全面、结构化地记录在喜马拉雅山脉进行的登山探险活动的所有相关信息。它不仅是登山历史的档案,更是进行学术研究、安全分析、商业运营和公共知识普及的基础。
文旅
文本
本古诗词数据集涵盖经典诗作(如王之涣《登鹳雀楼》),包含诗歌原文、作者、创作时间、主题标签(写景、励志等)、译文、注释、赏析及背景等多维度信息,核心价值在于为文化研究、教育教学、AI文本生成等场景提供结构化素材。可解决古诗知识普及、传统文化数字化传承、诗词主题分类与情感分析等问题,适用于中小学古诗教学辅助、古典文学科研数据支撑及文旅内容开发。
教育
文本
从2014年1月2日到2024年1月10日的纳斯达克指数每分钟K线数据,包含开盘价,最高价,最低价,收盘价
金融
文本
提供高清小学教科书PDF资源,覆盖全学科核心知识点,支持随时随地在线查阅、离线下载与精准检索,助力构建便捷高效的数字化学习环境。 1. 解决家长辅导缺乏教材参考、学生课前预习/课后复习无实体书的痛点; 2. 适配教师备课查资料、课堂投屏展示等教学场景,降低教具准备成本; 3. 满足偏远地区学子、临时急需教材用户的资源获取需求。
教育
其他
本数据集对 2015 至 2025 年间特斯拉在全球范围内的电动汽车(EV)表现进行了全面分析。内容详细涵盖了交付量、生产数量、平均车辆成本、电池容量、续航里程,以及各车型和地区的二氧化碳减排量等指标。 这些信息展示了特斯拉在过去十年中的增长趋势、技术进步和环境成效。该数据集可用于电动汽车领域的预测分析、数据建模、可视化以及可持续发展研究。
能源
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
维普拥有7800万高质量中文学术期刊数据,覆盖全科学领域,拥有合规版权,可用于各类基础大模型、垂类/细分行业模型训练。
其他
文本
表格