聚合数据为您提供从入驻到变现的全方位支持。我们是您的"金牌销售",更是您的"安全技术官"

icon

高额预付,锁定收益

经平台评估高商业价值的数据集,我们率先认可并提供高达60%的定价预付款,签订独家代理或代经营合同。

icon

专业撮合,持续分佣

优质数据轻松变现,精准撮合交易,持续享受佣金分成,实现数据资产的长期增值。

icon

安全可信,技术护航

银行级隐私计算与加密技术,全程保障您的数据资产安全与合规,无忧上传,放心交易。

icon

双重激励,现金大奖

额外设立¥200万奖金池加持!这不仅是一个变现平台,更是一个奖励卓越的赛道。

数据征集期

2025.11.10 - 2026.01.02

专家评审期

2026.01.03 - 2026.01.13

结果公布

2026.01.14
"百强先锋奖"
100席

评选规则:征集期结束后,专家评审团将依据《高质量数据集官方评判标准》,从所有参赛作品中评选出100个最具价值的数据集。

「奖励」 ¥1000元奖金 + ¥1000元聚合数据平台现金券
「荣誉」 聚合数据和苏州人工智能联合颁发《数据启元计划 · 优质数据》荣誉证书
「福利」

获奖数据集将作为官方认证精选数据集,优先上架至聚合数据平台进行售卖

“免申即享”苏州相关人工智能政策

"数据创新奖"
10席

评选流程:专家评审团将从“百强先锋奖”获得者中,评选出10个在应用场景、数据维度或技术上最具创新性的数据集(不与“三强奖”重叠)。

「奖励」 额外奖励¥10000元奖金
「荣誉」 聚合数据和苏州人工智能联合颁发《数据启元计划 · 创新数据》荣誉证书
「福利」

获奖数据集将作为官方认证精选数据集,优先上架至聚合数据平台进行售卖

“免申即享”苏州相关人工智能政策

"巅峰对决"三强奖

评选流程:专家评审团将从100位“先锋奖”获得者中,评选出冠、亚、季军。

「荣誉」 聚合数据和苏州人工智能联合颁发《数据启元计划 · 巅峰数据》荣誉证书
「福利」

获奖数据集将作为官方认证精选数据集,优先上架至聚合数据平台进行售卖

“免申即享”苏州相关人工智能政策

一等奖

1席

¥1,000,000

二等奖

1席

¥500,000

三等奖

1席

¥200,000

本次活动评审团由联合主办方「苏州人工智能」与主办方「聚合数据」的资深行业专家共同组成,确保评选的权威、专业与公正。

icon
程超 更多简介

苏州市人工智能重点实验室主任助理、北京大学大数据分析与应用技术国家工程实验室大数据分析技术创新中心主任

icon
王娟 更多简介

北京大学大数据分析与应用技术国家工程实验室特聘副研究员

icon
张衎 更多简介

苏州市人工智能公司首席数据科学家

三步开启您的数据变现之旅

icon
01

注册聚合数据账号

成为"数据启元计划"成员

去注册 →
arrow
icon
02

完成实名认证

确保账户安全与收益发放

去认证 →
arrow
icon
03

提交数据信息

上传数据信息 / 数据字典 / 样本等

即将开放

我们依据《高质量数据集官方评判标准》,从四大维度评估您的数据了解更多评判细则

准入资格

「合规与安全性」

来源合法
权属清晰
严格脱敏

「AI应用价值」

评分占比 60%
高稀缺性
高商业价值
标注精良
蕴含丰富行业知识

「数据基础质量」

评分占比 30%
准确性
完整性
一致性

「文档与易用性」

评分占比 10%
元数据完整
数据字典清晰
格式规范
Q 谁可以参加?
A

无论您是个人开发者、科研人员,还是企业数据团队,我们都热烈欢迎 。

Q 我需要上传全部数据吗?
A

在活动征集期间,您无需上传完整数据。仅需按照指引提交数据集的元数据、数据字典和一份已脱敏的数据样本(如50条记录)供专家评审。

Q 如何保证我的数据安全与合规?
A

我们有严格的审核机制,您也需要签署《数据合规承诺书》。平台严禁任何包含原始个人身份信息的数据。我们承诺对您提交的非公开信息负有严格的保密义务。

主办方

天聚地合(苏州)科技股份有限公司

联合主办方

苏州市人工智能有限公司
1
提交者信息
2
数据集基础信息
3
数据细节描述
4
AI应用价值
5
合规声明

一、提交者信息

请确保您的联系信息准确无误,以便我们进行活动通知、奖金发放及盛典邀请

如与注册手机号不同,请补充完善

二、数据集基础信息

请提供您数据集的“名片”,这是它给评审的第一印象

已输入 0/200 字
介绍该数据集的基础信息、使用场景、子数据集、用途等。支持 Markdown 格式

三、数据细节描述

这是您数据集的技术核心,请尽可能详细、准确地填写

例如:1,000,000条记录、10000 个音频
例如:50,000个文件
例如:500 GB / 2 TB
例如:1000小时音频 / 10亿Tokens

点击上传数据字典

支持 .xlsx, .csv, .md, .pdf, .txt 格式,建议不超过1MB

必须上传,解释所有字段含义

点击上传脱敏数据样本

支持 .csv, .json, .txt, .zip, .rar, .7z 格式,建议不超过20MB

请务必确保样本已完全脱敏!

四、AI应用价值信息

请说明您的数据集如何被AI模型使用,这是评估其价值的关键

五、合规与权利声明

这是提交的最后一步,请仔细阅读并确认

提交前请确认

  • 所有必填信息已完整填写
  • 上传的文件已完成脱敏处理
  • 已阅读并同意相关合规承诺
  • 提交后可在"我的数据集"中查看和管理

请先登录

暂时无法查看你上传的数据集,点击快捷登录

高质量数据集官方评判标准

前言

为响应国家"人工智能+"行动号召,推动数据要素高质量发展,并确保"数据启元计划"的公平、公正与高标准,我们依据《高质量数据集建设指引》等行业权威文件,特制定本评判标准。

本标准旨在定义平台对于"高质量数据集"的价值主张,并为所有数据供应商提供一套清晰、透明、可执行的提交与评估指南。我们的目标是:让真正的价值获得市场的最高认可与回报。

核心评判维度与评分占比

所有提交的数据集信息,将由平台专家评审团从以下四大维度进行综合评估。

  • 维度一"一票否决项",是参与评选的必备门槛,不计入总分。
  • 维度二、三、四为评分项,总分100分,具体评分占比如下:
评判维度 核心价值 评分占比
维度一:合规与安全性 一票否决项 (资格准入)
维度二:数据基础质量 决定数据集的"可用性" 30%
维度三:AI应用价值 决定数据集的"含金量" 60%
维度四:文档与易用性 决定数据集的"用户体验" 10%

一票否决 维度一:合规与安全性 (一票否决项)

这是平台准入的基石,任何不符合此维度标准的数据集将不被接纳。

核心指标 评判标准
1. 来源合法性 数据采集方式必须符合国家法律法规,严禁通过非法手段获取。供应商需签署《数据合规承诺书》。
2. 隐私安全性 严格遵守《个人信息保护法》等法规。若涉及个人信息,必须提供已获得用户明确授权的证明,或已完成专业、不可逆的匿名化/脱敏处理。
3. 权属清晰性 供应商必须拥有该数据的完整所有权或合法的转售、授权权利,无任何版权纠纷。
4. 内容价值观 数据内容不得违反社会主义核心价值观,不得包含歧视性、商业违法、侵犯他人合法权益等非法内容。

30% 维度二:数据基础质量 (评分占比 30%)

我们参考国家标准,从数据的"健康度"评估其是否稳定、可靠。

核心指标 评判标准
5. 准确性 数据值与其所代表的真实世界实体相符,标签、数值、描述无明显错误。
6. 完整性 结构完整,关键字段的缺失值比例在合理范围内。
7. 一致性 数据在整个集合中保持格式、单位、术语、分类标准等的统一。
8. 真实性 非合成数据能追溯到采集源头;合成数据能追溯生成算法和过程,且符合目标场景的真实分布规律。

60% 维度三:AI应用价值 (评分占比 60%)

这是评定最终奖项的核心依据,重点评估数据对AI模型训练与产业应用的实际贡献。

核心指标 评判标准
9. 稀缺性与价值 (核心) 数据是否难以通过公开渠道获取?是否锚定产业痛点、具备高商业应用价值?
10. 知识密度 (核心) 数据是否蕴含丰富的行业知识、逻辑关系或推理链条?是否为"行业专识"而非"通识"数据集?
11. 标注质量 (针对已标注数据) 标注是否精准、规范?是否采用多模态、思维链等高级标注方法?
12. 多样性与均衡性 数据是否覆盖多场景、多类别,特别是边缘案例 (Edge Cases)?类别分布是否相对均衡?
13. 时效性 数据的采集时间和更新频率是否满足目标应用场景的要求?

10% 维度四:文档与易用性 (评分占比 10%)

一份没有"说明书"的数据,价值将大打折扣。规范的文档是高质量的必要组成部分。

核心指标 评判标准
14. 元数据完整性 必须提供清晰的元数据,包括:数据集规模、格式、采集方法、时间范围、地理覆盖、更新频率等。
15. 数据字典清晰度 必须提供详细的数据字典,解释每个字段的名称、数据类型、单位、含义及枚举值。
16. 格式规范性 数据应采用行业通用的、机器可读的标准格式(如CSV, JSON, Parquet等),便于用户直接使用。

最终奖项评判细则

所有奖项均在通过"维度一"合规审核的数据集中评选产生。

🏆 一、"百强先锋奖"

  • 评选标准:依据「核心评判维度与评分占比」的总分(100分制) 进行排名,总分排名前100的数据集,将获得"百强先锋奖"。
  • 评选目标:此奖项旨在奖励综合质量最高、最具市场潜力的100个数据集。

💡 二、"数据创新奖"

  • 评选标准:专家评审团将从"百强先锋奖"获得者中,评选出10个在 应用场景、数据维度或技术方法 上最具创新性的数据集。
  • 评选目标:此奖项旨在鼓励和发掘具有开创性思维的数据集,其总分可能不是最高的,但在某一方面的创新能带来新的启发。
  • 约束条件:此奖项不与"三强巅峰奖"重叠。
  • "创新性"参考指标
    • 应用场景创新:将数据应用于一个全新的领域或解决一个前所未有的问题。
    • 数据维度创新:采集或标注了全新的数据特征、标签体系或模态。
    • 技术方法创新:在数据采集、合成、清洗或标注过程中使用了独特或前沿的技术手段。

👑 三、"三强巅峰奖"

  • 评选标准:专家评审团将从"百强先锋奖"获得者中,依据以下"维度三:AI应用价值"的S级标准,结合总分排名,评选出冠、亚、季军。
  • 评选目标:此奖项旨在嘉奖综合价值最顶尖、最能代表行业未来方向的3个数据集。
核心指标 百强先锋奖 三强巅峰奖
稀缺性与价值 高价值、较稀缺。 数据集针对明确的行业痛点,具有很高的商业应用潜力,且难以通过常规公开渠道获取。 独家性、决定性价值。 数据集具有独家性或极高的获取壁垒。它不仅能解决当前问题,更有可能开创新的应用场景或商业模式。
知识密度 行业通识级。 数据集蕴含丰富的行业通用知识和逻辑,是构建强大行业模型所必需的"高质量燃料"。 行业专识级、含推理链。 数据集包含深度的领域专业知识、复杂的逻辑关系甚至是"思维链"过程,能让模型学会"推理"。
标注质量 专业级精准。 (针对已标注数据) 标注精准、一致性高,由专业人员完成,能够满足主流AI任务的需求。 专家级/开拓性标注。 (针对已标注数据) 标注极其精细,由多位领域专家交叉验证,或包含复杂、前沿的标注类型。
多样性与均衡性 覆盖广泛。 数据全面覆盖了目标场景下的常见情况和一部分边缘案例,类别分布合理。 极限工况、高度鲁棒。 数据刻意、大量地包含了极其罕见但至关重要的边缘案例,能极大提升模型的鲁棒性。
时效性 高时效性。 数据是近期的,能够反映当前或近期的真实业务状况。 实时性/高频更新。 数据具有很强的时效性,可能是实时产生或高频更新的,对预测类模型价值巨大。

比赛结果揭晓时间

公布时间 2026年01月14日

所有提交的数据集将经过专家评审团的严格评审,评审工作将于2026.01.03 - 2026.01.13进行
我们将在公布时间准时发布最终获奖名单

1
三强巅峰奖
冠亚季军
数据创新奖
10名
百强先锋奖
100名
感谢您的耐心等待。获奖名单将通过官网及邮件通知的方式发布
程超头像
程超

苏州市人工智能重点实验室主任助理、北京大学大数据分析与应用技术国家工程实验室大数据分析技术创新中心主任

简介

主要研究方向是智能化治理、下一代人工智能、数据要素运营等,具有丰富大数据、人工智能及智慧城市顶层设计和落地实施经验。中国大数据产业发展指数、中国数字经济产业发展指数总负责人,参与多项科技部重点研发计划、重大专项,取得发明专利及软著20余项。
先后参与负责北京市海淀区、东城区、经济开发区、上海化工区、江苏盐城、苏州吴江区、安徽合肥、宁夏银川、云南玉溪、贵州黔西南等地大数据和智慧城市顶层设计咨询和项目落地;以及国家开发银行、全国煤炭交易中心、北京一卡通、安徽交控集团、方正信产等大型国企的数字化转型总体设计和技术支撑。

程超头像
王娟

北京大学大数据分析与应用技术国家工程实验室特聘
副研究员

简介

管理学博士,北京大学博士后,研究方向为数字生态评估、数据要素市场与企业数字化转型等,发表中英文核心期刊论文13篇,参编《数据要素五论》等书籍7本,参与起草“数字中国”国家政策文件,制定行业和地方标准5项,主持或参与国自然、国央企等数字化管理类课题20余项。

程超头像
张衎

苏州市人工智能公司首席数据科学家

简介

北京大学计算机博士,清华大学经管学院博士后,研究方向为人工智能、数据治理等,发表中英文核心期刊论文10余篇,主持1项国家级基金面上项目,参与国家重点研发计划、国家自然科学基金项目5项,参与编制地方标准2项。
长期从事人工智能领域研发工作,在金融科技、智能决策等具备丰富经验。曾作为核心负责人,主导苏州市金融服务平台的智能化系统建设。目前,正致力于构建新一代人工智能基础设施,主持大模型/智能体评测平台与高质量数据集评测平台等多项关键平台的研发。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future