有机合成数据集

本数据集通过版面分析与OCR识别技术,从多源文献中提取化学反应的结构化描述(JSON格式)及反应方程式图像。结合自然语言处理,精准解析底物、产物、溶剂、试剂、催化剂、反应条件(时间/温度)及产率等关键参数,构建标准化数据模型。涵盖纤维素、胆固醇等多类核心有机化合物的合成路径,整合反应机理与分子结构数据,为药物研发提供多维参数支持及合成路线优化依据。

行业:
制造
国标分类:
行业专识数据集
135
158
2025-12-19

数据集介绍

发布方

无锡雪浪数制科技有限公司

数据属性

数据模态
文本 图像
数据格式
JSON JPG pdf
记录数/样本数
3000条记录
文件数量
150个文件
总大小
200Mb
地理覆盖范围
全球
时间覆盖范围
2024至今
数据更新频率
每月
数据采集方式
企业自行采集并处理
预期用途
预训练 微调 评估
标注状态
部分标注
标注类型
有机知识结构化抽取
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future