• 11034
  • 1
  • 0

Cora科学出版物数据

聚合数据 免费

Cora 数据集包含 2708 份科学出版物,分为七类之一。引文网络由 5429 个链接组成。数据集中的每个出版物都由一个 0/​​1 值的词向量描述,表示字典中相应词的缺失/存在。该词典包含 1433 个独特的单词

数据格式:
zip
数据价格:
0.00
¥ 0.00 (zip)
立即下载
立即下载
收藏
收藏
咨询
数据介绍 / Introduce
Cora 数据集由机器学习论文组成。这些论文分为以下七类之一:
以案例为基础
遗传算法
神经网络
概率_方法
强化_学习
Rule_Learning
理论

这些论文的选择方式使得在最终的语料库中每篇论文都引用或被至少另一篇论文引用。全语料库有2708篇论文。

在词干和删除停用词之后,我们得到了一个大小为 1433 个唯一词的词汇表。所有文档频率小于 10 的单词都被删除。

目录包含两个文件:

.content 文件包含以下格式的论文描述:
数据列表 / List
×

《聚合用户服务协议》

我已仔细阅读上述协议,
并确保合法使用此数据,不得用于一切违法行为

我再想想
同意
×

购买此数据块才能下载,
是否立即购买?

我再想想 立即购买
×


是否立即开通会员?

我再想想 去开通
数 据 驱 动 未 来
Data Drives The Future
0512-88869195
数 据 驱 动 未 来
Data Drives The Future