掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

如何用Python绘制学术报告图表?

论文中图表形式多样,常用的处理工具有excel、MATLAB以及Python等。excel自处理的方法有两个缺陷:

1.当数据较多时,容易出现excel"翻白眼"的现象; 2.需要使用subplot功能或批量处理时,使用MATLAB或Python更为方便; 3.excel处理的图在美观程度上较论文图表标准有一定的距离。

对比MATLAB以及Python的plot功能,从图的美观角度出发,Python稍占优势,下文讲简要介绍将excel中的数据提取到Python中并利用Python的matplotlib库制图的过程。

一.如何将Excel中的数据导入Python中:

此部分主要介绍如何将Excel中的数据导入python中(原始数据可能在.txt或.out文件中,且数据较为繁杂,可以先利用MATLAB或python将数据进行处理存入Excel中,包括一些简单的计算、排列等,以便于之后的绘图,或直接利用python提取.txt中数据,在此不做详细介绍),主要方法是利用python的xlrd库,流程如下:

  1. ##  导入xlrd库

  2. import xlrd

  3. ##  读取指定Excel文件(此处为excel_dir)中的数据

  4. data=xlrd.open_workbook(excel_dir)

  5. ##  读取指定data中某sheet(此处命名为sheetname)中的数据

  6. table=data.sheet_by_name(sheetname)

  7. ## 读取table中某一列的数据

  8. needs=table.col_values(0)

其中有几个需要说明的点:

1.excel_dir和sheetname如何定义?

excel_dir应写成字符串的格式(即' '或者" "),最终应以.xls或.xlsx等Excel的后缀结尾,比如读取Administrator桌面上的名为result.xls的文件可写为:

  1. excel_dir = 'C:\Users\Administrator\Desktop\result.xls'

  2. data=xlrd.open_workbook(excel_dir)

sheetname定义的方法同上,除此之外sheet还有通过索引顺序的读取方法:

  1. table = data.sheets()[0]       ## 通过索引顺序获取

  2. table = data.sheet_by_index(0) ## 通过索引顺序获取

2.如何读取某单元格或者某行的数据?

流程中所示为读取某sheet中某列的数据,同理某行数据为:

  1. table.col_values(i)

读取某单元格数据命令为:

  1. table.cell(i,j).value

3.读取某行或某列数据时,数据的范围是什么?

举个例子:当某sheet中表格如下时,会读取4×3表格中的数据。

即若想读取B列数据,代码应写为

  1. table.col_values(1)

注意:python是从0开始计数的,故column number应为1,此时计入的信息为:[u'',u'',4,u'']

且注意table的维度由各个sheet决定,及若某excel表格有多个sheet,可能出现list长度不同的情况。

4.如果想取某列2-5行如何做呢?

  1. table.col_values(i)[1:5]

5.若想取到最后一个数字,应如何编写代码?

由于各行/列的数据类型可能不同,可能会出现第一列仅4个数字,而第二列有9个数字,而最多的一列有100个数字等类似的情况,若直接用取整列的命令,会使list中掺入u'',导致下一步的绘图出错,此时可以使用如下方法:

  1. a_col=table.col_values(i)

  2. a=a_col[0,a_col.index(u'')]

但需注意,此命令不能对控制行数的列使用,否则也会报错,可编写其他判断语句进行鉴别是否使用该命令。

二.如何利用Python进行绘图:

此处介绍利用matplotlib库进行绘图的方法,首先应导入matplotlib库:

  1. import numpy as np

  2. import matplotlib.pyplot as plt

绘图方法很简单,大致流程如下:

##  绘图命令,1为图号,并设置figsize
fig_drift= plt.figure(1,figsize=(12,4))
##  设置数据在x轴和y轴的坐标,以及颜色、标签等属性,此处用了两组数据
plt.plot(drift[0], story,"g-",label='$Damped$')
plt.plot(drift[1], story,"r-.",label='$Undamped$')
##  设置x轴和y轴的标签
plt.xlabel('Drift')
plt.ylabel('Storey')
##  选择显示数据组标签
plt.legend()
##  设置x轴和y轴的间隔及范围
plt.xticks((0.000,0.005,0.010,0.015))
plt.yticks(range(1,5,1))
##  设置图名
plt.title('minor')

其中需要说明的几点:

1.如何绘制多图?

很简单,只需在设置了图号名之后,插入:

  1. ax2 = plt.subplot(132)

  2. plt.sca(ax2)

后面的命令与前述一致,值得一提的是,plt.subplot(131)指的是绘制一个含有1×3子图的图,且ax2代表的是第2张图,而plt.sca(ax2)表示选择该子图。

2.设置x轴、y轴以及其他命令如何判断是赋予哪张图的属性呢?

matplotlib会直接将该属性赋予上一plot对象。

3.如何绘制散点图?

把pl.plot(x, y)改成pl.plot(x, y, 'o')即可。

4.其他一些设置参数:

##  设置x轴和y轴的上下限
pl.xlim(i, j)
pl.ylim(m,n)
##  显示图
pl.show()
##  保存图,自动存为png格式
plt.savefig(dir+name.png,dpi=600)

除此之外还支持设置x轴(y轴)坐标显示,绘制饼状图、直方图等功能,在此不再一一介绍。

三.说点题外话:

曾经看过一句话:“世界上没有烂语言,只有写语言的烂人”。

每种语言各自有其优势,也有其劣势,在此不做过多评价。如何利用语言实现绘图或达到更多目标,在于我们如何选择。恰到好处地使用for或def、class等语句,能使一段代码如虎添翼,写在这里,作为给自己的提醒:遇到问题先明确方法、形成体系再进入编写,不要盲目地将看似正确的语言进行强行拼凑,返工率极高。

毕竟第一篇,有点激动,再特别介绍一下我们团队的成员吧(虽然只有两个人):算了还是不介绍了。

以上内容若有问题或疑问,请联系excelting@qq.com

原文来自:编程派

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

  • IP反查域名

    IP反查域名是通过IP查询相关联的域名信息的功能,它提供IP地址历史上绑定过的域名信息。

    IP反查域名是通过IP查询相关联的域名信息的功能,它提供IP地址历史上绑定过的域名信息。

  • 人脸卫士

    结合权威身份认证的精准人脸风险查询服务,提升人脸应用及身份认证生态的安全性。人脸风险情报库,覆盖范围广、准确性高,数据权威可靠。

    结合权威身份认证的精准人脸风险查询服务,提升人脸应用及身份认证生态的安全性。人脸风险情报库,覆盖范围广、准确性高,数据权威可靠。

  • 全国城市空气质量

    全国城市和站点空气质量查询,污染物浓度及空气质量分指数、空气质量指数、首要污染物及空气质量级别、健康指引及建议采取的措施等。

    全国城市和站点空气质量查询,污染物浓度及空气质量分指数、空气质量指数、首要污染物及空气质量级别、健康指引及建议采取的措施等。

  • 手机号防骚扰黑名单

    输入手机号和拦截等级,查看是否是风险号码

    输入手机号和拦截等级,查看是否是风险号码

0512-88869195
数 据 驱 动 未 来
Data Drives The Future