信息可视化(也叫绘图)是数据分析中最重要的⼯作之⼀。它可能是探索过程的⼀部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。
其实做 Python的数据可视化,可以使用的库分别是 Matplotlib 、Seaborn 、Bokeh、 Plotly 、Pyecharts等。
Matplotlib是Python数据可视化库中的泰斗,它已经成为Python中公认的数据可视化工具,通过Matplotlib可以很方便的设计和输出二维以及三维的数据,其提供了常规的笛卡尔坐标,极坐标,球坐标,三维坐标等,其输出的图片质量也达到了科技论文中的印刷质量,日常的基本绘图更不在话下。
Matplotlib 是一个 Python 的 2D绘图库,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。
优势:
1)能将数据进行可视化,更直观的呈现
2)使数据更加客观,更具说服力
在分享Matplotlib之前我们先了解以下几个概念:
画板、画纸的概念
我们知道画画时需要画板和画纸。在matplotlib中也是一个道理。
图形在画板(figure)中绘制完成,而画板又由不同的画布(纸)(axes)构成,具体的图形构建时要指明画板和画布,否则默认一画板一画布。
画板(figure)
画板存在的意义:
1. 控制图像的比例情况(大小) 保存图像
2. 创建一个画板
(num=None, 用于指定在画板上,放几个画布figsize=None, (宽度, 高度)dpi=None, 图像的分辨率facecolor=None, 背景色edgecolor=None, 边界颜色frameon=True,FigureClass,clear=False,**kwargs,linewidth)
画布(axes)
一个坐标系就是一个画布,就是一个图,一个画板上可以有多个坐标系
画布的创建:
画布要创建在画板上(nrows, ncols, index)nrows将画板分为几行,ncols将画板分为几列,index选取使用哪一个被划分的画板
add_subplot(nrows, ncols, index, **kwargs)
add_subplot(pos, **kwargs)
add_subplot(ax)
add_subplot()
画板与画布的关系
matplotlib图标的基本组成:
- 画板figure 呈现出来的坐标系
- 绘图区域axes 【画布】
- x轴和y轴的水平垂直轴线 以及 轴标签
- 轴线上的刻度 以及 对应的刻度标签
- 画布标题
- 图例
如何使用绘图包Matplotlib?
matplotlib的基本要素:
# 导入pyplot和matplotlib模块
import matplotlib as mpl
from matplotlib import pyplot as plt
%matplotlib inline # 绘制的图片在当前文档显示
默认一画板一画纸,我们也可以自己定义画板figure和画布axes,添加顺序是:
定义一个figure对象 给figure对象添加subplot
比如:
import numpy as np
import matplotlib as mpl
from matplotlib import pyplot as plt
%matplotlib inline
fig = ()
# 指定切分区域的位置
ax1 = (2,2,1)
ax2 = (2,2,2)
ax3 = (2,2,3)
ax4 = (2,2,4)
random_arr = (100)
(random_arr)
()
大家可以发现在最后一个画布上显示了图像,但是前面三个没有显示出来,原因是此时的plt是有上下文的,所谓上下文就是在ax2和ax3之间使用()进行绘制则绘制的图形是ax2这个画纸的。即在哪个画纸下面执行画图就会绘制在谁上面,前提是下一个画布创建之前。
所以如果在ax2和ax4上画图也可以改成如下代码:
import numpy as np
import matplotlib as mpl
from matplotlib import pyplot as plt
%matplotlib inline
fig = ()
random_arr = (100)
# 指定切分区域的位置
ax1 = (2,2,1)
ax2 = (2,2,2)
(random_arr)
ax3 = (2,2,3)
ax4 = (2,2,4)
(random_arr)
()
注意: 如果绘图区域显示的图像比较小,可以结合参数figsize=(宽度,高度)进行设定。
当然也可以使用画布axes对象进行绘制,比如下面代码:
# 省略导入,同上
...
fig = (figsize=(11,7)) # 画板的大小 设置的横向和纵向的值 单位是英寸 可以表示水平和垂直的缩放
random_arr = (100)
# 指定切分区域的位置
ax1 = (2,2,1)
ax2 = (2,2,2)
ax3 = (2,2,3)
ax4 = (2,2,4)
random_arr = (100)
(random_arr)
random_arr = (100)
(random_arr)
random_arr = (100)
(random_arr)
random_arr = (100)
(random_arr)
()
其中的add_subplot(self, *args, **kwargs) 表示向figure添加一个Axes作为一subplot布局的一部分。
add_subplot()方法本质上做了两件事:
add_subplot()网格有两种定义方式:
第一种是用3个参数,分别代表网格的,行数 nrows, 列数 ncols, 索引号index。它们都是位置参数。这种是第1种调用签名形式。
第二种是用一个3位数的整数,如,224,第一个2表示2行,第二个2表示2列,第3位上的4表示第4个格子。这就是第二种调用签名形式,pos为224,也是位置参数。
比如说创建一个2行2列的布局,绘图在第四个axes,注意:2*2的网格是虚拟的,起一个定位的作用
小结:
画布的设置
创建好了画布之后,我们就可以对画布进行设置,比如添加标题、坐标轴、设置坐标轴刻度、图例等
artist操作
设置画布标题
(label)
label,
fontdict=None,
loc=None,
pad=None, *, y=None, **kwargs, ) 可以设置标题的位置,样式
设置坐标轴标签
()
( ylabel, # 坐标轴标签名 fontdict=None, # 字体大小 labelpad=None, *, loc=None, # 位置{'left', 'center', 'right'} **kwargs,
rotation, # 旋转 color, # 颜色 )
开启和关闭坐标轴
() ()
设置坐标轴范围【相当于只看一部分】
([xmin, xmax, ymin, ymax])
(min,max) (min,max)
设置坐标轴刻度
([float, float]) ( ticks=[float, float], 刻度的位置会根据数据的范围以及数据本身设置刻度的位置 labels=['',''], rotation, fontsize, color )
设置网格
(b=None, which='major', axis='both', **kwargs) (True )
设置图例
在绘图操作中设置label参数,再调用图例显示方法
在图例方法中传入字符串列表
(handles, labels, loc) ** loc:图例位置 ** labels:图例标签名称 ** handles:
=============== ============= Location String Location Code =============== ============= 'best' 0
'upper right' 1 'upper left' 2 'lower left' 3 'lower right' 4 'right' 5 'center left' 6 'center right' 7 'lower center' 8 'upper center' 9 'center' 10 =============== =============
案例:
fig = (figsize=(10,5))
x = (0, * 2, 100)
y = (x)
ax1 = (1,2,1)
('正余弦波', fontsize=20, fontweight='bold', horizontalalignment='left', verticalalignment='bottom') # 默认是不支持汉字的
(x, y)
(x, (x))
(['sin(x)', 'cos(x)'],loc='upper right')
ax2 = (1,2,2)
random_arr = (100)
(random_arr)
('标准正态分布')
设置的标题是中文的,因为要想支持中文可以添加如下代码在执行之前:
[''] = ['Simhei']
# 中文情况下 负号显示会有异常 所以还需要设置负号的操作
# ''
[''] = False
# 设置的是点的标记 默认是就是None 不显示
[''] = 'None'
当然上面的操作也可以在上下文上完成,结果是一样的。
只不过去掉了set_title()中的set_直接使用plt绘制。其他属性也是一样的。
即:
fig = (figsize=(10,5))
x = (0, * 2, 100)
y = (x)
ax1 = (1,2,1)
('正余弦波', fontsize=20, fontweight='bold', horizontalalignment='left', verticalalignment='bottom') # 默认是不支持汉字的
(x, y)
(x, (x))
(['sin(x)', 'cos(x)'],loc='upper right')
ax2 = (1,2,2)
random_arr = (100)
(random_arr)
('标准正态分布')