Matplotlib——Python数据分析之绘图和可视化

2023年 7月 12日 83.0k 0

信息可视化(也叫绘图)是数据分析中最重要的⼯作之⼀。它可能是探索过程的⼀部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。

其实做 Python的数据可视化,可以使用的库分别是 Matplotlib 、Seaborn 、Bokeh、 Plotly 、Pyecharts等。

Matplotlib是Python数据可视化库中的泰斗,它已经成为Python中公认的数据可视化工具,通过Matplotlib可以很方便的设计和输出二维以及三维的数据,其提供了常规的笛卡尔坐标,极坐标,球坐标,三维坐标等,其输出的图片质量也达到了科技论文中的印刷质量,日常的基本绘图更不在话下。

Matplotlib 是一个 Python 的 2D绘图库,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。

优势:

1)能将数据进行可视化,更直观的呈现

2)使数据更加客观,更具说服力

在分享Matplotlib之前我们先了解以下几个概念:

画板、画纸的概念

Matplotlib——Python数据分析之绘图和可视化

我们知道画画时需要画板和画纸。在matplotlib中也是一个道理。

图形在画板(figure)中绘制完成,而画板又由不同的画布(纸)(axes)构成,具体的图形构建时要指明画板和画布,否则默认一画板一画布。

画板(figure)

画板存在的意义:

1. 控制图像的比例情况(大小) 保存图像

2. 创建一个画板

(num=None, 用于指定在画板上,放几个画布figsize=None, (宽度, 高度)dpi=None, 图像的分辨率facecolor=None, 背景色edgecolor=None, 边界颜色frameon=True,FigureClass,clear=False,**kwargs,linewidth)

画布(axes)

一个坐标系就是一个画布,就是一个图,一个画板上可以有多个坐标系

画布的创建:

画布要创建在画板上(nrows, ncols, index)nrows将画板分为几行,ncols将画板分为几列,index选取使用哪一个被划分的画板

add_subplot(nrows, ncols, index, **kwargs)

add_subplot(pos, **kwargs)

add_subplot(ax)

add_subplot()

画板与画布的关系

Matplotlib——Python数据分析之绘图和可视化

matplotlib图标的基本组成:

  • 画板figure 呈现出来的坐标系
  • 绘图区域axes 【画布】
  • x轴和y轴的水平垂直轴线 以及 轴标签
  • 轴线上的刻度 以及 对应的刻度标签
  • 画布标题
  • 图例

Matplotlib——Python数据分析之绘图和可视化

如何使用绘图包Matplotlib?

matplotlib的基本要素:

# 导入pyplot和matplotlib模块

import matplotlib as mpl   

from matplotlib import pyplot as plt 

%matplotlib inline   # 绘制的图片在当前文档显示

默认一画板一画纸,我们也可以自己定义画板figure和画布axes,添加顺序是:

  • 定义一个figure对象
  • 给figure对象添加subplot
  • 比如:

    import numpy as np
    import matplotlib as mpl
    from matplotlib import pyplot as plt 
    
    %matplotlib inline 
    
    fig = ()
    # 指定切分区域的位置
    ax1 = (2,2,1)
    ax2 = (2,2,2)
    ax3 = (2,2,3)
    ax4 = (2,2,4)
    
    random_arr = (100)
    (random_arr)
    
    ()

    Matplotlib——Python数据分析之绘图和可视化

    大家可以发现在最后一个画布上显示了图像,但是前面三个没有显示出来,原因是此时的plt是有上下文的,所谓上下文就是在ax2和ax3之间使用()进行绘制则绘制的图形是ax2这个画纸的。即在哪个画纸下面执行画图就会绘制在谁上面,前提是下一个画布创建之前。

    所以如果在ax2和ax4上画图也可以改成如下代码:

    import numpy as np
    import matplotlib as mpl
    from matplotlib import pyplot as plt 
    
    %matplotlib inline 
    
    fig = ()
    random_arr = (100)
    # 指定切分区域的位置
    ax1 = (2,2,1)
    ax2 = (2,2,2)
    (random_arr)
    ax3 = (2,2,3)
    ax4 = (2,2,4)
    (random_arr)
    ()
    

    Matplotlib——Python数据分析之绘图和可视化

    注意: 如果绘图区域显示的图像比较小,可以结合参数figsize=(宽度,高度)进行设定。

    当然也可以使用画布axes对象进行绘制,比如下面代码:

    # 省略导入,同上
    ...
    fig = (figsize=(11,7)) # 画板的大小  设置的横向和纵向的值 单位是英寸 可以表示水平和垂直的缩放
    random_arr = (100)
    # 指定切分区域的位置
    ax1 = (2,2,1)
    ax2 = (2,2,2)
    ax3 = (2,2,3)
    ax4 = (2,2,4)
    random_arr = (100)
    (random_arr)
    random_arr = (100)
    (random_arr)
    random_arr = (100)
    (random_arr)
    random_arr = (100)
    (random_arr)
    ()

    Matplotlib——Python数据分析之绘图和可视化

    其中的add_subplot(self, *args, **kwargs) 表示向figure添加一个Axes作为一subplot布局的一部分。

    add_subplot()方法本质上做了两件事:

  • 将整个Figure区域划分为Row * col的网格;
  • 在网格的指定格子(索引号)中创建一个Axes
  • add_subplot()网格有两种定义方式:

    第一种是用3个参数,分别代表网格的,行数 nrows, 列数 ncols, 索引号index。它们都是位置参数。这种是第1种调用签名形式。

    第二种是用一个3位数的整数,如,224,第一个2表示2行,第二个2表示2列,第3位上的4表示第4个格子。这就是第二种调用签名形式,pos为224,也是位置参数。

    比如说创建一个2行2列的布局,绘图在第四个axes,注意:2*2的网格是虚拟的,起一个定位的作用

    Matplotlib——Python数据分析之绘图和可视化

    小结:

  • figure就是一个矩形容器(顶层容器),可以再划分为小方格,每个方格就是一个subplot,即子绘图区。
  • 一个图形中可以有多个subplot,这些subplot又可以被看作一个整体,有一些属性如整个subplot的位置、内部(单个subplot之间)的间距等,这些属性保存在类中。可以通过Figure的subplotpars参数来修改这些属性。
  • 子图使用了subplot,而不是subfigure。fiugre仅是一个矩形容器,而plot则是具体的图形元素了,所以subplot会自动创建一个Axes,这个Axes是属于特定subplot的。
  • 画布的设置

    创建好了画布之后,我们就可以对画布进行设置,比如添加标题、坐标轴、设置坐标轴刻度、图例等

    artist操作

    设置画布标题

    (label)

    label,

    fontdict=None,

    loc=None,

    pad=None, *, y=None, **kwargs, ) 可以设置标题的位置,样式

    设置坐标轴标签

    ()

    ( ylabel, # 坐标轴标签名 fontdict=None, # 字体大小 labelpad=None, *, loc=None, # 位置{'left', 'center', 'right'} **kwargs,

    rotation, # 旋转 color, # 颜色 )

    开启和关闭坐标轴

    () ()

    设置坐标轴范围【相当于只看一部分】

    ([xmin, xmax, ymin, ymax])

    (min,max) (min,max)

    设置坐标轴刻度

    ([float, float]) ( ticks=[float, float], 刻度的位置会根据数据的范围以及数据本身设置刻度的位置 labels=['',''], rotation, fontsize, color )

    设置网格

    (b=None, which='major', axis='both', **kwargs) (True )

    设置图例 

    在绘图操作中设置label参数,再调用图例显示方法

    在图例方法中传入字符串列表

    (handles, labels, loc) ** loc:图例位置 ** labels:图例标签名称 ** handles:

    =============== ============= Location String Location Code =============== ============= 'best' 0

    'upper right' 1 'upper left' 2 'lower left' 3 'lower right' 4 'right' 5 'center left' 6 'center right' 7 'lower center' 8 'upper center' 9 'center' 10 =============== =============

    案例:

    fig = (figsize=(10,5))
    x = (0,  * 2, 100)
    y = (x)
    ax1 = (1,2,1)
    ('正余弦波', fontsize=20, fontweight='bold', horizontalalignment='left', verticalalignment='bottom') # 默认是不支持汉字的
    (x, y)
    (x, (x))
    (['sin(x)', 'cos(x)'],loc='upper right')
    ax2 = (1,2,2)
    
    random_arr = (100)
    (random_arr)
    ('标准正态分布')
    

    设置的标题是中文的,因为要想支持中文可以添加如下代码在执行之前:

    [''] = ['Simhei']
    # 中文情况下 负号显示会有异常 所以还需要设置负号的操作
    # ''
    [''] = False
    #  设置的是点的标记  默认是就是None  不显示
    [''] = 'None'
    

    Matplotlib——Python数据分析之绘图和可视化

    当然上面的操作也可以在上下文上完成,结果是一样的。

    只不过去掉了set_title()中的set_直接使用plt绘制。其他属性也是一样的。

    即:

    fig = (figsize=(10,5))
    x = (0,  * 2, 100)
    y = (x)
    ax1 = (1,2,1)
    ('正余弦波', fontsize=20, fontweight='bold', horizontalalignment='left', verticalalignment='bottom') # 默认是不支持汉字的
    (x, y)
    (x, (x))
    (['sin(x)', 'cos(x)'],loc='upper right')
    ax2 = (1,2,2)
    
    random_arr = (100)
    (random_arr)
    ('标准正态分布')

    相关文章

    JavaScript2024新功能:Object.groupBy、正则表达式v标志
    PHP trim 函数对多字节字符的使用和限制
    新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
    使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
    为React 19做准备:WordPress 6.6用户指南
    如何删除WordPress中的所有评论

    发布评论