深度学习之Python的可视化包 – Matplotlib

5.4 Python的可视化包 – MatplotlibMatplotlib是Python中最常用的可视化工具之一，可以非常方便地创建海量类型地2D图表和一些基本的3D图表。Matplotlib最早是为了可视化癫痫病人的脑皮层电图相关的信号而研发，因为在函数的设计上参考了MATLAB，所以叫做Matplotlib。Matplotlib首次发表于2007年，在开源和社区的推动下，现在在基于P

Mokin_Zhao

1617人浏览 · 2017-10-28 14:22:58

Mokin_Zhao · 2017-10-28 14:22:58 发布

5.4 Python的可视化包 – Matplotlib

Matplotlib是Python中最常用的可视化工具之一，可以非常方便地创建海量类型地2D图表和一些基本的3D图表。Matplotlib最早是为了可视化癫痫病人的脑皮层电图相关的信号而研发，因为在函数的设计上参考了MATLAB，所以叫做Matplotlib。Matplotlib首次发表于2007年，在开源和社区的推动下，现在在基于Python的各个科学计算领域都得到了广泛应用。Matplotlib的原作者John D. Hunter博士是一名神经生物学家，2012年不幸因癌症去世，感谢他创建了这样一个伟大的库。

安装Matplotlib的方式和numpy很像，可以直接通过Unix/Linux的软件管理工具，比如Ubuntu 16.04 LTS下，输入：

>> sudo apt install python-matplotlib

或者通过pip安装：

>> pip install matplotlib

Windows下也可以通过pip，或是到官网下载：

python plotting – Matplotlib 1.5.3 documentation

Matplotlib非常强大，不过在深度学习中常用的其实只有很基础的一些功能，这节主要介绍2D图表，3D图表和图像显示。

5.4.1 2D图表

Matplotlib中最基础的模块是pyplot。先从最简单的点图和线图开始，比如我们有一组数据，还有一个拟合模型，通过下面的代码图来可视化：

    
Python

        1
       
        2
       
        3
       
        4
       
        5
       
        6
       
        7
       
        8
       
        9
       
        10
       
        11
       
        12
       
        13
       
        14
       
        15
       
        16
       
        17
       
        18
       
        19
       
        20
       
        21
       
        22
       
        23
       
        24
       
        25
       
        26
       
        27
       
        28
       
        29
       
        30
       
        31
       
        32
       
        33
       
        34
       
        35
       
        36
       
        37
       
        38
       
        39
       
        40
       
        41
       
        42
       
        43
       
        import   numpy  as   np
       
        import   matplotlib  as   mpl
       
        import   matplotlib . pyplot  as   plt
       
        # 通过rcParams设置全局横纵轴字体大小
       
        mpl . rcParams [ 'xtick.labelsize' ]   =   24
       
        mpl . rcParams [ 'ytick.labelsize' ]   =   24
       
        np . random . seed ( 42 )
       
        # x轴的采样点
       
        x   =   np . linspace ( 0 ,   5 ,   100 )
       
        # 通过下面曲线加上噪声生成数据，所以拟合模型就用y了……
       
        y   =   2 * np . sin ( x )   +   0.3 * x * * 2
       
        y_data   =   y   +   np . random . normal ( scale = 0.3 ,   size = 100 )
       
        # figure()指定图表名称
       
        plt . figure ( 'data' )
       
        # '.'标明画散点图，每个散点的形状是个圆
       
        plt . plot ( x ,   y_data ,   '.' )
       
        # 画模型的图，plot函数默认画连线图
       
        plt . figure ( 'model' )
       
        plt . plot ( x ,   y )
       
        # 两个图画一起
       
        plt . figure ( 'data & model' )
       
        # 通过'k'指定线的颜色，lw指定线的宽度
       
        # 第三个参数除了颜色也可以指定线形，比如'r--'表示红色虚线
       
        # 更多属性可以参考官网：http://matplotlib.org/api/pyplot_api.html
       
        plt . plot ( x ,   y ,   'k' ,   lw = 3 )
       
        # scatter可以更容易地生成散点图
       
        plt . scatter ( x ,   y_data )
       
        # 将当前figure的图保存到文件result.png
       
        plt . savefig ( 'result.png' )
       
        # 一定要加上这句才能让画好的图显示在屏幕上
       
        plt . show ( )

matplotlib和pyplot的惯用别名分别是mpl和plt，上面代码生成的图像如下：

基本的画图方法就是这么简单，如果想了解更多pyplot的属性和方法来画出风格多样的图像，可以参考官网：

pyplot – Matplotlib 1.5.3 documentation

Customizing matplotlib

点和线图表只是最基本的用法，有的时候我们获取了分组数据要做对比，柱状或饼状类型的图或许更合适：

Python

        1
       
        2
       
        3
       
        4
       
        5
       
        6
       
        7
       
        8
       
        9
       
        10
       
        11
       
        12
       
        13
       
        14
       
        15
       
        16
       
        17
       
        18
       
        19
       
        20
       
        21
       
        22
       
        23
       
        24
       
        25
       
        26
       
        27
       
        28
       
        29
       
        30
       
        31
       
        32
       
        33
       
        34
       
        35
       
        36
       
        37
       
        38
       
        39
       
        40
       
        41
       
        42
       
        43
       
        44
       
        45
       
        46
       
        47
       
        48
       
        49
       
        50
       
        51
       
        52
       
        53
       
        54
       
        55
       
        56
       
        57
       
        58
       
        59
       
        60
       
        61
       
        62
       
        63
       
        64
       
        65
       
        66
       
        67
       
        68
       
        69
       
        70
       
        71
       
        72
       
        73
       
        import   numpy  as   np
       
        import   matplotlib  as   mpl
       
        import   matplotlib . pyplot  as   plt
       
        mpl . rcParams [ 'axes.titlesize' ]   =   20
       
        mpl . rcParams [ 'xtick.labelsize' ]   =   16
       
        mpl . rcParams [ 'ytick.labelsize' ]   =   16
       
        mpl . rcParams [ 'axes.labelsize' ]   =   16
       
        mpl . rcParams [ 'xtick.major.size' ]   =   0
       
        mpl . rcParams [ 'ytick.major.size' ]   =   0
       
        # 包含了狗，猫和猎豹的最高奔跑速度，还有对应的可视化颜色
       
        speed_map   =   {
       
             'dog' :   ( 48 ,   '#7199cf' ) ,
       
             'cat' :   ( 45 ,   '#4fc4aa' ) ,
       
             'cheetah' :   ( 120 ,   '#e1a7a2' )
       
        }
       
        # 整体图的标题
       
        fig   =   plt . figure ( 'Bar chart & Pie chart' )
       
        # 在整张图上加入一个子图，121的意思是在一个1行2列的子图中的第一张
       
        ax   =   fig . add_subplot ( 121 )
       
        ax . set_title ( 'Running speed - bar chart' )
       
        # 生成x轴每个元素的位置
       
        xticks   =   np . arange ( 3 )
       
        # 定义柱状图每个柱的宽度
       
        bar_width   =   0.5
       
        # 动物名称
       
        animals   =   speed_map . keys ( )
       
        # 奔跑速度
       
        speeds   =   [ x [ 0 ]   for   x   in   speed_map . values ( ) ]
       
        # 对应颜色
       
        colors   =   [ x [ 1 ]   for   x   in   speed_map . values ( ) ]
       
        # 画柱状图，横轴是动物标签的位置，纵轴是速度，定义柱的宽度，同时设置柱的边缘为透明
       
        bars   =   ax . bar ( xticks ,   speeds ,   width = bar_width ,   edgecolor = 'none' )
       
        # 设置y轴的标题
       
        ax . set_ylabel ( 'Speed(km/h)' )
       
        # x轴每个标签的具体位置，设置为每个柱的中央
       
        ax . set_xticks ( xticks + bar_width / 2 )
       
        # 设置每个标签的名字
       
        ax . set_xticklabels ( animals )
       
        # 设置x轴的范围
       
        ax . set_xlim ( [ bar_width / 2 - 0.5 ,   3 - bar_width / 2 ] )
       
        # 设置y轴的范围
       
        ax . set_ylim ( [ 0 ,   125 ] )
       
        # 给每个bar分配指定的颜色
       
        for   bar ,   color  in   zip ( bars ,   colors ) :
       
             bar . set_color ( color )
       
        # 在122位置加入新的图
       
        ax   =   fig . add_subplot ( 122 )
       
        ax . set_title ( 'Running speed - pie chart' )
       
        # 生成同时包含名称和速度的标签
       
        labels   =   [ '{}\n{} km/h' . format ( animal ,   speed )   for   animal ,   speed  in   zip ( animals ,   speeds ) ]
       
        # 画饼状图，并指定标签和对应颜色
       
        ax . pie ( speeds ,   labels = labels ,   colors = colors )
       
        plt . show ( )

在这段代码中又出现了一个新的东西叫做，一个用ax命名的对象。在Matplotlib中，画图时有两个常用概念，一个是平时画图蹦出的一个窗口，这叫一个figure。Figure相当于一个大的画布，在每个figure中，又可以存在多个子图，这种子图叫做axes。顾名思义，有了横纵轴就是一幅简单的图表。在上面代码中，先把figure定义成了一个一行两列的大画布，然后通过fig.add_subplot()加入两个新的子图。subplot的定义格式很有趣，数字的前两位分别定义行数和列数，最后一位定义新加入子图的所处顺序，当然想写明确些也没问题，用逗号分开即可。。上面这段代码产生的图像如下：

5.3.1 3D图表

Matplotlib中也能支持一些基础的3D图表，比如曲面图，散点图和柱状图。这些3D图表需要使用mpl_toolkits模块，先来看一个简单的曲面图的例子：

    
Python

        1
       
        2
       
        3
       
        4
       
        5
       
        6
       
        7
       
        8
       
        9
       
        10
       
        11
       
        12
       
        13
       
        14
       
        15
       
        16
       
        17
       
        18
       
        19
       
        20
       
        21
       
        22
       
        23
       
        24
       
        25
       
        26
       
        27
       
        28
       
        29
       
        30
       
        31
       
        32
       
        33
       
        34
       
        35
       
        36
       
        37
       
        38
       
        39
       
        40
       
        41
       
        42
       
        43
       
        44
       
        45
       
        46
       
        47
       
        48
       
        49
       
        50
       
        import   matplotlib . pyplot  as   plt
       
        import   numpy  as   np
       
        # 3D图标必须的模块，project='3d'的定义
       
        from   mpl_toolkits . mplot3d  import   Axes3D     
       
        np . random . seed ( 42 )
       
        n_grids   =   51           # x-y平面的格点数 
       
        c   =   n_grids   /   2       # 中心位置
       
        nf   =   2                 # 低频成分的个数
       
        # 生成格点
       
        x   =   np . linspace ( 0 ,   1 ,   n_grids )
       
        y   =   np . linspace ( 0 ,   1 ,   n_grids )
       
        # x和y是长度为n_grids的array
       
        # meshgrid会把x和y组合成n_grids*n_grids的array，X和Y对应位置就是所有格点的坐标
       
        X ,   Y   =   np . meshgrid ( x ,   y )
       
        # 生成一个0值的傅里叶谱
       
        spectrum   =   np . zeros ( ( n_grids ,   n_grids ) ,   dtype = np . complex )
       
        # 生成一段噪音，长度是(2*nf+1)**2/2
       
        noise   =   [ np . complex ( x ,   y )   for   x ,   y   in   np . random . uniform ( - 1 , 1 , ( ( 2 * nf + 1 ) * * 2 / 2 ,   2 ) ) ]
       
        # 傅里叶频谱的每一项和其共轭关于中心对称
       
        noisy_block   =   np . concatenate ( ( noise ,   [ 0j ] ,   np . conjugate ( noise [ :: - 1 ] ) ) )
       
        # 将生成的频谱作为低频成分
       
        spectrum [ c - nf : c + nf + 1 ,   c - nf : c + nf + 1 ]   =   noisy_block . reshape ( ( 2 * nf + 1 ,   2 * nf + 1 ) )
       
        # 进行反傅里叶变换
       
        Z   =   np . real ( np . fft . ifft2 ( np . fft . ifftshift ( spectrum ) ) )
       
        # 创建图表
       
        fig   =   plt . figure ( '3D surface & wire' )
       
        # 第一个子图，surface图
       
        ax   =   fig . add_subplot ( 1 ,   2 ,   1 ,   projection = '3d' )
       
        # alpha定义透明度，cmap是color map
       
        # rstride和cstride是两个方向上的采样，越小越精细，lw是线宽
       
        ax . plot_surface ( X ,   Y ,   Z ,   alpha = 0.7 ,   cmap = 'jet' ,   rstride = 1 ,   cstride = 1 ,   lw = 0 )
       
        # 第二个子图，网线图
       
        ax   =   fig . add_subplot ( 1 ,   2 ,   2 ,   projection = '3d' )
       
        ax . plot_wireframe ( X ,   Y ,   Z ,   rstride = 3 ,   cstride = 3 ,   lw = 0.5 )
       
        plt . show ( )

这个例子中先生成一个所有值均为0的复数array作为初始频谱，然后把频谱中央部分用随机生成，但同时共轭关于中心对称的子矩阵进行填充。这相当于只有低频成分的一个随机频谱。最后进行反傅里叶变换就得到一个随机波动的曲面，图像如下：

3D的散点图也是常常用来查看空间样本分布的一种手段，并且画起来比表面图和网线图更加简单，来看例子：

Python

        1
       
        2
       
        3
       
        4
       
        5
       
        6
       
        7
       
        8
       
        9
       
        10
       
        11
       
        12
       
        13
       
        14
       
        15
       
        16
       
        17
       
        18
       
        19
       
        20
       
        21
       
        22
       
        23
       
        24
       
        25
       
        26
       
        27
       
        28
       
        29
       
        30
       
        31
       
        32
       
        33
       
        34
       
        35
       
        36
       
        37
       
        38
       
        39
       
        40
       
        41
       
        42
       
        43
       
        44
       
        45
       
        import   matplotlib . pyplot  as   plt
       
        import   numpy  as   np
       
        from   mpl_toolkits . mplot3d  import   Axes3D
       
        np . random . seed ( 42 )
       
        # 采样个数500
       
        n_samples   =   500
       
        dim   =   3
       
        # 先生成一组3维正态分布数据，数据方向完全随机
       
        samples   =   np . random . multivariate_normal (
       
             np . zeros ( dim ) ,
       
             np . eye ( dim ) ,
       
             n _samples
       
        )
       
        # 通过把每个样本到原点距离和均匀分布吻合得到球体内均匀分布的样本
       
        for   i   in   range ( samples . shape [ 0 ] ) :
       
             r   =   np . power ( np . random . random ( ) ,   1.0 / 3.0 )
       
             samples [ i ]   *=   r   /   np . linalg . norm ( samples [ i ] )
       
        upper_samples   =   [ ]
       
        lower_samples   =   [ ]
       
        for   x ,   y ,   z   in   samples :
       
             # 3x+2y-z=1作为判别平面
       
             if   z   >   3 * x   +   2 * y   -   1 :
       
                 upper_samples . append ( ( x ,   y ,   z ) )
       
             else :
       
                 lower_samples . append ( ( x ,   y ,   z ) )
       
        fig   =   plt . figure ( '3D scatter plot' )
       
        ax   =   fig . add_subplot ( 111 ,   projection = '3d' )
       
        uppers   =   np . array ( upper_samples )
       
        lowers   =   np . array ( lower_samples )
       
        # 用不同颜色不同形状的图标表示平面上下的样本
       
        # 判别平面上半部分为红色圆点，下半部分为绿色三角
       
        ax . scatter ( uppers [ : ,   0 ] ,   uppers [ : ,   1 ] ,   uppers [ : ,   2 ] ,   c = 'r' ,   marker = 'o' )
       
        ax . scatter ( lowers [ : ,   0 ] ,   lowers [ : ,   1 ] ,   lowers [ : ,   2 ] ,   c = 'g' ,   marker = '^' )
       
        plt . show ( )

这个例子中，为了方便，直接先采样了一堆3维的正态分布样本，保证方向上的均匀性。然后归一化，让每个样本到原点的距离为1，相当于得到了一个均匀分布在球面上的样本。再接着把每个样本都乘上一个均匀分布随机数的开3次方，这样就得到了在球体内均匀分布的样本，最后根据判别平面3x+2y-z-1=0对平面两侧样本用不同的形状和颜色画出，图像如下：

5.3.1 图像显示

Matplotlib也支持图像的存取和显示，并且和OpenCV一类的接口比起来，对于一般的二维矩阵的可视化要方便很多，来看例子：

    
Python

        1
       
        2
       
        3
       
        4
       
        5
       
        6
       
        7
       
        8
       
        9
       
        10
       
        11
       
        12
       
        13
       
        14
       
        15
       
        16
       
        17
       
        18
       
        19
       
        20
       
        import   matplotlib . pyplot  as   plt
       
        # 读取一张小白狗的照片并显示
       
        plt . figure ( 'A Little White Dog' )
       
        little_dog_img   =   plt . imread ( 'little_white_dog.jpg' )
       
        plt . imshow ( little_dog_img )
       
        # Z是上小节生成的随机图案，img0就是Z，img1是Z做了个简单的变换
       
        img0   =   Z
       
        img1   =   3 * Z   +   4
       
        # cmap指定为'gray'用来显示灰度图
       
        fig   =   plt . figure ( 'Auto Normalized Visualization' )
       
        ax0   =   fig . add_subplot ( 121 )
       
        ax0 . imshow ( img0 ,   cmap = 'gray' )
       
        ax1   =   fig . add_subplot ( 122 )
       
        ax1 . imshow ( img1 ,   cmap = 'gray' )
       
        plt . show ( )

这段代码中第一个例子是读取一个本地图片并显示，第二个例子中直接把上小节中反傅里叶变换生成的矩阵作为图像拿过来，原图和经过乘以3再加4变换的图直接绘制了两个形状一样，但是值的范围不一样的图案。显示的时候imshow会自动进行归一化，把最亮的值显示为纯白，最暗的值显示为纯黑。这是一种非常方便的设定，尤其是查看深度学习中某个卷积层的响应图时。得到图像如下：

只讲到了最基本和常用的图表及最简单的例子，更多有趣精美的例子可以在Matplotlib的官网找到：

Thumbnail gallery – Matplotlib 1.5.3 documentation

九章云极普惠算力

更多推荐

突破算力瓶颈：nanoGPT水平扩展全方案——从单GPU到多节点集群的完整指南

nanoGPT作为一款轻量级GPT训练框架，以其简洁高效的设计成为中小型语言模型训练的理想选择。本文将系统介绍如何通过水平扩展技术突破算力限制，在不同硬件环境下实现高效训练，从单GPU到多节点集群的完整配置方案。## 🚀 为什么选择nanoGPT进行水平扩展？nanoGPT采用极简设计理念，核心代码仅包含`model.py`（约300行模型定义）和`train.py`（约300行训练循环

九章云极普惠算力

pygta5性能优化技巧：如何提升自动驾驶AI的响应速度

pygta5是一个使用Python实现《侠盗猎车手5》自动驾驶AI的开源项目，通过深度学习模型控制游戏角色自动行驶。在实际应用中，AI的响应速度直接影响驾驶体验和安全性。本文将分享6个实用的性能优化技巧，帮助你显著提升pygta5自动驾驶AI的响应速度，让AI驾驶更加流畅自然。## 一、图像预处理优化：减少计算负担自动驾驶AI首先需要处理游戏画面，图像数据的大小直接影响后续计算效率。在py

九章云极普惠算力

终极Sidekick推理模型指南：多模型兼容与性能优化完整教程

Sidekick是一款原生macOS应用，允许用户与本地LLM聊天，无需安装其他软件即可响应Mac上文件、文件夹和网站的信息。本文将详细介绍Sidekick的推理模型支持，包括本地与远程模型的配置方法、多模型兼容特性以及实用的性能优化策略，帮助用户充分发挥AI助手的潜力。## 本地模型：从下载到部署的完整流程Sidekick提供了丰富的本地模型支持，让用户可以在完全离线的环境下使用AI功能