当前位置: 首页 > 网络应用技术

使用matplotlib进行数据可视化(1)

时间:2023-03-07 20:24:31 网络应用技术

  本文是“使用Python进行数据分析”中Matplotlib库的基本用法方法的第一部分。主要内容是使用Matplotlib库的一些常见技术。图和其他图形以及视觉异常等。Matplotlib是Python的基本方法之一,用于数据可视化。它易于操作,并且具有良好的操作系统兼容性和图形来显示基础接口兼容性。对于数据分析的新手,它是一种非常有用的可视化工具。尽管新的可视化工具近年来一直连续进入每个人的愿景,例如Seaborn,Ggplot,Holoviews,Aitair,Aitair和Pandas的API Matplotlib。可视化工具和掌握matplotlib的基础可以使您灵活地控制最终图形结果。学习matplotlib仍然是学习视觉技术的必不可少的一部分。

  最常用的导入方式

  您可以在matplotlib中使用绘图样式,例如选择经典样式(经典),可以使用它来查看可以使用的库中可以使用的样式。。

  两种样式的比较

  在脚本文件中绘制时,您需要使用它显示图形。应该注意的是,脚本的末尾通常用于显示脚本的绘制。但是,如果使用ipython Interactive绘图,则不需要使用show()command.)。使用魔法命令开始matplotlib模式,您可以开始绘图。

  任何plt命令稍后都会自动打开图形窗口,添加新命令将使图形更新。未更新即时更新的forces可以将其用于强制性更新。

  我们可以使用命令将绘制图形保存为文件,并且可以指定参数,例如图片的分辨率和边缘。有关特定用法方法,请参阅此博客文章:Python中不同参数的不同参数的使用。

  区分Matplotlib的两个绘图接口非常重要。Beginners通常会混淆或理解正在发生的事情。接下来,引入了这两个绘图接口:一个是方便的MATLAB样式接口,另一个是一个更强大的面向对象的接口。

  MATLAB接口将更加清晰,更方便,更快地对于初学者。面向对象的接口可以适应更复杂的场景并更好地控制您自己的图形。随着未来的引入更深的内容,每个人都会更好地了解两者的使用接口以及它们之间的差异和连接。

  现在,让我们创建一个简单的行映射,即线性方程的可视化$ y = f(x)$。首先,创建图形无花果和坐标轴ax。

  结果如下所示,图等于创建可以容纳各种坐标轴,图形,文本和标签的空白画布。轴是一个带有比例和标签的矩形,最终将包含所有可视图形图形图形。创建坐标轴后,您可以使用ax.plot绘制图片。

  另一种图纸方法:

  首先介绍可以在图函数中调整的参数

  颜色指定行线的颜色指定行类型标记表示绘图点类型的透明度。接下来,介绍常用参数中常用参数的八种类型的值(颜色)的缩写(颜色)的缩写(颜色)参数。

  B蓝色G绿色Y黄色M红K黑色W WHITH R红色C绿色linestyle常用价值

  - Solore Line-。点线 - changxu线:短虚线链接签名说明

  'o'Circle'。d'd'D'INAMOND-S'Fang Fang Fang Fang Fang Fang fang-h'h'h'h'h'h'h'h'h'h'h'h'h'hexagonal 2'd'Little Lingfang' - “水平线”三角形'Triangleoctagon'<’一角朝左的三角形‘p’五边形‘>“右角三角形”,“像素”^'一个角的三角形'+'plus''''*'*'*'*'x'(x)'none'指令

  您还可以将衬里和颜色参数结合起来,以更简洁的表示方法来绘制

  结果如下所示

  尽管Matplotlib会自动为您生成坐标轴,但自定义坐标轴将更符合我们的需求。最基本的方法是调整坐标轴的上限和下限。

  如果要使坐标轴反向顺序,则还可以在计数器中设置坐标轴刻度值

  介绍该方法,这是设置坐标轴的常见方法,例如:

  设置坐标轴的上限和下限

  使图形内容自动收紧而不离开间隙

  让x轴和y轴的单位等于

  打开的关闭坐标轴

  等等,您可以查询官方网站或浏览其他博客文章,例如matplotlib series-plt.axis

  结果如下所示

  本节简要介绍了设置图形的方法:图形标题,坐标轴标题,简单的传奇。它们,图形标题和坐标轴标题是最简单的标签。快速设置的方法如下:

  我们可以通过调整参数来调整其位置,大小和样式。例如,大小(更改字体尺寸),重量(调整字体厚度)和旋转(调节角度),这不是引入太多的。

  例如

  当在单个坐标轴上同时显示多条线时,创建一个传说以显示每条线是非常有效的方法。Matplotlib构建了一种可用于简单而快速地创建传奇的方法。

  我不再引入过多的功能,并且将在后续内容中引入更高级的传奇设置方法。

  另一个常用的图形是散点图,该图与线图相似,但不再由线段连接,而是由独立点,圆或其他形状组成。

  像绘图线图一样,当绘制散射点图时,您还可以通过调整参数(例如颜色和点的形状)以及代码示例的特定效果来调整绘图参数的效果。

  我们还可以绘制通过该方法连接散射点并调整其参数的行

  该功能非常强大。它之间的区别在于它具有更高的灵活性。它可以分别控制每个散射点和数据。它还可以为每个散点点带有不同的属性(大小,颜色等)。

  x,y表示坐标轴上指定点的大小,接收单个或一个维数阵列阵列C的设置点的颜色,并接收单个值或一个维数阵列标记。0-1

  散射的颜色和大小可以显示多维数据的信息。LET给出一个示例,并使用Scikit -Learn程序库中的虹膜数据集进行演示。其中有三种类型的虹膜,每个样本都是一种花及其花瓣(花瓣)和密封量仔细测量。

  从中,我们可以看到散射的点可以同时看到不同维度的数据:每个点的坐标值(x,y)表示卡利X的长度和宽度,并且点的大小代表宽度在探索和演示数据时,与三种不同类型的虹膜相对应。

  因为每个散射点都会分别渲染并颜色,所以渲染器会消耗更多的资源。在中间,散射点基本上相互复制,因此整个数据集的所有点的颜色和大小都只需要配置一次。因此,在处理大型数据集时,它们之间的效率和性能差异非常大。这是面对大型数据集的更好方法。例如,当然,处理大型数据集以减少比例等是另一件事。

  绘制带状图或列图,我们使用功能,常用的参数表如下|参数名称|描述|| - | - ||左|指示X轴的数据|高度|指示X轴数据的数量||宽度|指示频带图的宽度,范围为0-1,默认值为0.8 ||颜色|

  如果要绘制水平柱图,则需要使用该功能,该功能与条函数相同。

  我们可以使用底部参数实现列图的堆叠

  调整条带的宽度和水平坐标以实现平行柱图

  本文仅介绍一些简单的绘图方法。要了解更多方法,您可以查询官方网站或参考其他博客文章。

  绘制蛋糕图,我们使用功能,常用参数如下

  X表示用于绘制蛋糕图的数据。

  如果您想创建环蛋糕地图,请在创建蛋糕图后创建一个更纯净的白色半径,并带有较小的蛋糕图片。

  要了解有关创建蛋糕地图的更多信息,您可以查询官方网站并参考其他博客文章。

  有时,这是使用两个维图上使用高线或颜色图表的好方法,以表明三维数据很好。Matplotlib提供了解决此问题的三个功能:高线图,例如绘画,绘画,绘画,绘画带有绘画的填充轮廓图,显示带有显示的图形。

  使用函数$ z = f(x,y)$来演示高线图,并根据以下方法生成函数:

  可以通过函数创建高线图。它需要三个参数:x轴,y轴和z轴三个坐标轴。x轴和y轴表示图中的位置,将表示z轴按照相等的高线的级别,它是使用功能准备这些数据的更简单方法。它可以从一个维度构建两个维度的网格数据:

  让我们创建一个高线图:

  其中6表示数据范围分为6份。此外,我们可以使用颜色参数和CMAP参数来设置高线图的颜色。特别是要注意,仅使用一种颜色时,默认行用于指示负数,并且实际数字用于指示正数。

  接下来,我们用来创建一个填充的高线图,其语法与。此外,我们可以用来创建一个颜色栏,以指示图形的各种颜色的相应标签信息。

  通过颜色棒,我们可以清楚地看到,与最高值相对应的黄色部分是“峰”。深蓝色部分是最低的值,即“山谷”。

  我们还可以使用功能将两个维数阵列渲染为梯度。

  请注意以下几点:1。它不支持X轴和Y轴数据的网格,但必须通过范围参数[Xmin,Xmax,Ymin,Ymax] .2设置图形的坐标范围。默认情况下,标准图形数组默认值的定义,即,原点位于左上角,在显示网格数据图形时必须进行调整。3。坐标轴的精度将自动调整以适应数据显示。您可以设置X轴和Y轴的单元。

  此外,引入另一种将高线图与颜色图相结合的方法。

  基于这些方法,有许多方法可以使用两个维图来表示三个维数据。如果您想了解更多的读者,则可以查看官方网站或参考其他博客文章。

  直接介绍示例以解释

  如上面的示例所示,使用这样的直方图可以帮助我们分析数据的分布并比较不同数据集的分布特征。

  HistType是直方图的类型。常见类型是:“ bar”,“ barsstacked”,“ step”,“ stepfled”。

  alpha是指绘制直方图的透明度。

  密度是布尔类型。如果其值为真,则将频率转换为频率图直方图,该直方图将返回频率。

  垃圾箱是指直方图列的数量,即间隔中的数据包数。

  edgeColor是边缘颜色。

  常用的其他参数包括“颜色”,“底部”(y轴的启动位置),“方向”(水平或垂直),等等。。

  此外,仅计算每个部分样本数的代码:

  就像将一个维度组分为一个间隔以创建一个维度频率直方图一样,我们还可以根据两个维间隔切割两个维数阵列,以创建两个维频率直方图。LET简短地引入了几种方法。创建两个维频率直方图。

  7.2.1两维频率直方图

  此外,两个维频率直方图还可以提供只能计算每个部分样本数量的代码:

  7.2.2将两个维频率直方形图划分的六个边缘间隔是正方形的,并且还有一种常用的方法来分裂六角形正。

  7.2.3核密度估计(KDE方法)KDE方法是评估多维数据分布密度的常见方法。有一种简单,快速实现KDE的方法。现在让我们展示:

  将matplotlib用作KDE的过程相对繁琐。之后,Seaborn图书馆将在Seaborn图书馆提供更多简洁的方法。

  在测量过程中,错误是不可避免的。如果仅可见测量数据的可视化,则数据的可信度无法直观地显示理论值的差异。使用图形以在数据可视化结果中显示错误以提供更多信息。

  在这里,我们只介绍简单的绘图方法,可以参考参数信息的更多选项和信息。

  有时我们需要在连续变量中显示错误。在matplotlib中没有构建的简单方法来解决此问题,但解决该问题并不是一个问题。在这里,我们只显示一个示例:

  注意:以下代码请参阅博客文章[Python示例36]返回高斯流程的示例。

  我们使用了高斯过程回归方法。从图来看,我们可以看到,在观测点附近的位置,模型受到了强大的约束,并且拟合误差非常小,这非常接近实际值。Mistakes不断增加。

  我们将介绍一种简单的方法来在海洋库中实现连续误差线。

  以上是“使用matplotlib进行数据视觉(1)”的全部内容。这是作者自己的学习记录,也是个人经验的分享。我将不时更新此系列内容。我希望为读者提供一些帮助。