当前位置: 首页 > 后端技术 > Python

数据可视化【从编程小白到绘图高手】:3.直方图和热力图

时间:2023-03-26 16:52:38 Python

参考来源:Vitu.AI在上一篇文章中,你已经学会了如何绘制折线图。接下来,让我们了解直方图和热图。设置你的笔记本。让我们在开始时将importpandas设置为pdimportmatplotlib.pyplot。aspltimportseabornassnsprint("Settingcomplete")选择数据集。在本文中,我们将使用美国交通部有关航班延误的数据。点此下载数据集,用excel打开如下:我们可以看到,每个单元格代表各家航空公司2015年的平均延误时间(分钟),负数表示航班提前到达。例如,美国航空公司(AA)在1月份的平均延误时间为7分钟。我们将csv文件上传到vitu的数据集空间接收接下来,我们使用pandas加载这个文件:#文件路径readflight_filepath="flight_delays.csv"#将文件读入变量flight_dataflight_data=pd.read_csv(flight_filepath,index_col="Month")你会注意到这次我们的read_csv代码和上一章有点不一样。这次数据月份不再是日期,所以我们不需要添加parse_dates=True。是时候查资料了。由于这次的数据比较少,我们可以看一下整个数据集#打印dataflight_data直方图比如我们要画一个直方图来显示SpiritAirlines(NK)按月份的平均延误时间#设置图形的宽度和高度plt.figure(figsize=(10,6))#Addtitleplt.title("AverageArrivalDelayforSpiritAirlinesFlights,byMonth")#barchartshowingaveragearrivaldelayforSpiritAirlinesflightsbymonthsns.barplot(x=flight_data.index,y=flight_data['NK'])#广告dlabelforverticalaxisplt.ylabel("Arrivaldelay(inminutes)")这句话创建了一个柱状图sns.barplot(x=flight_data.index,y=flight_data['NK'])里面有很多点sns。barplot-这告诉笔记本我们要绘制直方图x=flight_data.index-这表明x坐标使用flight_data列的索引,这里是月份y=flight_data['NK']-这是y的坐标使用NK的延迟数据热图。本文还有一张图要介绍。我们将在下面的代码中创建一个热图来查看flight_data。每个cell是根据实际值着色的cell#设置图的宽高plt.figure(figsize=(14,7))#添加titleplt.title("AverageArrivalDelayforEachAirline,byMonth")#Heatmapshowingaveragearrivaldelayforeachairlinebymonthsns.heatmap(data=flight_data,annot=True)#为横轴添加标签plt.xlabel("Airline")图中可以直观的看出哪个航空公司的延误最严重,南北!原文地址:数据可视化【从编程小白到绘图高手】:3.直方图与热图