参考来源:在之前的Vitu.AI文章中你已经熟悉了编程环境,是时候画一个真正的折线图了让我们一开始就照常设置。设置你的Notebookimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsprint("Settingcomplete")选择数据集本文使用的数据集是Spotify的每日播放次数,我们主要关心以下5首流行歌曲来自2017年至2018年:1.EdSheeran的《ShapeofYou》2.LuisFonzi的《Despacito》3."SomethingJustLikeThis",byTheChainsmokersandColdplay4."HUMBLE.",byKendrickLamar5."Unforgettable",byFrenchMontana点击此处下载数据集,用excel打开如下:这里我们注意到第一个数据点是2017年1月6日,也就是ShapeofYou的第一天,可以看到它在全球首日播放了12,287,078次。其他行是这一天的缺失值,因为还没有发布。我们将csv文件上传到Vitu的数据集空间。接下来,我们使用pandas加载这个文件:#读取文件的路径spotify_filepath="spotify.csv"#将文件读入变量spotify_dataspotify_data=pd.read_csv(spotify_filepath,index_col="Date",parse_dates=True)是的是时候检查数据了我们接下来打印数据集的前5行,和上一篇一样#打印数据的前5行spotify_data.head()可以看到和看到的一样当你用excel打开的时候。第一行全是缺失值NaN(不是数字)。我们可以查看最后5行。这一次只是改变头尾。#打印数据的最后五行spotify_data.tail()终于没有缺失值了,我们可以画图了。绘图部分来了。数据在上一个单元格加载到notebook中,所以我们可以很容易地写一行代码绘制图片#折线图显示每首歌曲的每日全球流sns.lineplot(data=spotify_data)在这行代码中,sns.lineplot告诉notebook我要画折线图,如果sns.barplot代表直方图,sns.heatmap代表热图data=spotify_data代表数据集。我们选择spotify_data。有时我们想更改一些绘图细节,例如图形的大小或设置标题。这个时候我们可以这样设置#设置图的宽高plt.figure(figsize=(14,6))#添加titleplt.title("2017-2018年全球流行歌曲每日流")#折线图显示每首歌曲的每日全局流sns.lineplot(data=spotify_data)子数据集的数据至此我们已经学会了绘制数据集中所有列的数据。在这个链接中,我们将学习如何绘制一些列的数据。首先我们看一下所有的列:list(spotify_data.columns)在下一步的代码中,我们绘制前两列的数据#设置图形的宽高plt.figure(figsize=(14,6))#addtitleplt.title("2017-2018年全球流行歌曲每日流")#ShapeofYou's每日全球流的折线图ns.lineplot(data=spotify_data['ShapeofYou'],label="夏普eofYou")#linechartshowingdailyglobalstreamsof'Despacito'sns.lineplot(data=spotify_data['Despacito'],label="Despacito")#为水平轴添加标签plt.xlabel("Date")原始地址:数据可视化【从编程小白到绘图高手】:2.折线图那些事
