当前位置: 首页 > 科技观察

力压R,Python在数据科学领域蓬勃发展

时间:2023-03-16 23:04:35 科技观察

TIOBE最新9月编程语言排行榜,Python以4.67%的增长率战胜C++0.26%,成功逆袭Top3。Python在过去的一年里风头正劲,是数据分析领域专家必备的技能。随着IT行业的发展,对经验丰富的数据科学家的需求也在增长,Python跃居榜首。本文旨在介绍分析数据的基础知识,并使用Python创建一些漂亮的数据可视化。在数据科学领域,除了Python就没有其他语言了吗?毫无疑问,Python是最适合数据科学家的语言。这里有几点可以帮助你理解为什么从事数据科学的人选择Python:你知道最大的好处是什么吗?根据Indeed.com的数据,数据科学家是薪酬最高的工作之一,平均年薪为130,621。Python于1989年由GuidoVanRossum创建。它是一种具有动态语义的解释型语言。它可以在所有平台上免费使用。Python是:在数据科学中为Python安装Jupyter让我们从在我们的系统上安装Jupyter开始。按照以下步骤操作:我建议您使用Anaconda发行版(https://www.anaconda.com/download/)安装Python和Jupyter。安装完Jupyter后,可以在命令行输入“JupyterNotebook”,在默认浏览器中打开。现在我们在Jupyter上编写最基本的程序。name=input("EnteryourName:")print("Hello",name)要运行此代码,请按“Shift+Enter”以查看输出。如下截图所示:PythoninDataScience的基础知识已经准备就绪,可以开始编程了。为了编程,您需要了解以下基础知识:有关Python的更多信息和实际实现,您可以参考这篇文章:Python入门(https://www.edureka.co/blog/python-tutorial/).数据科学中的Python库这就是Python在数据科学中发挥作用的地方。Python拥有大量用于科学计算、分析、可视化等的库。部分库如下:Demo:实际应用问题描述:给定一组数据集,该数据集是由各种数据组成的综合统计数据,如监狱设施的分布和情况,监狱的拥挤程度,以及监狱中囚犯的类型,ETC。请对这个数据集做描述性统计,从数据中找到有用的信息。这里有一些任务:要加载数据,请使用以下代码:importpandasaspdimportmatplotlib.pyplotasplot%matplotlibinlinefile_name="prisoners.csv"prisoners=pd.read_csv(file_name)prisoners然后使用Pandas的describe方法,只需输入以下语句:prisoners。describe()然后执行数据操作:prisoners["total_benefited"]=prisoners.sum(axis=1)prisoners.head()最后,用Python做一些数据可视化。代码如下:importnumpyasnpxlabels=prisoners['STATE/UT'].valuesplot.figure(figsize=(20,3))plot.xticks(np.arange(xlabels.shape[0]),xlabels,rotation='vertical',fontsize=18)plot.xticksplot.bar(np.arange(prisoners.values.shape[0]),prisoners['total_benefited'],align='edge')