Python的许多吸引人的特性,如效率、代码可读性和速度,使其成为数据科学爱好者的首选编程语言。Python通常是希望提升其应用程序功能的数据科学家和机器学习专家的首选。(例如,AndreyBulezyuk使用Python编程语言创建了一个惊人的机器学习应用程序。)由于Python的广泛使用,它拥有大量的库,使数据科学家更容易完成复杂的任务,而不必处理太多繁琐的编码。这里有3个用于数据科学的顶级Python库;如果您想在该领域开始您的职业生涯,请查看它们。1.NumPyNumPy是顶级库之一,它提供有用的资源来帮助数据科学家将Python变成强大的科学分析和建模工具。这个流行的开源库在BSD许可下可用。它是一个用于执行基本科学计算任务的Python库。此外,NumPy是更大的基于Python的开源工具生态系统的一部分,该生态系统称为SciPy。这个库为Python提供了大量的数据结构,可以方便地执行与多维数组和矩阵相关的计算。除了用于求解线性代数方程和执行其他数学计算之外,NumPy还用作不同类型数据的通用多维容器。此外,它与其他编程语言如C/C++和Fortran完美集成。NumPy库的多功能性使其可以轻松快速地与其他数据库和工具结合使用。例如,让我们看看如何使用NumPy(缩写为np)来乘以两个矩阵。让我们从导入库开始。importnumpyasnp接下来我们使用eye()函数生成指定维度的单位矩阵。matrix_one=np.eye(3)matrix_one输出如下:array([[1.,0.,0.],[0.,1.,0.],[0.,0.,1.]])让我们生成另一个3x3矩阵。我们将使用arange([startingnumber],[stoppingnumber])函数来生成数据。请注意,函数中的第一个参数是要列出的初始数字,最后一个数字不包含在生成的结果中。此外,应用reshape()函数将原始生成矩阵的维度修改为所需的维度。对于“可乘”的矩阵,它们应该具有相同的维数。matrix_two=np.arange(1,10).reshape(3,3)matrix_two输出如下:array([[1,2,3],[4,5,6],[7,8,9]])让我们使用dot()函数将两个矩阵相乘。matrix_multiply=np.dot(matrix_one,matrix_two)matrix_multiply下面是输出:array([[1.,2.,3.],[4.,5.,6.],[7.,8.,9。]])惊人的!我们设法在不使用普通Python的情况下将两个矩阵相乘。下面是这个例子的完整代码:importnumpyasnp#generatinga3by3identitymatrixmatrix_one=np.eye(3)matrix_one#generatinganother3by3matrixformmultiplicationmatrix_two=np.arange(1,10).reshape(3,3)matrix_two#multiplyingthetwoarraysmatrix_multiply=np.eye(熊猫熊猫是另一个可以增强数据科学Python技能的很棒的库。就像NumPy一样,它属于开源软件的SciPy家族,并且在BSD自由软件许可下可用。Pandas提供了各种强大的工具来分析数据结构和执行一般数据分析。该库适用于不完整、非结构化和无序的现实世界数据,并提供用于形成、聚合、分析和可视化数据集的工具。该库中有三种类型的数据结构:系列:单维齐次数组DataFrame:具有不同类型列的二维数据Panel:三维,大小可变的数组例如,让我们看看如何使用PandaPython库(缩写为Performsomestatisticalcalculationsforpd)。让我们从导入库开始。importpandasaspd让我们创建一个Series字典。d={'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas','Irene','Sagar','Simon','James','Rose']),'多年经验':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),'ProgrammingLanguage':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])}让我们创建一个DataFrame。df=pd.DataFrame(d)这是一个很好的输出表:NameProgrammingLanguageYearsofExperience0AlfrickPython51MichaelJavaScript92WendyPHP13PaulC++44DusanJava35GeorgeScala46AndreasReact77IreneRuby98SagarAngular69SimonPHP810JamesPython311RoseJavaScript1下面是这个例子的全部代码:importpandasaspd#creatingadictionaryofseriesd={'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas','Irene','Sagar','Simon','James','Rose']),'多年经验':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),'ProgrammingLanguage':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])}#CreateaDataFramedf=pd.DataFrame(d)print(df)3。MatplotlibMatplotlib也是SciPy核心包的一部分,可在BSD许可下使用。它是一个流行的Python科学库,用于生成简单而强大的图形。您可以使用这个用于数据科学研究的Python框架来生成创意图形、图表、直??方图和其他形状的图形,而无需编写很多行代码。例如,让我们看看如何使用Matplotlib库创建一个简单的条形图。让我们从导入库开始。frommatplotlibimportpyplotasplt让我们生成x轴和y轴值。x=[2,4,6,8,10]y=[10,11,6,7,4]让我们调用绘制直方图的函数。plt.bar(x,y)让我们看一下情节。plt.show()这是直方图:TopPythonLibraries"src="http://p1.pstatp.com/large/pgc-image/82db3249297a4341bc0db37acb841bed"width="372"height="252">这是例子完整代码:#importingMatplotlibPythonlibraryfrommatplotlibimportpyplotasplt#sameasimportmatplotlib.pyplotasplt#generatingvaluesforx-axisx=[2,4,6,8,10]#generatingvauesfory-axisy=[10,11,6,7,4]#callingfunctionforplottingthebarchartplt.bar(x,y)#showingtheplotplt.show()结语Python编程语言在数据处理和分析方面一直做得很好,但在复杂的科学数据分析和建模方面却做得不太好。顶级的Python框架数据科学有助于填补这个空白,让你能够执行复杂的数学计算并创建复杂的模型来理解您的数据。
