当前位置: 首页 > 科技观察

Kaggle调查:2018年数据科学家使用(和推荐)的顶级编程语言

时间:2023-03-12 07:51:34 科技观察

总结Kaggle对超过23,000名数据专业人员的调查概述了最受数据专业人员欢迎的编程语言。Python是迄今为止最流行的编程语言,其次是SQL和R。毫不奇怪,Python是最受有抱负的数据科学家推荐的编程语言,Python几乎已成为数据科学和机器学习的默认编程语言。数据科学的实践需要使用分析工具、技术和编程语言来帮助数据专业人员从数据中提取见解和价值。Kaggle最近对近24,000名数据专业人士进行的一项调查显示,Python、SQL和R是最流行的编程语言。到目前为止,最受欢迎的是Python(83%的使用率)。此外,四分之三的数据专业人士建议有抱负的数据科学家首先学习Python。图1.2018年最受数据科学家欢迎的编程语言Kaggle在2018年10月对全球23,859名数据专业人士进行了调查(2018年机器学习和数据科学原始调查数据下载链接)。该调查包括有关数据科学、机器学习、教育等的各种问题。Kaggle发布了原始调查数据(见上面的链接)。本文分析了2018年数据专业人士使用的数据科学和机器学习编程语言的调查数据。最常用的编程语言调查包括一个问题,“你经常使用什么编程语言??(选择所有符合条件的)。平均而言,数据专业人员在2018年使用了3种(中位数)语言。如图1所示,2018年排名靠前的编程语言是Python(83%的受访者表示他们使用这种语言),其次是SQL(44%)和R(36%)。排名前十的语言分别是C/C++、Java、Javascript/Typescript、Bash、MATLAB、C#/。Net和VisualBasic/BVA完成。图2.最常用的编程语言在自称数据科学家的数据专业人士中,93%使用Python,54%使用SQL,46%使用R。调查还询问了受访者,“具体是哪种编程语言?”作为图2显示,超过一半(54%)的数据专业人员最常使用Python。其余的编程语言不太受欢迎,只有13%的数据专业人员表示他们使用R,8%的数据专业人员表示他们使用SQL。比较2017年编程语言的使用情况,我们发现Python的使用量增加了23个百分点(2017年使用量为60%),SQL使用量增加了2个百分点(2017年使用量为44%)。然而,R的使用率下降了10个百分点(2017年使用率为46%)。数据科学家最推荐哪种编程语言?图3.数据专业人士推荐的编程语言该调查还询问了受访者他们会向有抱负的数据科学家推荐哪种首选编程语言(见图3)。结果表明,四分之三的数据专业人员会推荐Python作为学习的第一门编程语言。其他编程语言的推荐率要低得多(12%的受访者推荐R;5%推荐SQL。当将统计范围缩小到作为数据科学家的数据专业人士时,推荐的是:Python(78%)、R(13%)和SQL(5%)