近日,kdnuggets对数据科学和机器学习语言的使用进行了问卷调查。他们分析了954份回复,得出结论:Python已经击败R语言,成为分析、数据科学和机器学习领域最受欢迎的平台。最常使用的语言。请问这个问卷的具体情况如何?作者整理在kdnuggets上发表的文章总结如下:我们之前在kdnuggets上做过这样的问卷调查,2016年和2017年,在分析,数据科学和机器学习的工作中,你使用R,Python,还是两者都用,或者选择另一种语言?通过分析954份回复,我们得出的结论是,尽管Python尚未完全取代R,但在2017年,Python已成功击败R成为分析、数据科学和机器学习平台中最常用的语言。2016年Python依然是第二名(34%主要使用Python的人,42%主要使用R语言的人),2017年Python领先R语言5%(主要使用R语言的人)使用Python的占41%,其中36%主要使用R语言)。同时使用Python和R的人数也从2016年的8.5%增加到12%,而使用其他语言的人数则从16%下降到11%。图1:2016-2017年,在分析、数据科学、机器学习中使用Python、R语言、Python和R语言等语言后,我们分析了不同语言之间的转换情况。图2:2016-2017年,各种语言在分析、数据科学、机器学习平台的转化这张图看起来很复杂,但是从Python的忠诚度和转化率这两个关键水平很容易看出来领先于其他语言。忠诚度:使用Python的用户比使用其他语言的用户对它的忠诚度更高。2016年使用Python的用户中有91%在2017年继续使用它,而R的这一比例为74%,其他语言的这一比例为60%。转化率:2016年到2017年,只有5%的Python用户转用R语言,而10%的R语言用户转用Python,是前者的两倍。此外,2016年同时使用这两种语言的人中只有49%继续使用这两种语言,38%转用Python,11%转用R语言。接下来我们就来看看这些语言在2014-2017年的使用趋势。因为我们在2015年的【RvsPython】问卷中没有提供【同时使用两种语言】的选项,所以下面这张2014年到2016年的四年对比趋势图展示了Python和R在2016年和2017年我们是这样计算的:Python*=(Python占比)+50%*(同时使用Python和R语言的占比)R*=(R占比)+50%*(同时使用Python和R语言的占比)R语言)可以看出R语言的使用率在逐年缓慢下降(从2015年的50%下降到2017年的36%),而Python的使用率从2014年的23%上升到2017年的47%2017年。此外,其他语言的使用率也在逐年下降。图3:从2014年到2017年,Python、R语言和其他语言在分析、数据科学和机器学习方面的使用情况对比***。我们还按地区分析了几种语言的使用趋势。区域分布如下:美国/加拿大,40%欧洲,35%亚洲,12.5%拉丁美洲,6.2%非洲/中东,3.6%澳大利亚/新西兰,3.1%。换算成单独使用R语言和Python的比例,将亚洲、澳洲/新西兰、拉丁美洲、非洲/中东四个比例相对较小的区域合并为一个区域。图4:2016-2017年,不同地区Python、R等语言使用率下降4%,其他语言使用率下降5-7%。以上数据表明Python的使用前景非常广阔。我们也预测R语言和其他语言的使用率还是会有相当大的比重,因为它们有着深厚的用户基础。
