几周前我提到了如何使用git的提交元数据(metadata)和RapleafAPI收集Github上流行组织的一些统计数据(日志,每个组织的数据)。现在我感兴趣的是通过编程语言而不是组织来分解这些数据。网上关于屌丝程序员对应各种编程语言的描述很多,但是我还是很好奇他们是怎么对应真人的。几周前,我提到了如何使用git的提交元数据(metadata)和RapleafAPI为Github上的热门组织收集一些统计数据(日志、每个组织的数据)。现在我感兴趣的是通过编程语言而不是组织来分解数据。网上关于屌丝程序员对应各种编程语言的描述很多,但是我还是很好奇他们是怎么对应真人的。首先,我想简单地统计一下每种编程语言的用户的年龄、收入和性别。根据我收集的数据,这项工作比较容易:对于每个repo使用的编程语言的统计,我使用Github自带的语言统计结果。例如,Github估计这个项目的75%是Java代码。统计某个语言的代码占每个项目50%以上的贡献者的收入。Filteroutthoseprogramminglanguages??withincomepoints>100.87,589.29112Haskell89,973.82191PHP94,031.19978CoffeeScript94,890.80435VimL94,967.11532Shell96,930.54979Lua96,930.69101Erlang97,306.55168Clojure97,500.00269Python97,578.872314JavaScript97,598.753443EmacsLisp97,774.65355C#97,823.31665Ruby98,238.743242C++99,147.93845CSS99,881.40527Perl100,295.45990C100,766.512120Go101,158.01231Scala101,460.91243ColdFusion101,536.70109Objective-C101,801.60562Groovy102,650.86116Java103,179.391402XSLT106,199.19123ActionScript108,119.47113这是上表对应的柱状图:大部分语言的排名都比较符合预期,得出以下结论:不要将其用作薪水著名的PHP是一种非常通用的语言,普通的、年轻的、低收入的程序员都可以使用它。从图中右边的***部分可以看出,Java和ActionScript多用于企业级软件的开发,所以他们的薪资是相当可观的。另一方面,由于对XSLT、Puppet、CoffeeScript等某些语言不熟悉,你知道为什么这些语言排名靠前或者收入靠后吗?谢谢你让我知道。需要注意的是,这些数据全部来自开源项目,因此可能无法准确反映那些闭源开发者的收入水平。Rapleaf没有完整统计每个人的收入,因此数据可能存在偏差。数据有误(年龄、性别……)Github上没有统计所有项目,所以结论可能不具有代表性。***,如果您对统计结果或方法有任何想法或建议,请告诉我,我将发布另一份按年龄和性别排名的编程语言报告。原文链接:http://www.cnbeta.com/articles/249485.htm
