大数据的概念这两年很火。但是在我看来,真正能够应用大数据的BAT公司只有3家。原因自然是他们都有恐怖的流量做支撑。一般来说,样本量越大,误差越小。不过这个基本常识显然还不够普及,所以能把大数据当概念来糊弄人的公司不胜枚举,这里就不多说了。那么大数据引擎的意义何在?主要体现在三个方面:一是可以更好地优化公共基础设施。一定的意义。原因是原来的网络是固定的,顶多可以通过某个区域某个关键词的搜索量是否快速增长来预测这个区域发生了什么。然后做一些相应的措施,但是这个维度很单一。但现在可以通过定位技术获取个人的地理位置,极大地扩展了信息的维度。一方面,它可以扩大预测精度。另一方面,还可以扩展一些其他服务。比如百度在春运期间推出的迁移地图。可用于优化来年交通车辆配置。再比如,中国疾病预防控制中心也可以通过多维度的数据分析来预测流行病的发生。这明显促进了公共基础设施建设。同时,对于城市管理者和整个城市的居民来说,他们也有更多的数据来支持他们的决策,支持他们用更科学的方法进行改进。城市周边环境。第二,减少开发者对大数据的应用。之前说过,我一直认为只有BAT才有实力做大数据。所以对于普通企业或者创业者来说,只能通过付费或者依赖这三个公司来获得相应的数据支持。但是对于个人来说,几乎没有办法参与其中。但是,百度开发的数据分析方法和数据模型(虽然是通过邀请制)让个人参与其中。这让更多的人可以免费享受到大数据带来的好处,一定程度上降低了创业者或个人的发展成本。这将极大地促进未来以个人为中心的产品制造业。只是按照历史来看,免费的时间可能不会特别长。第三,机器大脑带来的技术创新潜力,离机器大脑还比较远。目前百度的百度大脑项目只能模拟两三岁的孩子。但是随着技术的不断积累。会有量变才能实现质变。举个简单的例子,目前国内外整体的语音搜索识别率在70%左右。虽然在数字上看起来高大上,但在实际使用中会让用户感到深深的挫败感。因此,目前语音搜索的使用率还是比较低的(查名字的时候除外,因为词组和名字的识别率已经达到98%左右)。但是当语音搜索的准确率能够达到99%甚至100%的时候,那显然会给那个时候的搜索行业带来一场革命。因此,百度此次开放大数据引擎,对于公共基础设施建设(传统产业改造)、降低个体开发者的开发成本,以及未来的技术创新,都具有特殊的意义。
