风险投资家Matt Turck近日发表文章《权力越大,责任越大》,介绍了2018年大数据和人工智能的发展趋势。
并发布了全景图,涵盖基础设施、开源框架、公司等,将AI、大数据的发展趋势尽收眼底。
△马特·图尔克(Matt Turck) 马特·图尔克(Matt Turck)是美国知名早期投资机构FirstMark的董事总经理,因早期成功投资Pinterest、Shopify、Airbnb、Riot Games、InVision和Tapad等超级独角兽而闻名。
。
马特也是纽约乃至美国知名的科技潮流“布道者”。
他发起并组织了两个新趋势分享社区,一个以大数据和人工智能为中心,名为 Data Driven NYC;另一个以大数据和人工智能为中心,名为 Data Driven NYC;另一个集中于尖端技术和新兴计算平台。
它被称为“硬连线纽约”。
人工智能与大数据全景全景涵盖了大数据人工智能行业的基础设施、开源框架、数据API、数据资源、跨基础设施分析、行业应用、企业应用、分析工具等。
涵盖了多家大数据公司。
纳入全景。
全景图中出现的一些关键公司已经上市,特别是 Cloudera、MongoDB Pivotal 和 Zuora。
截至撰写本文时,其他公司正在准备上市,例如 Elastic。
2020年人工智能和大数据发展趋势年是数据世界令人兴奋但复杂且不断变化的一年。
一方面,数据技术(大数据、数据科学、机器学习、人工智能)不断发展,变得越来越高效,并在全球企业中广泛应用。
今年迄今为止企业界的关键主题之一是“数字化转型”,这并非偶然。
这个词对于有些人来说可能有点陌生,他们可能会嘀咕:过去25年不都是这样吗?但这反映了一个事实,即许多传统行业和企业现在完全致力于真正的数据驱动之旅。
另一方面,更广泛的公众已经意识到数据中的缺陷。
无论是通过关于人工智能风险的公开辩论、剑桥分析丑闻、Equifax 大规模数据泄露、与 GDP 相关的隐私讨论,还是有关中国政府加强监控的报道,数据世界都开始暴露出更黑暗、更黑暗的一面。
更可怕的危险。
1)基础设施和分析工具从行业角度来看,数据生态系统仍然一如既往地令人兴奋和充满活力,拥有大量创新型初创企业、成熟的“扩展器”和许多活跃的公共技术供应商。
最重要的是,许多大大小小的客户正在大规模应用这些技术,并从他们的努力中获得不可否认的价值。
随着用更现代的数据产品取代旧的 IT 技术的循环继续进行,大数据市场(基础设施、分析)似乎正在快速循环通过早期的大多数买家,并逐渐过渡到传统采用曲线的后期阶段。
此外,数据世界继续向云发展。
考虑到大型公共云提供商(AWS、Azure、谷歌云平台、IBM)的增长速度有多快,每季度产生数十亿美元的收入,这是令人震惊的。
这一趋势引发了人们对供应商锁定的持续担忧,这可能为提供多云解决方案的初创公司提供机会。
然而,到目前为止,采用多云战略的公司仍然倾向于依赖一个供应商作为其主要提供商。
随着业务不断增长,大型云提供商通过其平台(例如 Amazon Neptune、Google AutoML 等)提供广泛的大数据、数据工程和机器学习工具,通常采用激进的定价策略,因此相互排斥竞争越来越激烈,都是为了吸引更多的开发者,因为他们真正的商业模式是数据存储。
随着此类工具的范围和复杂性不断增加,这对数据技术领域产生了重大影响,可以说使初创公司更难以竞争,至少在面对巨大的横向机会时是这样。
AWS re:Invent 等主要云供应商会议上发布的年度产品清单可能会给初创公司带来巨大冲击,因为它们使云供应商与数十家风险投资支持的初创公司直接竞争。
看看公开市场对开源软件公司 Elastic 即将进行的 IPO 有何反应将会很有趣。
不过,只要初创企业足够差异化,机会还是有很多的。
许多企业正在这个领域快速扩展,生态系统的基础设施和分析部分中有许多特别有趣、快速增长的部分,包括流/实时、数据治理和数据结构/虚拟化。
人们对人工智能兴趣的激增也为人工智能芯片、GPU 数据库、人工智能 DevOps 工具以及支持在企业中部署数据科学和机器学习的平台带来了巨大的机会和大量资金。
2)机器学习和人工智能毫无疑问,这是人工智能研究领域疯狂的一年,从AlphaZero的强大到新技术发布的惊人速度——新形式的生成对抗网络、替代循环神经网络、Geoff Hinton新的胶囊网络。
像 NIPS 这样的人工智能会议每天都会吸引数千篇学术论文提交。
与此同时,也许值得庆幸的是,对通用人工智能的追求仍然难以捉摸。
当前对人工智能的兴奋和恐惧大多源于2018年深度学习的亮眼表现。
然而,在人工智能研究领域,人们中越来越普遍地存在一种情绪:“接下来怎么办?”因为有些人质疑深度学习的基础知识(反向传播),而另一些人则希望超越他们所认为的“蛮力”方法(大量数据、大量计算能力),也许更喜欢基于神经科学的方法。
方法。
在人工智能研究领域,很多人并不担心机器人称霸世界。
相反,他们担心这一领域持续的过度炒作最终可能会让人们失望,导致另一个人工智能核冬天的到来。
然而,在人工智能研究之外,我们正处于深度学习实际部署和应用浪潮的开端,涉及不同行业的语音识别、图像分类、对象识别和语言等多种问题。
如果生态系统的基础设施和分析部分已经发展到晚期,我们仍然是企业和垂直人工智能应用程序的早期先驱。
虽然人工智能初创公司市场可以说显示出最终降温的迹象,但一两年前开始的基于深度学习的初创公司的爆炸式增长仍在继续。
人们对整体规模和估值的期望仍然很高,但我们肯定已经过了大型互联网公司为早期人工智能初创公司支付高价人才的阶段。
与其他利用炒作获利的公司相比,市场上也出现了一些“真正的”人工智能初创公司。
2019 年期间推出的许多人工智能初创公司开始初具规模,其中许多公司在医疗保健、金融、“工业 4.0”和后台自动化等行业和垂直领域提供越来越有趣的产品。
未来几年,深度学习将继续为现实世界的应用带来巨大价值,对于垂直领域的人工智能初创公司来说,将会有许多巨大的机会。
这种持续的爆炸在很大程度上是一种全球现象,加拿大、法国、德国、英国和以色列都特别活跃。
然而,在人工智能方面,中国似乎处于完全不同的水平,有报道称,政府主导的数据聚合规模令人难以置信(涵盖互联网公司和市政当局),并且在面部识别和人工智能芯片等领域快速发展。
并为初创企业提供多轮巨额融资:根据 CB Insights 的数据,中国仅占全球人工智能交易份额的 9%,但其在全球人工智能融资中的份额在 2018 年接近 48%,高于 11% 2018 年(请参阅下面的一些示例)。
同样,数据隐私(以及所有权和安全)问题正在成为全球关注的主要问题。
在互联网的早期,数据隐私是为了保护我们在网上所做的事情,这只是我们活动中相对较小的一部分。
因此,只有一小部分人真正关心数据隐私问题。
随着我们个人和职业生活的各个方面通过越来越多的联网设备连接到互联网,利害关系正在发生变化。
人工智能在海量数据集中发现异常、预测结果和识别面孔的能力加剧了数据隐私问题。
一个单独但相关的问题是,大部分数据归大型互联网公司 (GAFA) 所有。
一些企业,比如 Facebook,已被证明是不完美的管理者。
尽管如此,这些数据使他们在生产更强大的人工智能的竞赛中获得了不公平的优势。
为了回答这些问题,一个新兴主题将区块链视为应对人工智能风险的一种可能方式,以及 GAFA 之外的公司生产更好人工智能的另一种方式。
加密经济学被视为激励个人提供个人数据的一种方式,也是机器学习工程师通过匿名化这些数据来构建模型的一种方式。