随着企业努力应对不断增加的数据量——包括在组织内部生成和从外部来源收集的数据——寻找有效的方法它正变得越来越很难分析和“操纵”这些数据以获得竞争优势。这也推动了数据科学和机器学习领域对新工具和技术的需求。根据《财富商业洞察》报告,2021年全球机器学习市场规模将达到154.4亿美元,今年将达到211.7亿美元。预计到2029年将增长至2099.1亿美元,复合年增长率为38.8%。同时,根据AlliedMarketResearch的报告,2020年全球数据科学平台市场规模为47亿美元,预计到2030年将达到797亿美元,复合年增长率为33.6%。“数据科学”和“机器学习”有时会让人感到困惑,甚至可以互换使用。这实际上是两个不同的概念,但它们是相关的,因为数据科学实践是机器学习项目的关键。根据数据科学硕士网站,数据科学是一个使用科学方法从数据中提取意义和见解的研究领域,包括制定数据分析策略、准备分析数据、开发数据可视化和构建数据模型。《财富商业洞察》报告称,机器学习是更广泛的人工智能领域的一个分支,是指利用数据分析,利用基于算法和模型的模型,教会计算机如何学习(即模仿人类的学习方式)。数据。对数据科学和机器学习工具的需求催生了许多在数据科学或机器学习领域开发尖端技术的初创公司。让我们来看看其中的10个:数据科学和机器学习可以用来监视、调试、解释和改进机器学习模型和数据的机器学习可观察性平台。Aporia成立于2020年,在筹集500万美元的种子资金10个月后,于2022年3月又筹集了2500万美元的A系列资金。Aporia将利用这笔融资在2023年初之前将其员工人数增加两倍,同时扩大其在美国的业务并扩大其技术涵盖的用例范围。BasetenBaseten于今年4月正式发布,提供能够加速从机器学习模型开发到生产级应用的产品。据Baseten称,该技术自2021年夏季以来一直处于测试阶段,可以将机器学习模型投入生产所需的许多技能自动化,帮助数据科学和机器学习团队将机器学习集成到业务流程中,而无需后期处理。终端、前端或MLOps知识。Baseten由首席执行官TuhinSrivastava、首席技术官AmirHaghighat和首席科学家PhilipHowes于2019年创立,他们都曾在电子商务平台开发商Gumroad工作。4月,Baseten在早期的800万美元种子轮融资后筹集了1200万美元的A系列资金。DeciDeci开发了一个深度学习开发平台,用于构建下一代人工智能和深度学习应用程序。Deci的技术旨在帮助解决“AI效率差距”问题,即计算机硬件无法跟上机器学习模型不断增长的规模和复杂性。Deci的平台通过在开发生命周期的早期解决生产问题,减少在生产中部署模型时解决问题的时间和成本,帮助数据科学家缩小这一差距。据Deci介绍,该平台结合Deci专有的AutoNAC(AutomaticNeuralArchitectureConstruction)技术,提供了一种“更高效的开发范式”,帮助AI开发者利用硬件感知的“神经架构搜索”来构建深度学习模型,以满足特定的需求。生产需求目标。Deci成立于2019年,今年7月在InsightPartners领投的B轮融资中筹集了2500万美元,距离它筹集2100万美元的A轮融资仅七个月。GalileoGalileo为非结构化数据开发了机器学习数据智能平台,使数据科学家能够在整个机器学习生命周期中检查、发现和修复关键的机器学习错误。今年11月初,Galileo推出了该平台的免费版本GalileoCommunityEdition,让从事自然语言处理的数据科学家能够使用更高质量的训练数据更快地构建模型。Galileo在5月以510万美元的种子资金退出了秘密模式,随后于11月1日获得了由BatteryVentures领投的1800万美元的A轮融资。Galileo的联合创始人包括CEOVikramChatterji,他曾是谷歌云AI项目管理的负责人;AtindriyoSanyal,Apple和Uber的前软件工程师;和谷歌语音识别系统的前软件工程师YashSheth。工程师。Neuton成立于2021年,开发了一个自动化的无代码“tinyML”平台和其他工具,用于开发微型机器学习模型,这些模型可以嵌入微控制器中,使边缘设备变得智能。Neuton的技术被用于广泛的应用,包括压缩机水泵的预测性维护、电网过载保护、房间占用检测、手持设备上的手写识别、传输故障预测和水污染监测设备。PineconePinecone开发的矢量数据库和搜索技术,主要为人工智能和机器学习应用提供支持。2021年10月,Pinecone推出了Pinecone2.0,将软件从研究实验室带入了生产应用。松果成立于2019年,去年正式发行,2021年1月获得1000万美元种子轮融资,今年3月获得2800万美元A轮融资。10月,Pinecone推出了结合语义和关键字搜索功能的新“矢量搜索”解决方案,扩展了其机器学习搜索基础设施产品组合。Gartner曾将Pinecone评为2021年人工智能和机器学习数据领域的“酷供应商”。使用“一流”的机器学习基础架构开发机器学习模型。该软件目前在许多财富500强公司中处于测试阶段。Predibase提供其技术作为传统AutoML的替代方案,开发机器学习模型来解决现实世界的问题。该平台使用声明式机器学习,Predibase表示,它允许用户将机器学习模型指定为“配置”或简单文件,告诉系统用户想要什么,并让系统找出满足该需求的最佳方法。Predibase由首席执行官PieroMolino、首席技术官TravisAddair、首席产品官DevvretRishi和斯坦福大学副教授ChrisRe共同创立,Molino和Addair均曾在优步工作。在优步期间,两人开发了用于深度学习模型的Ludwig开源框架,以及用于将深度学习模型训练扩展和分发到海量数据的Horovod开源框架(Predibase建立在Ludwig和Horovod之上。)5月,Predibase在由Greylock领投的种子轮和A轮融资中筹集了1650万美元。SnorkelAISnorkel成立于2019年,起源于斯坦福大学人工智能实验室,该公司的五位创始人致力于解决机器学习开发缺乏标记训练数据的问题。Snorkel基于SnorkelFlow开发了一个以数据为中心的系统,该系统于今年3月全面推向市场,通过使用程序化标签,这是数据准备和机器学习模型开发和培训的关键步骤。机器学习的发展。2021年8月,Snorkel的估值为10亿美元,当时这家初创公司筹集了8500万美元的C轮融资,利用这些资金发展其工程和销售团队并加速平台开发。VecticeVectice开发了一种自动化的数据科学知识捕获和共享解决方案。Vectice的技术自动捕获数据科学团队为项目创建的资产,包括数据集、代码、模型、笔记本、运行和插图,并在整个项目生命周期(从业务需求到生产部署)中生成文档。据称,Vectice的软件旨在帮助公司管理透明度、治理以及与人工智能和机器学习项目的一致性,并提供一致的项目成果。Vectice由首席执行官CyrilBrignone和首席技术官GregoryHaardt于2020年创立,1月份筹集了1260万美元的A系列资金,使其总资金达到1560万美元。VertaVerta开发AI/ML模型管理和操作软件,数据科学和机器学习团队使用这些软件在整个AI和ML模型生命周期中部署、操作、管理和监控固有的复杂模型。8月,Verta增强了其MLOps平台的企业功能,包括添加原生集成生态系统、围绕企业安全、隐私和访问控制以及模型风险管理的附加功能。Verta成立于2018年,2020年正式发布,今年被Gartner评为AI核心技术领域的“coolvendor”。
