当前位置: 首页 > 科技赋能

当Claude3猛烈殴打GPT4时,亚马逊云技术露出了“神秘微笑”

时间:2024-05-19 16:32:13 科技赋能

正当OpenAI与Musk“角力”如火如荼之际,Gemini因图像“多样性”过多而陷入困境,这就导致了过度的政治正确。

,Anthropic 让 Claude 3 模型家族措手不及,仿佛凭空出现。

这位“新王登基”筹划了多久? Anthropic是Amodei兄弟姐妹于2018年创立的一家独角兽公司——一家倡导安全和以人为本的价值观的AI公司(在价值观上与OpenAI有着不同的愿景)。

核心创始团队均来自OpenAI,参与过GPT -3早期产品开发。

Anthropic成立时,他们在亚马逊云技术上训练了第一个基本模型,然后在短短4个月内从Claude 2.1迭代到Claude 3。

Claude 3 发布后,Sonnet 模型立即在 Amazon Bedrock 上得到支持,而今天,仅仅 9 天后,Haiku 也在 Bedrock 上可用。

截至发稿,Google Cloud 上的 Claude 3 仍处于预览和即将推出状态,而 Google Cloud 的 Vertex AI 的产品栏仍然让 Gemini 占据前排位置。

去年亚马逊云技术的 re:Invent 上,大家莫名其妙地发现,亚马逊云技术 CEO Adam Selipsky 采访了一位名不见经传的企业家、Anthropic 联合创始人 Dario Amodei。

过去,这个位置是为可口可乐、纳斯达克、高盛等大客户保留的。

当时并没有多少媒体关注战略合作的具体内容:Anthropic 将大部分软件迁移到亚马逊云技术的数据中心,亚马逊云技术为 Anthropic 提供了从定制 GPU 计算能力到存储、数据的多方位支持分析等。

亚马逊云技术客户将优先访问人择模型。

而且,这次战略合作的“定制化程度”高得莫名其妙:1、大模全托管服务Amazon Bedrock为Claude提供定制服务; 2.针对Claude优化亚马逊云科技自研芯片——持续优化训练芯片Trainium和推理芯片Inferentia。

显然,当时我们谁都没有注意到达里奥的话异常霸道:“这是一场力争上游的竞赛。

《01 这是一场大投资游戏吗?事实上,在re:Invent之前两个月,去年9月,亚马逊宣布对Anthropic投资40亿,是谷歌对Anthropic投资的两倍。

业界对这笔投资的评价是:展现了“金融家之父”对Anthropic的坚定信心,也说明了亚马逊在“生成式AI”领域的拼命努力。

虽然Anthropic的40亿投资规模巨大,但你打开亚马逊云技术的网页就能发现。

看看Amazon Bedrock上还有其??他17个高性能基础模型!这17个模型来自6家公司:AI21 Labs、Cohere、Meta、Mistral AI和Stability AI,虽然第六家公司是亚马逊自己,但Titan似乎是故意的。

AI21Labs – 2个模型,Jurassic-2 Ultra,Mid,这是一个多语言的大语言模型,包括葡萄牙语、意大利语和荷兰语 – 4个模型,是用于检索和总结信息的大语言模型,主要用于。

用于抽象、复制聚类或分类任务。

Meta – 2 个开源模型。

亚马逊云技术是第一家集成Facebook Llama 2的云供应商。

这是一个开源模型,目前在中国可用。

优点是客户可以通过 Amazon SageMaker 对 Llama 2 进行微调。

Stability AI – 2个模型,主要针对图像生成能力。

Mistral AI – 2 个高性能模型。

这是一家法国AI公司,可以覆盖大型模型的基础场景。

此外,亚马逊还开发了5款车型。

Amazon Bedrock的吸引力除了拥有大量大型模型外,还在于它可以针对特定应用场景评估和比较最佳模型;它使用专门的数据库来训练最适合你的大模型,比如各种缩写、各种名词、各种流程训练后都可以有自己的“默契”;大型开源模型可以自行再次调优; Amazon Bedrock 的代理还可以执行业务指令,同时确保数据安全和隐私保护。

,Guardrail可以为最终的生成式AI应用提供专属的保护措施。

因此,Amazon Bedrock的“工程能力”让其在业内贴上了“易用”的标签。

然而,问题来了: 1. 为什么亚马逊云技术提供这么多模型?根据亚马逊云技术自己的官方说法,从全球多个客户使用生成式AI的现实场景中发现:没有一个基本模型可以统治一切,甚至一种使用场景需要调用多个模型,价格也必须都要综合考虑。

从亚马逊云技术的角度来看,问题已经从“选择哪种模式更好”转变为“如何轻松接入”。

所谓“易接入”,是指多次尝试、切换模型的成本较低。

一位企业开发者表示:“现在大型模型太多了,来回切换并尝试不同的大型模型一点也不聪明。

Amazon Bedrock 只是一个‘调用’来调整那个模型。

而且,使用巨大的模型来完成任何任务都是昂贵且负担不起的“2.有很多型号,是的。

但为什么亚马逊云技术不推广自己的模式呢?有一个时间表可以很好地解释这个问题。

Bedrock于2020年4月发布,其中有Meta(7月23日上线)、Cohere(7月23日上线)、Mistral AI(2月24月底上线)等“明星”AI公司的大型模型上线Bedrock发布后,这个平台陆续推出。

也就是说,亚马逊云科技从一开始就押注在“淘金热中卖铲子”的赛道上。

或许,除了始终痴迷于客户需求(亚马逊称之为“Customer Obsession”)之外,更重要的原因是:云计算平台本来就应该是一个“市场”,Market Place,一个公共基础设施很重要能够为优质玩家提供更好的服务——云计算是一个工程化的“商城”服务——这就是本质。

02投资生成AI只是买买买吗?看到Amazon Bedrock的强大功能和17款领先的基础模型,你是否认为布局生成式AI只是为了市场上的买卖而存在?不!你想卖空市场上所有的股票,但其他人可能不希望你投资它们。

为什么?因为你的基础“技术基础”不好。

生成式AI是一个非常昂贵的行业,成本主要包括三个方面:算力、算法和数据。

当我们更多地关注算法时,总是很容易忽视计算能力。

这是亚马逊云技术最具竞争力的部分。

引用VentureBeat的报告:“亚马逊云技术正在开发生成式AI领域的全栈布局,包括云基础设施、基础模型和面向用户的应用程序。

《亚马逊云技术在生成式AI上的“全栈”布局:最底层是训练和推理的基础设施层。

各种超级芯片(自研+NVIDIA)为基础模型训练和推理提供超强算力;中间层则是是基于Amazon Bedrock的全托管模型服务;上层是生成式AI应用层,包括生成式AI助手-Amazon Q和AI编程助手Amazon CodeWhisperer,从这一点来看,亚马逊云技术是依托。

以其极其坚实的基础,与像Anthropic这样的大型模型“先驱”玩鸡生蛋的游戏——也许这就是贝佐斯的飞轮效应:更多的商品——更热闹的地方——更多的人——更大的地方——更便宜的商品——更多的人。

- 更大的地方... 了解亚马逊云技术在生成式人工智能浪潮中的独特作用 我一直在尝试寻找亚马逊云技术选择大型模型的标准:既然我选择了很多,但不是全部,那么标准是什么?有一个词反复出现并引起我的注意:“宪政AI”。

它的直译是“宪法人工智能”。

官方的解读是:亚马逊云技术强调帮助企业构建“负责任的AI”,即公平、可解释、稳健、透明、可治理,并确保隐私和安全。

在字里行间的反复暗示中,我发现这个词的正确解释不应该是什么呢?这是关于它不是什么——它不是通用人工智能。

换句话说,它不是一个与人类相媲美、超越人类、无所不能的人造神。

具体来说,它确保使用自定义模型的用户将其数据保存在客户自己的内联网中,并且不使用任何数据来训练底层模型。

这会成为亚马逊云技术选择大型机型的标准吗?我没有得到亚马逊云技术的官方回应。

03年底,当大家都在自己构建大型模型时,亚马逊云技术更倾向于为大型模型提供一把“挖金铲”——作为云计算的创始人和迄今为止云计算领域的领导者,亚马逊云技术在生成式AI时代的战略定位以及“云是公共服务”本质的认知逻辑值得我们今天的中国云计算厂商思考。

是的,公共服务是规模经济,公共服务是稳定第一,公共服务是降本降价,但这只是结果,前提是绝对优秀、值得信赖的工程能力。

事实上,本质上,亚马逊云技术正在凭借其平台优势滚动更多大型模型。

不是不滚,而是滚得更多。

那么最后一个问题“看似显而易见,但如果深究起来,却没有任何意义”:云厂商为何要滚动大型模型?难道是怕生成式AI开辟新赛道,抢了云计算的风头?显然,这是因为业内人士会认为这是一个伪命题,大型模型离不开计算能力。

那么云计算厂商在做什么呢? 2017年,亚马逊云技术公司re:Invent的一个概念或许可以提供答案:“数据引力”。

其基本理念是:数据在哪里,资源就在哪里,趋势就在哪里。

数据就像一种引力,吸引着一个又一个的技术趋势走向它,比如2016年的数据湖。

这一说法对于今天的生成式人工智能来说也是如此。

过去我们经常提到“数据驱动”,数据驱动企业、数据驱动决策、数据驱动应用、数据驱动硬件设计……过去我们更关注“数据驱动”这个词。

数据”。

也许更重要的是“司机”。

数据如何“驱动”?这就是当今强大的人工智能。

毕竟,云厂商从诞生之日起就清楚地知道数据、AI、云缺一不可。

灰线绵延数千英里,但今天的生成式人工智能一直存在,这场大游戏已经上演。

我们看到的是热点,它们已经看到了它们命运的未来。