当前位置: 首页 > 科技观察

NVIDIA禁止GeForce在数据中心运行?这下可真是“冤枉”了

时间:2023-03-12 20:20:00 科技观察

这几天,围绕着英伟达的禁令,在国内人工智能界和科技界掀起了一场异常火爆的“讨论”,但是随着英伟达官宣昨日,此事终于水落石出。只有一个结论——英伟达这次真的“冤枉”了。重新审视NVIDIA新规,问题出在哪里?  首先,让我们“回顾”一下新规和整个事件的爆发。  这次的新规定其实来自英伟达英文官网的GeForce驱动下载页面。用户在下载驱动程序之前必须查看相应的许可协议(类似于安装软件之前必须查看的许可协议)。  这也意味着所有使用GeForce驱动软件的用户实际上默认同意本许可协议。  争议内容出现在“许可”部分的“限制”项中,具体说“除非数据中心正在执行区块链计算,否则数据中心未被许可使用该软件。”  此内容最先被德国科技杂志golem.de实时发现并报道,随后被用户“booooomba”发布到Reddit论坛,但消息描述却悄然发生了变化——  ”ThenewNVIDIAEULAprohibitsDeepLearningapplicationstoberunonGeForceGPUs.(ThenewNVIDIAEULAprohibitsrunningdeeplearningapplicationsonGeForceGPUs.)”  为什么“booooomba”会选择这个角度解读新规定,我们不知道不知道,但这个新规确实带来了以下问题:这个规例中的“数据中心”到底是指什么?为什么要排除区块链运营?  “限制”条款中的其他三项是常见的产品权利,为什么第四条会有这样的具体规定?  接下来,雷锋网将进一步分析这三个主要问题。关键问题1:NVIDIA到底想限制什么?  昨天,在NVIDIA对雷锋网的官方回复中,可以清楚地了解到,新规针对的不是普通GeForce显卡用户,而是大型数据中心。而拥有这些大型数据中心的人往往都是大商人。  NVIDIA官方声明称:“不鼓励用户在恶劣的大型企业环境中不当使用我们的GeForce和TITAN产品。”  与此同时,NVIDIA还强调:“研究人员经常将GeForce和TITAN产品用于非商业目的或其他不在数据中心规模上运行的研究目的。NVIDIA无意禁止这些用途。”  通过这两个阐述,不难看出其中两个,需要同时满足的关键定义标准:是否商用,以及数据中心的规模。  结合这两个条件,我们可以得到的是目前正在为用户提供“GPU云计算”服务的大中型云服务商。关键问题2:为什么要“放手”区块链?  在之前的很多报道中,不少媒体都或多或少地加了一句“说明”:  “NVIDIA这次限制了数据中心,但比特币挖矿放手了!”,甚至有媒体友写道“NVIDIA的新禁令:你不能用GeForce显卡运行深度学习(挖矿可以)”的标题,但事实真的如此吗?  首先需要说明的一点是,NVIDIA从来不支持GeForce系列产品进行挖矿。  今年年中,NVIDIA在一次显卡品牌活动上直接表态:“NVIDIA不鼓励GeForce游戏显卡挖矿,也不鼓励用户挖矿,挖矿请使用专用挖矿显卡卡片模型。”  虽然这句话目前还没有写在任何法规上,但NVIDIA今年年中发布的挖矿专用GPU就是最好的证明。  今年NVIDIA推出的挖矿专用显卡代号为“P106-100”,是消费市场上的GeForceGTX1060显卡“改装”而来。网上各种游戏都需要这个软件才能运行)也被阉割了。  闹了这么多事,目的只有一个——尽可能保护消费市场。  在比特币辉煌的2013-2014年,AMD的HD7000系列也出现了长期断货的现象。  但随着2014年和2015年比特币的急剧降温,越来越多曾经用于挖矿的AMD显卡“回归”消费市场。AMD消费产品市场带来的售后问题,更是让AMD叫苦不迭。  NVIDIA一直对显卡的挖矿浪潮保持警惕。今年初ICO带动的“挖矿热潮”掀起时,国内多家NVIDIA显卡代工专门发帖表示:  “如果该产品用于挖矿,我们将保留拒绝保修和维修的权利。”  从AMD的教训,到OEM厂商的生活,再到P106-100专用矿卡的推出,NVIDIA挖矿都躲不掉,怎么支持呢?  P106矿卡驱动其实是从GeForce驱动改过来的  问题是,为什么这个规定忽略了区块链计算?  显卡行业的专业人士终于说出了秘果——并不是NVIDIA支持区块链,而是GeForce驱动其实“间接”也用在了挖矿专用显卡上。  至于为什么不专门做一个系列的驱动,NVIDIA没有那个功夫,也不想花那个功夫。关键问题三:NVIDIA为何如此“强调”这项规定?  虽然驱动的用户协议一般都是大家都约定好的,但是NVIDIA把它和很多产品最基本的规定放在一起,可见这个规定的重要性。  为什么NVIDIA对这条规定如此“突出”?除了NVIDIA官方声明中提到的产品适用性担忧外,直接原因是NVIDIA希望明确区分消费市场和企业市场。  必须提前强调一下,这跟钱有关,但不是简单的钱的问题。  因为这种情况在整个半导体产品市场普遍存在。从NVIDIA的竞争对手AMD到CPU龙头英特尔,其实都有自己的细分市场。当然,根本原因在于消费市场和企业市场的不同。  消费市场的用户往往用途比较单一,同时对产品的需求也比较集中。  比如GPU,你只要图形性能好,运行稳定就可以了。  但是对于企业来说,仅仅提供硬件是不够的,还需要为他们开发各种软硬件接口,需要适配各种应用场景,需要提供各种企业级的服务,甚至是工程师来现场寻求技术帮助。  这些羊毛自然应该是羊的,才造成了价格差距。  NVIDIA针对不同GPU加速应用的解决方案  如何针对消费市场和企业市场的“两只羊”进行合理收费,最终成为半导体行业企业必须面对的问题。问题。  向能够产生商业利益,同时需要更多产品和服务的云服务商收取更多费用是“正常”的。  从另一个角度来看,“消费级产品比企业级产品便宜”甚至可以理解为“NVIDIA合理收取企业级市场费用,从而降低消费级市场的成本”。  这既是公司整体战略的选择,也是市场竞争规律最终选择的结果。  补充说明:消费类产品真的不适合企业市场吗?  如前所述,消费级市场和企业级市场“截然不同”,最好的解释之一就是两者使用环境的不同:  消费级市场的GPU通常安装在机箱和要求自己完成整个散热过程,同时使用时间更短,使用频率更低。  在企业市场,GPU通常是“塞”在机架上,通常只配备散热器,依靠外力(风、液体)来完成散热过程,使用时间很长,频率高使用率很高,稳定性要求永远优先。  这也使得两个市场的产品在各个方面都大相径庭,比如外观。  就拿GeForceGTX1080Ti和TeslaP40来说,同样采用GP102核心(具体型号不同),关键处理器参数非常接近。前者和后者的外形完全不同:  GTX1080Ti自带涡轮风扇,显卡散热器后部不允许空气流通。这种冷却方法在消费PC市场环境中非常有效。  TeslaP40采用无风扇、头尾相接的设计。几张可以紧密排列在服务器内,不影响散热效果。  除了外观上的差异,NVIDIA其实也会花费一些潜能。  虽然在GPU生产过程中使用了相同的材料和工艺,但最终的产品往往会有些细微的差别。  比如有的GPU可以工作在较低的电压,有的GPU有更高的超频性能等等,这些细微的差别,再加上NVIDIA在产品参数上的不同调整,最终形成了服务器产品。冗余。  主流的云服务都是商用的企业级产品  考虑了很多因素后,相信大家可能会有自己的判断,至少雷锋网是这么说的:产品业务澄清了一次,“遗憾”招的都是之前“不按云服务行业规则走”的公司。  雷锋网还专门采访了国内云服务巨头和腾讯云,阿里云对此不予置评。  但据雷锋网查询,阿里云其实一直与NVIDIA保持密切合作,NVIDIA最新的TeslaV100系列GPU也已经到阿里云手中,正在部署中。  腾讯云的回应更为直接:  “不推荐使用GeForceGPU构建企业级IaaS(基础设施即服务)服务然后出售。从企业级用户的需求来看,他们似乎更看重稳定性。Telsa系列的稳定性在能效上确实有优势。”当被问及NVIDIA与其合作的价值时,腾讯云工程师表示:“NVIDIA对我们硬件的支持非常快。  腾讯云在此基础上进行深度开发,推出了多款满足用户需求的产品。”  有趣的是,亚马逊AWS在今年10月推出了NVIDIA的8路TeslaV100GPUAccelerator,并作为新的云服务提供给终端用户。  从这个角度来看,虽然在账面上使用GeForce更划算,但以这种方式打造企业级服务的云服务商,实际上只是行业内的“异类”。  写在最后:草稿也要喂给挖井人  作为并行计算乃至人工智能时代的主要“动力源”,NVIDIA的几款GPU正在带动整个行业向前发展他们不断提高的表现。  而NVIDIA所做的不仅仅是打造产品、开发软硬件接口、提供应用解决方案、孵化初创公司、举办技术峰会等等。  与其黑NVIDIA的“垄断”,不如说NVIDIA在技术上的不断“飞跃”,在其产品和服务上创造了巨大的优势。  但是,因为企业技术和市场的快速发展,就对其进行限制,不让其“垄断”,这是否违背了技术开发和市场开发的初衷,还是真正的“滥用权利”?