OFweek可穿戴设备网 在6月底公布的最新TOP超算排行榜中,中国神威·太湖之光悄然淘汰了连续第六次排名的冠军天河二号,它的兄弟产品已成为第一台理论性能达到 10 exaflops 的超级计算机。
它使天河二号此前保持的性能提升了一个数量级,晋升为新的世界第一超级计算机。
与太湖之光一起,获得的不仅仅是第一名的荣誉。
此次,中国登上TOP榜单的超级计算机数量首次超过了之前的霸主美国。
超级计算应用在过去三十年也取得了突破。
更重要的是,太湖之光计算机使用的是国产处理器,而不是英特尔的至强处理器。
用国产处理器“替代”英特尔、AMD等国际公司的处理器一直是国家的战略和梦想。
现在,太湖之光电脑的梦想真正实现了。
不过,在最初的新闻报道中,笔者也看到不少人在评论中表示对国产处理器的批评(虽然大多数否认太湖之光的人只是在发泄情绪和负能量),这个问题也是影响国产处理器发展的重要因素。
国内加工商。
由于缺乏生态系统,中国很难开发自己的处理器。
过河的唯一方法就是“摸着石头过河”。
这块石头就是国外已经开发出来的处理器指令集。
然而这条路线很容易被不明真相的围观者嘲笑——都用了别人的指令集,怎么还能用呢?你敢说这是自主产权吗?对于这个问题,龙芯处理器架构师胡伟武博士在多年前也解释道:“我们的CPU也可以是世界上最好的,它也做到了。
关键是用不着,用户做不到。
”不需要你。
”软件生态系统的现实决定了国产处理器不可能从头开始研发。
对此,日本在20世纪80年代和90年代通过TRON项目开发通用操作系统和CPU但最终失败的例子可以说是前车之鉴。
相反,C大飞机这样的国际分工合作模式很容易成功。
。
在处理器的研发方面,既然我们的目标是“过河”,那么为了稳定和安全,摸着石头过河去仔细探索也是可行的。
在处理器研发方面,中国可以说是摸到了河里的所有石头。
从X86到ARM再到MIPS以及小众的SPARC、Alpha甚至安腾架构,几乎都在国内尝试过。
今天的超课堂,我们就简单了解一下国产处理器的指令集体系和技术来源。
据公开资料显示,笔者能找到的具有代表性的国产处理器方案主要有龙芯、神威、兆芯、飞腾、宏碁,以及在智能手机/平板领域表现最好的海思、展讯、全志。
它们所使用的架构涉及X86、ARM、MIPS、Power、SPARC、Alpha等,如下图: 常见国产处理器指令集系统及来源(点击放大) 龙芯:纯国产芯,但商业化不尽如人意 龙芯不是最早的国产处理器,也不是最成功的国产处理器,但说到国产处理器,大家第一个想到的恐怕就是龙芯。
它是曝光度最高的国产处理器,而且考虑到它是中科院计算机所研发的产品,其血统的纯粹性使其更容易成为国产处理器的代表。
龙芯课题组成立于2001年,但龙芯处理器的正式诞生日期是2011年8月10日。
在计算所所长李国杰院士的带领下,龙芯之父胡伟武博士及其团队来了搭载龙芯1号处理器。
当时他还写了一篇文章《我们的龙芯1号》介绍龙芯的研发过程。
小编当年也看过这篇文章。
我还记得的是,龙芯的中文代号是“苟胜”,源于中国人“靠名誉谋生”的习俗,但也可以看出,团队虽然对未来抱有期待说到龙芯处理器,当时肯定对这个项目的未来发展相当担心。
不过,龙芯的英文名字非常高——Godson,上帝之子!龙芯自诞生之日起就享有自主研发的美誉,但很快就被曝出龙芯的指令集实际上源自MIPS,也就是说是被收购的。
这让龙芯立即饱受诟病,研发团队也担负重担。
为了避免骂名和压力,胡伟武博士还解释了为什么选择MIPS指令集。
前面提到的“用户不需要你”就是根本原因。
建立自建的软件生态系统对于中科院这样的学术机构来说是一项不可能完成的任务。
龙芯的第二个疑点是,他们选择了MIPS指令集,而不是现在流行的ARM指令集。
然而,回到那个时代(龙芯项目开发的时代可能更早),当时的ARM还不如今天。
实力雄厚,而且MIPS在高校和科研机构有着良好的基础,所以龙芯团队选择MIPS也是可以理解的。
无论如何,龙芯项目还是活了下来。
从最初的龙芯一号到现在的龙芯三号,已经发展了三代。
每一代实际上都衍生了多个版本,从单核、双核到四核、八核。
从nm工艺到28nm工艺,从双发射到四发射,龙芯处理器的架构、规格、频率、性能都在不断提升。
龙芯3B甚至声称其性能已经达到Intel Ivy Bridge处理器的水平。
它的指令集实际上已经远远超出了MIPS的范围,融入了龙芯团队开发的许多指令。
与之前的产品相比,它增加了多条定制的龙芯扩展指令,可以用来实现与其他主流指令系统的二进制翻译兼容,此外存储访问和I/O效率也得到了很大的提升,还有一点是软件和硬件将保持向前兼容。
但龙芯也并非没有缺点。
大多数龙芯处理器实际上都在中科院向外界展示成果的展位上。
尽管大家多年来对龙芯抱有期待,但中科院甚至让旗下子公司江苏梦兰集团参与成立中科龙梦想公司加速商业化,还推出了玲龙/富龙/艺龙台式电脑、笔记本等产品。
然而,这些产品大多寿命较短,性能达不到主流水平,很快就被遗忘了。
神威/飞腾:最成功的国产处理器,军队的秘密武器。
神威和飞腾虽然选择了不同的处理器路线,但因为背后都有军工背景,所以会放在一起讨论。
神威处理器由无锡江南计算技术研究所(总参第五十六研究所)研制。
它的名字是上海高性能集成电路设计中心,而天津飞腾则是国防科技大学的子公司。
另外,我们之前报道过,一家名为Phytium的公司在去年的Hotchips大会上推出了一款代号为Mars的多核处理器。
这家公司就是广州飞腾,据说隶属于国防科技大学,但与研发飞腾没有任何关系。
FT处理器的天津飞腾不是一家公司。
回到正题,江南在计算机技术研究方面也有丰富的经验,但他们对处理器指令集的选择似乎有点标新立异——DEC的Alpha 4指令集。
从技术上来说Alpha有其独特之处,DEC也曾统治过当时的处理器市场。
AMD的K7架构有一些源自Alpha架构的技术。
AMD上一任CEO Dirk Meyer来自DEC,是去年辞职的Zen架构之父。
Jim Keller 还在 DEC 开发了 Alpha 架构。
现在DEC公司早已消失。
该公司曾多次被转售。
Win之后微软也放弃了对Alpha架构的支持。
Alpha架构早已不再更新,专利也已经过期。
这或许是江南选择Alpha架构的原因之一。
一。
2016年,济南超算中心部署了信威蓝光。
它使用的处理器是16核的Sunway SW。
目前的信息认为,它基于专利已过期的 DEC ALPHA 4A EV-56 架构。
核心为神威SW0处理器。
此次太湖之光的神威SW0处理器也是江南研发的。
虽然大家猜测它仍然是Alpha指令集,但与龙芯后续的架构类似。
神威SW0的架构和指令集已经走得很远了。
它远远超出了之前的范围,并添加了许多新的指令。
这次SW0是核心众核架构,乱序执行架构,频率1.45GHz,整个处理器包括4个MPE(ManagementProcessingElement)管理单元、4个CPE(ComgProcessingElement)计算单元和4个MC内存CPE 单元由 64 个内核组成,呈 8x8 阵列,因此总数为 1 个内核 (4x64=)。
与其他国产处理器相比,神威系列在性能方面完全走在前列,在全球范围内也处于前列。
SW0的理论浮点性能高达3TFLOPS,并且可以通过Inel最新的Xeon Phi加速其性能。
卡牌大战。
然而,神威处理器的缺点是内存系统。
太湖之光的性能是天河二号的三倍,同时总内存从1.4PB减少到1.31PB。
每个节点均采用四路DDR3内存,带宽为GB/s,不及Intel的Xeon Phi加速卡。
后者本身集成了16GB eDRAM缓存,带宽超过GB/s,并且早就支持DDR4内存。
我们再来说说飞腾。
天津飞腾研发的FT系列处理器也已应用于HPC领域。
不过,飞腾FT处理器采用的架构更为复杂。
据公开资料显示,第一代FT处理器兼容Intel Itanium 2指令集。
其中,第二代FT-64处理器已应用于银河计算机,第三代产品FT-基于开源UltraSPARC架构,8核64线程,用于天河一号计算机的节点网络上。
后续的FT-依然基于SPARC架构,制程工艺从65nm升级到40nm,拥有16个核心线程。
天河二号超级计算机采用FT处理器作为节点前端处理器。
最新的FT-A虽然名字和上面类似,但实际上并没有什么关系,因为它的架构已经变成了ARM 64位,并且采用了28nm工艺。
据天津飞腾总经理顾宏介绍,FT-A系列处理器是一款64位通用CPU,兼容ARM V8指令集,采用国际先进的28nm工艺流片。
具有高性能、低功耗等特点,关键技术国内领先。
,可替代英特尔中高端“至强”服务器芯片,广泛应用于政府办公、金融、税务等行业的信息系统。
无论是神威还是飞腾,这两款具有军工背景的国产处理器单元可以说是国产处理器中最成功的,因为它们的目标明确——无论是性能还是架构设计都是独一无二的。
神威处理器不仅有硬件研发,还在编译器和Linux操作系统(神威锐思)上进行了创新。
此次太湖之光有3个应用入围戈登贝尔奖,这也得益于江南在超级计算应用方面取得的成就。
努力。
中盛宏芯:在蓝色巨人IBM的帮助下,Power架构能撑起天空吗?通用处理器架构也蓬勃发展。
英特尔面临的对手比现在多得多。
不过现在X86已经几乎统一了。
能够与英特尔竞争的公司就更少了,甚至像拥有Power架构的IBM这样的实力公司也没有。
那么,他们索性在2016年联合NVIDIA、泰安计算机等公司成立了OpenPower开放联盟,其他公司也可以获得Power架构授权。
此后,2016年推动成立了中国POWER技术产业生态联盟。
IBM已与多家中国企业签署了授权协议,其中之一就是中盛宏芯。
中盛宏鑫成立于2001年,创始人为江苏梦兰集团、江苏中盛致远、苏州高新创业投资集团。
梦兰集团,我们之前说过,是中科院旗下的公司,而后两者可以说是江苏政府的代表,所以中升宏芯收购动力架构技术得到了工信部的支持。
信息技术部、江苏省人民政府、中国科学院计算技术研究所。
计算所甚至派出了技术团队。
如果一切都能如期引进、消化、吸收,中升宏芯宏碁应该会在2019年推出国产化的Power处理器。
IBM的Power架构一度成为国产处理器的希望,但事与愿违。
虽然中盛宏芯很快就推出了CP1处理器,但这只是IBM Power 8处理器的马甲。
公司还没来得及消化电力技术,就引发了拖欠工资的纠纷,中科院派出的技术人员无法支付工资。
此后,公司持续动荡,股东变动,人员变动也频繁。
指望中升宏芯推动Power架构国产化是无望的。
此外,IBM的Power架构在国内银行等重点行业有重要应用,Power处理器性能强劲。
这是个好东西,但要介绍和消化却不是那么容易。
以Power 8架构为例,它有12核96线程。
,核心面积达到了mm2,复杂度远高于普通处理器。
另外,它原本使用的是IBM自家的22nm SOI工艺,而使用SOI工艺的代工厂并不多(GlobalFoundries用过,但在28nm节点上放弃了,后来又继承了IBM的衣钵),这无疑增加了难度Power处理器的国产化。
兆信/海光:中国能用X86技术打败Intel和AMD吗?前面提到的国产处理器中,除了具有军工背景的神威和飞腾之外,基于MIPS、SPARC和Power架构的处理器的发展历程可谓一波三折,而他们面临的核心问题也都是一样的——软件生态系统还远不如X86。
既然大家都能注意到这个问题,那为什么中国不直接选择X86系统呢?这是一个很好的问题。
别提了。
中国其实有人在研究X86架构。
国内最早对Focus授权相关的机构进行了宣传,称“这是美国历史上首次在美国境外获得X86兼容微处理器和系统芯片的开发授权。
”也是迄今为止中美两国在半导体领域最具影响力的技术合作。
” AMD给出的处理器是基于X86架构的,中国已经获得了X86技术。
不过,大多数人都没有听说过Geode处理器,因为它是一款AMD嵌入式处理器,最初起源于Cyrix公司的MeidaGX平台。
,后来Cyrix的这部分业务被美国国家半导体(NS)收购,而AMD在2008年收购了美国国家半导体的Geode业务。
AMD授权给北大的X86技术显然不可能是最顶尖的,所以选择了嵌入式架构对于中国。
不过,这个“善举”已经可以被北大好好安装了。
很多人可能不记得北大会处理这件事。
处理器,本来也是MIPS架构。
得到AMD的授权后,他们的PKUnity86-3是我扯得有点远了,咱们言归正传吧。
由于X86架构是由AMD和Intel提供的,他们通常不可能将该技术授权给其他人。
AMD之前的例子更多的是利用购买的技术来迎合中国市场。
中国企业从这两家公司获得了X86技术。
可能性几乎消失了。
但我们不要忘记,X86 技术并不局限于 AMD 和 Intel。
VIA 还授权 X86。
他们的技术来自 Cyrix,Cyrix 是 Intel 将 X86 技术授权给外部方的几家公司之一。
当年英特尔反垄断案和解后,威盛的X86技术被认为是合法的。
但VIA本身是一家小公司,玩不了高性能的X86架构。
他们生产的Nano、Nehemiah、Esther(以斯帖)、Isaiah(以赛亚,VIA总经理陈文琪、王雪红夫妇都是基督徒,产品代号也很宗教化)等处理器各有特色,但由于制造工艺无法与Intel相比,架构和性能也无法相比。
由于没有市场,威盛干脆将X86技术卖给了中国的上海兆芯公司。
兆信也是一家背景雄厚的公司。
该公司成立于2001年,由上海市国资委下属联合投资公司与VIA公司共同出资设立。
注册资本2亿美元,上海投资80%,威盛控股20%。
这次合作显然是由中国大陆出资,威盛提供技术,因为兆芯的业务范围包括X86 CPU、ARM CPU、GPU和芯片组研发,这些都是威盛现有的。
上海国资委旗下的投资公司不具备这项技术。
。
凭借雄厚的背景,兆信如期拿下国家核高技术项目。
据公开报道,兆信已获得高达56亿的核高技术补贴,目前仍在申请中,总计高达70亿。
至于退货,兆芯声称其自主研发的ZX-C处理器已于今年4月量产。
它采用28nm工艺,是一款四核处理器,主频高达2.0GHz,TDP功耗仅为18W,支持国密算法加密。
不过兆芯的CPU基本上都是VIA处理器的马甲。
毕竟从成立到产品上市只用了2年左右的时间。
这么快生产出四核X86处理器并不容易。
除了上海兆芯之外,国内另一家获得X86技术授权的公司是天津海光。
这件事还得从AMD说起。
今年Q2季度财报发布后,AMD宣布与中国天津海光投资公司达成协议,获得X86技术授权。
海光公司获得2.93亿美元的许可费,双方还将成立一家合资公司。
目前AMD与海光之间的X86授权协议尚不清楚,但AMD此次授权给中国企业的X86很可能不再是低端,因为AMD想要打开中国的高性能服务器市场,而AMD此次授权给中国企业的X86很可能不再是低端。
授权架构很可能是高性能Zen技术,换句话说,AMD可能已经给了中国公司最前沿的X86技术。
如果真是这样的话,AMD这次可真的要苦苦挣扎了。
海思:商用市场的成功才是真正的成功。
这里虽然选择了华为海思,但我想说的其实是海思、展讯、全志、瑞芯微等一批民营企业研发的处理器,海思就是选择。
以Si为代表,因为海思是最好的之一。
虽然这些公司没有太多背景(海思背后的华为是一家大公司,是个例外),但他们是商业上最成功的国产处理器,这与之前推出的其他处理器不同。
商业公司以市场为导向,不必承受国内生产和自主产权的压力。
他们无一例外地选择了最流行的ARM系统。
他们的架构大部分都是从ARM的Cortex-A系列授权的,GPU也是收费授权的。
海思还可以开发自己的基带、ISP、DSP等芯片。
目前的麒麟处理器是首款Cortex-A72核心、Mali-TGPU和台积电16nm Plus工艺处理器,达到了国际先进水平。
总结:上面介绍的国产处理器中,大致可以分为学术派、军用派、国有派和民间派。
其中商业化最好的显然是私人的。
国内厂商在手机/平板SoC处理器方面非常擅长。
军方的飞腾和神威已经做出了成绩。
由于目标明确,神威SW0在众核架构上达到了世界一流水平。
不满意的是学术派和国营派。
龙芯被寄予厚望,但市场化却困难重重。
考虑到MIPS指令集的应用场景,龙芯不可能进入主流市场。
一些国有资本参与的国内加工企业更是令人失望。
他们推出的处理器往往声称是国产的,有自主产权或者自主研发,但大多是幕后黑手。
许多项目旨在获得该国核电基地的巨额补贴。
当然,说到榨取国家补贴,不仅是国有企业,所有企业其实都对这块蛋糕垂涎欲滴。
虽然华为海思在商用市场发展得不错,值得称赞,但他们并没有忘记核心补贴。
我们曾经报道过华为的泰山服务器。
此前有消息称其采用华为自研CPU架构,但后来华为公关要求我们澄清该处理器不是16核而是32核,基于公版Cortex-A57架构,华为表示该项目是属于国家核高技术计划,不会批量生产。
作者并不反对国家对高新技术发展的补贴。
从目前国内相对疲软的形势来看,国家对处理器研发、存储芯片研发、半导体技术等重大技术的支持和补贴是非常有必要的。
问题是如何避免一些公司浑水摸鱼,欺骗纳税人。
尽管存在这些问题,但国产加工商无论如何都是一个需要大力发展的产业。
我们希望看到中国企业在不久的将来生产出世界一流的高性能处理器,与英特尔、AMD、高通竞争。
当企业同台竞技时,虽然不是所有人都会选择国产处理器。