这个帖子被人发现之后小火了一把,但迅速被林野粉丝发现并回答了他的疑问,话还说的有理有据:
“游戏佬,你说的没错,参数也很正确,立方体存算单元 5000 块芯片中拿出一个确实可以当GPU用,计算能力初看是 H200 的上千倍。但文档中说的不是很具体,实际情况下周的发布会才能出来。野神能做出加强版 CPU 出来,当然也能做出加强版 GPU 出来,靠这两个东西来兼容现有生态。”
还有人回复他:“你根本不用担心,你要是着急,那个加强版 CPU 也能当显卡用。打游戏用不着 H200,5090已经够了,而加强版 CPU 已经比 5090 厉害多了。超导 CPU 现在只是一个过渡产品,发布会上野神甚至都懒得给它想个名字,估计不会做成一个系列。”
下面有人接着回复:“楼上牛X,还不会做成一个系列!野神都不知道的事你居然都知道了!”
这个争论无关痛痒,林野此时正在检查量产线的情况。
等量产线的调试参数和最终结果传回星金科技总部时,天色已经擦黑。
吴军其实说的比较保守,发布会当天其实就已经有一条量产线调试好了,但之所以说七天后才量产,为的就是攒产品,同时添加新的量产线。总得先做出来一些产品,比如几十万个才能开始卖吧。
这其实也是业界普通的规则,懂的都懂,不懂的还真以为 7 天后量产线才能调好呢!
晚上的车间里灯火不算明亮,因为灯只开在有人的地方。自动化率高达 90% 的自动化产线按照预设流程平稳运转根本不像人一样需要灯光,1cm×1cm 的超导 CPU 芯片如同雪花般从产线末端送出,经过检测、封装、磁屏蔽,再被整齐码入料盒。两周后上市的承诺,必须不负预期!
林野站在监控屏前看了不到三分钟,便转身回到了的自己的个人实验室。
量产的事,不需要他亲自盯梢。团队成熟、工艺稳定、良率超出预期,加上吴军早就安排好了最稳妥的负责人,有张京,有金载宪,有三上哲也,一切井井有条。他和吴军,都该从琐碎的执行层面抽离,回到真正决定下一代算力格局的地方:存算一体架构的最终定型。
实验室里安静得只剩下制冷系统微弱的气流声。
吴军正坐在控制台前,屏幕上铺满了二进制存算一体的架构图、约瑟夫森结阵列、单元互联拓扑、CERN 两年积累的全精度原始数据流。看到林野进来,他揉了揉眉心,把一长串测试日志推到一边。
“量产那边稳了?”
“稳了。” 林野拉过一把椅子坐下,“产线一天几百颗,后续还能扩开。首批价格定在两万,后续持续每个月降二百,一直降到两千块钱,足够应付全球这一波算力荒。”
吴军点点头,语气轻松了不少:“那就不用我们操心了。下面的人比我们更懂排产、供货、售后。我们的战场,不在这里。”
他指尖在屏幕上一点,画面切回核心架构。
林野身子微微前倾,直接切入正题:“吴老师,存算一体这边,到底怎么样了?功能测试、稳定性、兼容性,都跑通了吗?”
吴军眼底露出一丝笃定的笑意:“没问题。2048 比特原位存算小单元,位运算、逻辑、定点、加法、乘法、内部数据搬运,全都跑通。每 1M 单元配一颗 64 位整数加 2048 位定点强核心,控制器负责指令译码、分支跳转、中断、外设管理,完整兼容我们拿到的指令集。
你听我说起来很复杂,其实比起 CPU 的结构要简单多了,从单元到集群,从仿真到流片,全链路测试一遍过。”
林野松了口气:“那就好。这么说,单机顶一整座数据中心的目标,是真的能落地。”
“能落地。” 吴军语气顿了顿,神色微微一正,“但现在卡我们的,不是算,是存。”
“存?” 林野皱眉。
“对。” 吴军调出 CERN 那边刚发过来的协议文件,“我们已经和欧洲核子中心谈妥,拿到他们整整两年的全精度原始数据。这批数据你也清楚,是真正的高价值、高密度、高体量。”
“接下来的问题很现实:超导存算芯片算力再强,也要先把数据读进来。算完之后,要把结果写回去。原始数据要归档,有价值的中间结果要暂存,后续处理要调度,你算得再快,存储跟不上,一切都是白搭。”
林野愣了一下,他下意识想说:存算一体本身不就自带存储吗?
话还没出口,吴军已经先一步开口,语气带着点半开玩笑的催促:“别愣着。快把你之前说的,实验室里那个压箱底的 5000 层堆叠存储芯片给我拿出来。”
林野一怔:“您说那批纯存储实验片?还有,存储这方面不是有陈静之博士负责吗?”
林野有些疑惑不解,吴军点点头先夸了他一下:“有点当领导的样子了,确实由陈博士负责,但他主抓算法和设计,实现不还是得你来?”
林野点点头,承认吴军说的有理。
吴军继续说道,“计算芯片因为结构复杂、怕干扰、怕应力,只能稳定堆叠 100 层。你那纯存储虽说不负责复杂运算,只有读写电路,不过能直接堆到 5000 层也确实很有本事。”
“我们现在,就要用它,再做一套和存算单元配套的立方体存储模块。”
林野脱口问出之前没问出的问题:“吴老师,咱们不是存算一体吗?本身就是数据在单元里,直接算,为什么还要单独做一套存储立方体?直接存在存算一体芯片内部不行吗?”
话音刚落,吴军轻轻摇了摇头,语气带着一点长辈对晚辈的耐心点拨,“你啊,还是年轻,一扎进技术里,就容易把系统问题想简单了。我问你:存算一体的核心是什么?”
林野脱口而出:“以算为主。数据不搬运,就近计算,消除延迟瓶颈。”
“那存储的核心是什么?”
“…… 存数据。”
“那它存的是什么数据?”
吴军盯着他,一字一句问清楚:“是正在算的热数据?还是有价值的中间结果?还是几年都不会动一次的原始归档数据?还是计算完成之后,要对外输出、给物理学家画图、给团队分析、给其他机构共享的最终成果?”
林野一下被问住了。
吴军放缓语气,解释道:“存算一体里的‘存’,是高速缓存级、计算伴随级的存储。它的使命,是服务于计算,不是给你当仓库、当硬盘、当数据冷库。
你把几百年都用不上一次的原始冷数据,全塞进存算单元里?那叫浪费,叫结构错位,叫把超算中心当成移动硬盘用。”
林野眨眨眼,忽然反应过来,嘴角忍不住上翘,一副恍然大悟的样子:“哦 —— 原来是这样!吴老师您不说,我还真差点犯低级错误。我还以为,存算一体啥都能装,直接把全人类的图书馆塞进去一起算呢。”
吴军一眼就看穿他的小心思,好气又好笑地指了指他:“少跟我油嘴滑舌,你明明懂,就是故意逗我,是吧?”
林野嘿嘿一笑,不再装糊涂:“被您看出来了。我就是觉得,一路压力这么大,跟您开个小玩笑放松一下。”
“说正经事。” 吴军把话题拉回来,“咱们继续说存储......还有计算与存储的区别。单独的一套立方体存储单元,有没有必要?会不会多余?我现在就告诉你,为什么我们一定要做,而且尺寸、形状、结构,都不能随便来。”
他调出一张信号传播时延图,光速 c 在标尺上格外醒目。“硅基芯片要注意的问题是发热,但是超导计算要注意的问题是光速。而且所有高性能系统,最后卡脖子的,都是光速。”
林野神色一正,认真听着。
“我们为什么把存算单元,定为10 厘米 ×10 厘米 ×10 厘米的立方体?你当时是随口一说,但我计算过后才发现这个尺寸真不能随便选的,不是为了好看,不是为了好拿。”
“光在真空中的速度大约 3×10? 米 / 秒。在芯片内部、在介质里,还要更慢一点。10 厘米,也就是 0.1 米。光走一遍 0.1 米,需要多少时间?”
“大约 0.33 纳秒,也就是 330 皮秒左右。一个来回,就是约等于 0.7 纳秒。这个尺度,刚好和我们的存算单元芯片的外部时钟周期、指令延迟处在同一个数量级。
再大一点,比如做到 20 厘米、30 厘米?信号从这头传到那头,就要 1 纳秒、2 纳秒。你内部算力再强,光在路上跑的时间,就把你性能吃掉大半。这就是‘尺寸 — 延迟互换’。”
林野听懂了:“原来我随口说的 10 厘米立方体,恰好是被光速‘逼’出来的最优结构。”
“对。” 吴军点头,“立方体,是我们在结构强度、封装难度、信号延迟、量产性之间,选出来的最优解。”
“球形,从信号延迟看,其实更完美:中心到任意一点距离相等,时延最均匀。”
“但球形怎么堆叠?怎么机柜安装?怎么布线?怎么维护?工程上不现实。所以我们退而求其次,用立方体。”
林野恍然大悟:“所以,存算单元必须 10 厘米立方体,是为了算力不被光速浪费。”
“没错。” 吴军话锋一转,“但存储单元,不一样。存储不负责高频计算,不负责皮秒级指令响应。它负责的是:容量、容量、还是容量。”
“延迟高一点、几十纳秒、几微秒,对归档、对后处理、对长期存储,完全可以接受。所以存储单元,不需要死守 10 厘米。它可以更大、更厚、更密,完全不用被光速延迟卡死。”
林野眼睛一亮:“那我们存储单元,做成什么尺寸?”
吴军忽然露出一点淡淡的笑意,藏着两个技术人员才懂的恶趣味:“你觉得,什么尺寸,最普及、最标准化、最容易搬运、最方便堆叠、全世界建筑工人都熟?”
林野愣了一下:“您的意思是……”
“砖头。” 吴军一本正经的说道,“就按标准红砖尺寸做。长 240mm,宽 115mm,厚 53mm。我们把它做成长方体存储砖,不是正方体,不是球形,就是一块‘超导存储砖头’。”
林野先是一呆,跟着猛地爆笑出来:“砖头?!吴老师,您认真的?我们这是在推动人类文明算力进入新纪元,结果存储单元,做成砖头的尺寸?”
“不行吗?” 吴军一脸淡定,“好拿、好放、好堆叠、好装箱、好入库。机房一摆,整整齐齐一排红砖,别人一看还以为进了工地。如果某个砖头出了故障还很容易替换,你看,多有辨识度。这就叫大道至简,细节藏在工程里。”
林野笑得停不下来:“要是早几年别人问:你们星金科技最顶尖的存储单元长啥样?我们说:就长砖头样。全世界都得懵。”
“懵就对了。” 吴军淡淡说道,“真正的顶级技术,不是长得像科幻片,是好用、便宜、能打、还能把同行看懵。”
笑过之后,林野重新收敛心神,开始认真算,“行,那就听您的,存储砖:240×115×53 mm。那我们一块砖,里面能塞多少颗 1cm×1cm 的纯存储芯片?”
他在纸上快速勾画:1cm = 10mm;一块砖底面 240mm × 115mm,一层大概能放 24×11 = 264 颗;厚度 53mm,芯片加屏蔽大概 2mm 一层,可以叠 20 多层,取整 25 层。
一块砖总芯片数:264 × 25 = 6600 颗。
林野吸了口气:“一块砖头,6600 颗纯存储芯片。每一颗都是 5000 层堆叠,容量是计算芯的 80 倍以上。”
吴军点头:“你继续算。一个房间,能放多少块?”
林野脑子飞速运转:“就按普通机房房间:长 10 米,宽 6 米,高 3 米。不算通道,不算机柜,粗略塞满。一块砖体积:240×115×53 mm3 ≈ 0.000146 m3。一个房间体积:10×6×3 = 180 m3。能放的砖块数:180 / 0.000146 ≈ 123 万 块。”
他越算声音越轻,到最后几乎是喃喃自语:“一块砖 6600 颗存储芯片。整个房间:123 万 × 6600 ≈ 81 亿 颗存储芯片。”
吴军平静的提醒他:“每一颗,都是 5000 层超导存储,密度远超磁带。你知道磁带现在的极限是多少吗?老式磁带,每平米几十 GB;最新磁带库,每平米也就几 TB 到十几 TB。我们这是超导约瑟夫森环存储,单颗 1cm×1cm,容量直接以百 PB、EB计。你自己算,一个房间,总容量是多少。”
林野在心里简单一乘,数字大到他头皮发麻。
一颗存储芯片 ≈ 80PB 级别,81 亿颗……他已经不需要精确到个位了,只需要一句话,就能形容:“一个房间,能把人类有史以来,所有文字、所有视频、所有书籍、所有卫星图像、所有科研数据、所有互联网内容,全部存进去,还剩一大半空位。”
实验室里,一下子安静下来,林野被震惊了!
吴军可没有震惊,他只在摸着下巴,好好的欣赏着林野的震惊,看看这个学生还能说出来什么词儿!
过了几秒,林野才缓缓吐出一句:“以前总说‘数字海洋’,现在才知道,那叫小溪。我们这,才是真正的数据深渊。就”