岑言端着一杯热牛奶坐到电脑前。
果不其然,邮箱里躺着两份极其详尽的优化方案。
利昂把动态遮罩机制和底层显存管理做到了极致,代码干净利落,运行效率极高。
卢卡斯用的是矩阵拆分法,把原本庞大的注意力权重矩阵拆解计算,从理论根源上避免了内存溢出的风险。
岑言喝了口牛奶,把两份方案同时下载到本地。
你真以为我会在里面二选一?
小孩子才做决定,大人从来不做选择,我全都要!
最近这一段时间的深入研究。
也让岑言更加清楚,如何将不同的优势融会贯通。
眼前这两份方案就是最好的例子。
岑言信心满满的动起手来,他把卢卡斯的矩阵拆分算法作为核心理论层,套进利昂写好的高效率底层算子中。
两者的结合得堪称完美。
原本容易在长文本训练时导致显存爆炸的痛点,被这套组合拳轻松化解。
前馈网络层、残差连接、层归一化机制,这些组件被岑言熟练地拼装在一起。
不过本质上也是因为利昂和卢卡斯本身就是后来合作的同事。
这样的思路并非无迹可循。
甚至本身在岑言的记忆图书馆里,就有相关的记录和方案路线。
只不过他现在不再那么依赖照搬。
而是在里面增加了自己有限的理解。
增加理解这种事,不是随便加的。
戏说不是胡说,增加不是乱加。
是要切切实实地建立于对这个项目的理解,来扩展的方向。
岑言早就不是那个只会Ctrl C加V的选手,他也在这种过程中快速进化。
等到中午十二点。
他敲下最后一行回车键。
Transformer架构的基础工程化模块,over。
这套代码现在虽然还只是个没有喂过任何数据的基础骨架,但它的底层逻辑已经可以基本跑通。
按照原本的历史轨迹,谷歌团队要摸索出这套相对完整的基础工程框架,至少还需要大半年的时间。
岑言以两肩为支点,把背紧紧地抵在椅子上,长吐出一口浊气。
基础架构的研发进度比他预期的计划提前了很久。
甚至两位工程师人都还没来,就完成了。
按照这种工作量的计算。
他们俩可能现在根本就没干谷歌那边的活,那也算是谷歌的薪水小偷了。
用谷歌的钱,养我的人。
嘿嘿嘿。
岑言忍不住笑了。
接下来,只要等算力集群一搭建完毕,马上就能启动基础并行训练。
之后再逐步进行架构优化。
胜利简直唾手可得。
下午两点。
周志云又来晨星实验室溜达了。
不过他此时满面红光,走到岑言桌前,把自己带来的文件袋拍在桌面上。
“搞定了。”
岑言眨了眨眼,抽出文件看了眼。
这是京海交大和李政道研究所的场地共建协议。
文件上明确标注,李所南楼扩建的一整层三千两百平米空间,将作为晨星实验室的专属科研基地。
“吴淡办事效率挺高,今天上午刚开完专项会议,下午就把协议弄出来了。”
周志云笑嘻嘻的。
他现在过来可不是算力集群的事,而是沃德科技的事。
没有任何意外,本身晨星实验室,他们就做的挺好的。
这一次要搬过去李所,岑言自然也把实验室的装修方案委托给了沃德科技。
这也是吴淡给的权利。
薅的是李所的钱,弄的是自己的设备,这不得全都上好的?
“定制化装修的方案也敲定了,防震台、超净间、微纳加工区的图纸全按照你们的需求走,尺寸是全尺寸,李所下面还有超大型设备,完全够你们用了,而且,吴淡还立了军令状,三个月内必须交付使用。”
岑言把协议很是宝贝地仔细收好,这可是他们晨星以后安身立命的本钱。
“张江那边的算力中心呢?”
岑言问道。
“也妥了。”
周志云压低声音,语气里透着兴奋。
“供电局那边批了220kV的专线接入,施工队明天就进场排线,电费按工业用电,甚至闲时电费都能给你干到负的,这也是市政府的支持,不过,最重要的是,第一批海外仓的P100显卡,昨天半夜已经完成海关清关手续了。”
岑言眼睛一亮。
“这么快?”
“嘘,托了关系走的加急通道。”
嘴上比着嘘,实则脸色得意。
周志云小声地说道。
“显卡预计一周能运到张江算力中心,服务器架子和散热系统,我都找人弄好了,卡一到就能直接插拔上线。”
周志云停顿了一下,神色变得严肃起来。
“不过,岑言,咱们动作还得再快点。我托国外的朋友打听了一下,谷歌DeepMind那边最近动作频频。他们好像也察觉到了循环神经网络的瓶颈,内部已经立项,开始搞同类型注意力架构竞品研发。”
岑言收敛了笑意。
大厂的嗅觉向来敏锐。
果然能在17年年初就拿出成果,这个时候他们一定会有准备。
一旦他们把海量的资源和人力砸进去,推进速度会非常可怕。
事实也是如此,短短一年就完成变革。
“我明白了,过段我让妍姐他们把核心专利和底层逻辑的软著开始逐步申请注册。先占住坑位,他们就算研发出来,也绕不开我们的底层专利墙。”
周志云点点头,又提醒道。
“国内可能麻烦一些,毕竟纯算法和抽象思维的非专利法意义技术方案,不一定能被专利局认可,但美国、欧洲和日本那边动作要快,保护好核心架构。”
“好,那我先去通知一下。”
岑言颔首道。
片刻后,收到了岑言通知的各研究员和核心成员都赶到了晨星实验室。
岑言站在工位边,看了眼人,齐了。
这才面带笑容地开口道。
“现在给大家通报两件喜事。”
“第一件事,我们的AI算力中心场地已经落实,就在张江。”
“初期是百张级的GPU集群,都是我们实验室的资产,做理论计算能去用,到时候云平台也能挪过去。”
李智和郑宇对视一眼,两人的脸上写满了震撼和喜色。
这算力规模,绝对算得上是土豪配置了吧?
而且听主任的意思,这还只是第一批。
咱们子弹这么富裕的吗?
“第二件喜事。”
岑言加重了语气。
“我们和李政道研究所正式签署协议,三个月后,我们将彻底搬离这里。”
“下周开始就先搬到建成的北楼临时办公,方便后面装修完毕直接入驻。”
“李所南楼整层三千两百平米的空间,将成为我们晨星实验室的新家,到时候你们就都有各自的专属工位了,研究员们也能有自己的独立办公室。”
大家沉默一秒,猛然对视。
似乎是在确定自己有没有听错。
500平升级到3200平吗?
那非常有生活了。
毫无意外。
一阵欢呼声掀翻了实验室的天花板。
鸟枪换炮,谁会不爽?
岑言双手往下压了压,示意大家安静。
“场地和算力都有了,接下来的任务会非常重。”
“我把近期的核心任务拆分成三块,各小组负责人认领一下。”
岑言看向周妍。
“妍姐,新实验室的功能区规划和过渡期的设备搬迁工作,由你全权统筹。我们要把不必要的旧设备淘汰,提前列出新场地的采购清单,过渡期我们的所有实验不能停,时间一到也必须做到拎包入驻无缝衔接。”
周妍点头应下,马上在笔记本上记录下重点。
大管家的角色,她当得那叫一个得心应手。
岑言转头看向李智。