第261章 新春座谈会 一(2/2)
招待所的走廊里铺着厚厚的红地毯,踩上去悄无声息。会议室的门窗都经过了特殊的电磁屏蔽处理,白瓷盖碗里的茶水冒着热气,空气中透着一种只有在权力核心圈才能感受到的丶粘稠而严肃的压力。
徐辰在座位上坐定,环顾了一下四周。
坐在左手边的,是中科院自动化所的潘院士,国内模式识别的泰斗;旁边是清华交叉信息研究院的几位大牛。而坐在对面的,则是产业界的技术大牛,比如华为海思的首席架构师丶字节跳动的AI负责人……
其中,徐辰看到了一个熟悉的名字:梁文锋。
不同于那些传统的CEO,梁文锋在圈内,被公认为极少数能从底层数学逻辑一路杀到万亿参数工程落地的「技术统帅」。
就在2025年初,那篇震惊全球丶让矽谷巨头集体失眠的《DeepSeek-R1:通过强化学习激励大模型的推理能力》横空出世。梁文锋不仅是DeepSeek的创始人,更是该论文的核心作者与通讯作者。
因此,梁文锋作为技术顾问出现在这里,倒也并不奇怪。
……
主持会议的是科技部高新司的司长。他看向徐辰,语气温和却透着审视:「徐辰同志,明天的正式会议,部领导会重点询问SLRM架构对Transformer的替代可行性。几位专家对此还有些保留意见,咱们现在先『内部消化』一下。」
随后,几位来自中科院和头部大厂的专家轮流发言。
徐辰敏锐地察觉到,这些大佬的发言非常有意思。他们并没有像在学术期刊上那样大谈算法优劣,而是更多地讨论「生态迁移成本」和「算力利用率」。
主流的声音是「谨慎乐观」。
在华国的决策语境里,「谨慎乐观」是一个很有深意的词。它代表着:方向是对的,但困难是巨大的,如果出了问题,是因为「谨慎」得不够;如果成功了,是因为「乐观」得有理。
徐辰作为SLRM的提出者,自然是「积极乐观派」。
但他心里清楚,SLRM是系统出品,其底层逻辑的超前性无法用目前的工程经验来解释。他拿不出那种特别扎实的证据,因此在面对专家们关于「大规模并行训练稳定性」的质疑时,他表现得异常沉稳。
他没有做过多的发散,只是针对专家们担心的几个数学层面的问题,进行了简短而精准的回答。
……
会议进行了整整两个小时,最终形成了一份初步的结论报告。
司长清了清嗓子,缓缓说道:
「关于本次技术预演的结论,我们初步拟定为以下四个维度,大家听一下,看是否准确。」
「第一,在战略定位上,会议一致认为:SLRM架构不仅是技术层面的『局部创新』,更是具备『范式变革』潜力的原创性路径。它是我们实现算力底座『全栈自研』丶打破路径依赖的关键抓手。对此,我们要保持『战略定力』,坚持『适度超前』的布局原则。」
「第二,在技术评估上,专家组初步达成共识:SLRM在逻辑推理深度与能效比表现上,相较于传统Transformer架构具备『代差级优势』。虽然在大规模工程化落地方面仍存在『阶段性挑战』,但其底层数学逻辑严密,具备『跑通全流程的充分必要条件』。」
「第三,在实施路径上,建议采取『双轨并行丶增量替代丶试点先行』的稳健策略。不搞『一刀切』的推倒重来,而是在特定垂直领域开展『先导性应用』,在实战中完成生态的『叠代演进』。」
「第四,在资源保障上,部里将协调相关职能部门,通过『揭榜挂帅』丶『专项资金』等形式,引导社会资本与科研力量向该领域『高强度集聚』。同时,要建立『容错机制』,鼓励颠覆性创新。」
徐辰前几条听得似懂非懂,能明白大概要做什麽事,但也感叹这种官场人士精炼的语言表达能力。
不过最后一条徐辰还是听明白了。
容错机制翻译过来就是——钱管够,人管够,万一搞砸了,只要你是真在搞创新,上面不追责。
……