第233章 LPU的进展(2/2)
「那种丝滑感,那种降维打击的感觉……真的,我当时在现场,鸡皮疙瘩都起来了。」
「我只能透露一点:这玩意儿不挑食。哪怕是咱们国内那种成熟工艺,也能跑得飞起。」
「时间呢,我不敢保证啊,我估计最快可能半年,慢一点一年左右,应该就能看到商业化产品问世了。当然,都是我猜测啊,猜不准我不负责。」
弹幕瞬间炸了。
【谜语人滚出哥谭!】
【卧槽?真的假的?云飞从来不吹牛逼的啊。】
【成熟工艺?难道是说晶片制程麽?】
【传说中的存算一体?还是光子晶片?】
【别猜了,前几天我看新闻,科技部批了个『新一代认知智能计算架构』的专项,好像就是以SLRM模型为原型开发的。】
评论区里,除了兴奋的吃瓜群众,很快就涌现出了一批画风诡异的帐号。
「笑死,又在吹牛逼了。之前吹光刻机,现在吹LPU,能不能务实一点?」
「承认差距有那麽难吗?人家英伟达几万人的团队搞了几十年,你换个名字就能弯道超车?做梦呢?」
「又是『沸腾体』,能不能别整天遥遥领先了,看着尴尬。」
这些帐号ID大多是一串乱码或者新注册的小号,言辞激烈,逻辑统一,显然是有组织的水军。
他们试图用冷嘲热讽,把这股刚刚燃起的希望之火给浇灭。
毕竟,对于某些势力来说,中国AI的崛起,是他们绝对不愿意看到的噩梦。
……
除了硬体圈的传闻,软体圈也不甘寂寞。
知乎上,一个名为「AI观察者」的大V,也发了一篇长文爆料。
《国产大模型的新赛道?通义丶字节丶月之暗面都在秘密测试新架构!》
文章里写道:
「据内部人士透露,国内几家头部AI大厂,最近都在秘密测试一种非Transformer架构的新模型。据说这种模型在逻辑推理和长文本处理上有着惊人的表现,完全没有『幻觉』问题。」
「该模型据悉仍在非常早期的阶段,但是内部负责人表示在某些小数据集上训练后表现非常好。」
「工程师团队目前据说处在软体等硬体的状况下,因为缺少匹配的硬体,目前还没有办法跑大参数的模型,但是据说这个过程很快会有改进。」
「目前团队的重点还是提效和降本上,其中某个团队的运行成本已经降低了30%,而且还有很大的降本空间。」
「我有幸体验了一个内部测试版的Demo。说实话,生成速度很慢,但是回答的内容非常清晰,几乎没看出有什麽幻觉类的问题。」
「不过目前测试只能限定在一些小的知识范围内,应该也和小模型demo有关。」
「虽然目前的综合能力可能还打不过GPT-4,甚至连GPT-3.5都够呛。毕竟人家发展了八年,咱们这个新架构才搞了几个月,数据量和训练时长都还不够。」
「但这就像是一个刚出生的天才婴儿,虽然现在还不会跑,但你能看到他眼里的光。这是一种全新的可能性!」
文章下面,评论区也是两极分化。
「真的假的?逻辑推理无幻觉?这可是LLM的死穴啊!」
「半成品也好啊!只要路子对了,早晚能追上!」
「得了吧,又是PPT造车。连个能用的产品都没有,就敢吹『新赛道』?等拿出来再说吧。」
「估计又是骗经费的项目。Transformer已经是公认的最优解了,非要另起炉灶,这不是瞎折腾吗?」
……
无论是硬体圈的LPU传闻,还是软体圈的新模型爆料,都像是在平静的湖面上投下了一颗颗石子。
虽然水军在疯狂地泼冷水,虽然公众依然半信半疑,但那种「山雨欲来风满楼」的气息,已经越来越浓烈。
所有人都隐隐感觉到,一场巨大的变革,正在酝酿之中。