我万万没有想到,在西方沉浸于圣诞假期并且疯狂“过年”之际,我们中国企业给他们放了一个新年二踢脚,把他们的脑瓜子崩得嗡嗡响。之前有宇树科技的机器狗视频,让大家惊呼不需要波士顿动力了。紧接着又出现了一个国产大模型,甚至有一些做空英伟达的意味。具体是什么情况,我们给你讲清楚。前几天,最新版本 V3 刚刚公布。需注意,与大洋彼岸那个自称 Open 但却越来越 Close 的公司产品不一样,这个 V3 是开源的。开源并非他最重要的标签。-V3(以下简称 V3)兼具了诸多特点,其一性能处于国际一流水平;其二技术力极为强大;其三价格击穿地心。这一系列特点组合起来,让业内大模型厂商们都有些晕头转向。V3 一经发布,创始成员们直接兴奋起来,甚至发出了灵魂之问,难道大模型们真的压根就不需要大规模显卡集群?我觉得老黄看到这头皮可能会发麻吧。Meta 的 AI 技术官称其成果很伟大。知名 AI 评测博主 Tim 直接夸赞,说其处理很优雅。在这些技术人员看着 V3 的成绩送去赞扬时,也有一些人着急了。
奥特曼在那里说,复制是比较简单的啦,这很容易让人觉得他在有所暗示。更有意味的是,能够做到这些的公司既不是大型的工厂,也不是纯正的 AI 厂商。这家公司的中文名字叫深度求索,他们原本与 AI 没有任何关联。在大模型迅速走红之前,他们实际上是私募机构幻方量化的一个团队。深度求索能够实现弯道超车,其中既有一定的必然性,也似乎带有一些运气的成分。2019 年时,幻方就投入 2 亿元构建了自研的深度学习训练平台“萤火虫一号”。到了 2021 年,它已经拥有了足足 1 万丈英伟达 A100 显卡的算力储备。要明白,在这个时候大模型还没有火爆起来,万卡集群的概念更是尚未出现。幻方凭借这部分硬件储备拿到了 AI 大模型的入场券,最终卷出了现在的 V3 。一个好好的量化投资领域的大厂,跑来搞 AI 是为何呢?深度求索的 CEO 梁文锋在接受采访时给大家聊过,并非看中 AI 前景。他们认为,“通用人工智能或许是下一个极为困难的事情之一”。在他们看来,“这是一个关于如何去做的问题,而非为什么去做的问题”。正是凭借着这种“勇往直前”的劲头,他们深入求索才造就了此次的大新闻,接下来给大家详细讲讲 V3 有哪些特别之处。
是不是有那种隔壁比亚迪推出 998 价格产品,却依然能让财报呈现盈利状态的感觉呢?不过对于我们这些普通用户而言,似乎这方面有点偏门了。因为他们的强项主要集中在推理、数学以及代码等方向,而在多模态和一些娱乐化的领域,并不是他们的优势所在。并且当下,尽管他们声称自己还是在盈利的,但他们团队整体都带有一种极客的气息,所以他们的商业化进程相较于其他厂商来说就显得有些薄弱了。但不管怎样, 的成功证明了在 AI 这个赛道存在着更多的可能性。以往的理解是,若想玩转 AI,后面没有金主爸爸砸钱买显卡,根本就无法玩转。然而现在看来,掌握了算力并不一定就掌握了一切。我们期待未来,期待更多的优化出现,这样更多的小公司和初创企业就能进入 AI 领域。差评君总觉得,那才是真正的 AI 浪潮。撰文:八戒,美编:焕妍。