国产 AI 六虎中阶跃星辰出手:这是从哪里冒出来的大模型公司
时间:2026-01-04 18:01:53 出处:知识阅读(143)
好好的国产公司,本以为 OpenAI 直播已经是虎中 24 年 AI 领域结束,没想到会有高手,阶跃国内 AI 圈子里又传出了一个大新闻。星辰
就在几天前,出手从里国产 AI 六虎中的冒出模型阶跃星,获得了数亿美元的国产公司融资。
更值得一提的虎中是,这一轮融资的阶跃背景并不简单,差评君也从投资者那里找到了上海国有资产的星辰身影。

你知道,出手从里就在几天前,冒出模型北京国有资产也在六虎中投资了另一个智谱。国产公司
两个超级城市,虎中一南一北,阶跃各自赌博,都上了赌桌。
有一个说一,前段时间过去了 “ 百模大战 ” , AI 其实融资圈有些降温,结果这次两大国资先后出手:
这一波,难道不是大模型版的沪爷吗? VS 京爷?

尽管如此,估计有网友还是对的 “ 阶跃星辰 ” 这个名字有点奇怪, “ 这是从哪里冒出来的大模型公司? ”
但事实上,在圈内,阶跃星辰早已小有名气,但也不怪大家没听说过,主要企业确实比较低调。
与其他人工智能相比 初创公司,阶跃是六小虎中最后一次出现,但在出现时,已经是独角兽了。
如果要用一句话来形容,差评君能想到的就是 “ 低调、神秘、强大,国有资产背景大牛多 ” ,是国产 AI 里面有一匹黑马。

不仅在首秀中,阶跃星辰拿出一个对标 GPT-4 万亿参数模型,以速度快、效率高为主, 10 它将在一个月内发布 11 模型,而且在 16 一个月内,从理解到生成的全系列模型矩阵被捣乱。
虽然人真的很有实力,但我们这次的重点并不是纯粹的谈论这个。
差评君认为,通过拿阶跃星融资,还是有很多有趣的。 AI 圈内故事,可以和大家聊聊。

首先,不可否认的是,大模型领域实际上已经缩小了决赛圈。
差评君也和圈内很多人聊了聊,发现大家基本都是从两点来判断这家公司是否有能吃鸡的冠军阶段。
一是有没有牛逼的人才,二是能否坚持投资技术研发 AGI 。

我们先来谈谈人才,事实上,大模型的人才圈,可能比差评君的朋友圈还小。
以今年诺贝尔奖得主乔弗里辛顿为例。他深度学习之父的实验室一直是各大公司眼中的顶级宗门。
像什么 OpenAI 联合创始人伊利亚是他的医生;谷歌 DeepMind 阿列克谢是他的博士后;
Meta 人工智能负责人杨立昆也是他的弟子;前百度首席科学家吴恩达也与他有着千丝万缕的关系。

在中国,被北京国资选中的智谱 AI ,其实也是学术上的大宗门背景,直接来自 27 清华大学知识工程实验室,年人工智能研究历史。
因此,是否有这些强大的人才,往往是行业认可公司的原因之一,有时甚至邀请这些圈牛,比花钱买显卡做计算更重要。

不久前,差评君与一位大型模型一线技术人员进行了交谈。他以不久前阿里通义大型模型技术负责人周畅的高薪新闻为例,告诉差评君,圈内人才短缺。
他觉得传闻中的费用 8 挖人的位数薪资操作是可以理解的。
因为大型训练的成本总是几千万,而合适的人才,能少走很多弯路,反而是最经济的操作。

而这个阶跃星,差评认为它能被资本看好,也离不开人才。。。
但与学院派京爷智谱不同,沪爷阶跃在这方面也很有特色,业内很多人都是老人。
他们中的许多研究人员从博士学位开始从事相关领域,然后在大工厂工作,亲身体验过去 10 年 AI 前沿发展。
比如星星的阶跃创始人、CEO 姜大昕,这个哥们曾经是微软前全球副总裁,日活数亿,深受朋友们的喜爱 Bing 搜索,世界上最早的智能个人助理 Cortana ,都是他参与过的项目。
这么说吧,他把深度学习技术应用到了 Bing 上,帮助 Bing 向世界扩展搜索服务 200 许多国家和地区。

除了CEO ,首席科学家张祥雨在这个圈子里也很有名。
这位哥哥原本是西交和微软亚洲研究院的博士生,师从孙剑和何恺明,还是开山大弟子。
但这不是重点,重点是在博士学位期间,他们的四个大师完成了——引用数十万次,本世纪最热门的深度学习著名论文—— ResNet ( 残差学习 ),而张祥雨则负责底层框架和编码。

有些朋友可能不明白这一点 ResNet ,没关系,重点只是一句话,本文的核心思想残差网络对现代深度学习影响很大。
当年打败了八冠王捷豹。 AlphaGo 系列,就用了 ResNet 技术;现在 Transformer 网络( GPT 里那个 T )残差网络也用在里面。
除此之外,张祥雨在其他技术上也很牛逼,这里就不细说了。就说苹果吧 3D 人脸解锁,也就是 FaceID ,其实也是受他的影响 ShuffleNet 只有技术影响才出来。。。
总之,这个 2023 年 4 月才成立的团队,最迟出现在六虎中,但人才的实力一点也不虚。从这个角度来看,能够获得魔都的投资并不奇怪。

但另一方面,除人才外,大模型厂商路线的选择也越来越受到重视。
而 AGI 事实上,基座模型的方向也是技术理想主义者最兴奋的方向,也是大多数企业家进入大模型领域的初衷。

换句话说,大型基础模型是基础的一层。只有当基础坚实,模型的基本能力逐渐提高时,才有可能在未来创建一个能够真正理解世界的通用模型,并应用于各种场景来改变人们的生活。
像是 OpenAI 、 Google 、 Anthropic 、 Meta ,还有国内的智谱、阶跃等,属于这一派,坚持推出各种 AI 在应用的同时,基座大模型的探索还在越走越远。

然而,正如开头所说,整个 AI 事实上,该领域有一些降温。
由于成本压力,许多初创企业逐渐搁置了基座大模型的研究和探索,把重心放在 AI 应用上。
要么转向垂直行业轨道,要么简单地从事 toC 生意要赚钱,毕竟要活着才能实现理想。

而在 2024 2000年,中国仍在不断更新基座模型,并在公开场合重申 AGI 智谱和阶跃星辰是公司最终目标的典型代表。
几个月前,差评编辑部跟随智谱 CEO 张鹏谈过。张鹏说:我们的目标是 AGI ,每一个问题的突破都有可能带来飞跃式发展。

也包括阶跃星辰,创始人姜大新曾说过,高昂的训练成本确实是一个挑战。有人调侃 “ 说卡伤感情,没卡没感情,用卡费脑筋 ” ,但如果追求的目标是 AGI 如果你付出更多,你仍然需要坚持下去。
姜大昕为阶跃星设计的技术路线分为 “ 单模态 - 多模态 - 多模理解和生成 - 世界模型 -AGI” ,共有五个步骤。
这也可能是大型模型系列被命名为阶跃的原因 Step 五步成诗的原因。
到目前为止,阶跃星已经走出了两步。

阶跃的第一步是万亿参数大模型 Step-2 ,上个月它爆炸了。
在图灵奖得主杨立昆亲自推动的权威名单中,有 “ 世界上最难的大型模型评估 ” 之称的 LiveBench 上,Step-2 在中国获得第一名和第五名,成为唯⼀进⼊前⼗中文语⾔⼤模型。
2024-11-19

而阶跃的 “ 第二步 ”Step-1V 走路也不错。
拿⼤模型竞技场 Chatbot Arena 根据数据,这个竞技场网站上的网友可以尝试所有的大模型,然后给它们打分,今年 11 ⽉的榜单里 Step-1V 总分已经达到 Gemini1.5 的水平。
除此之外,在 C 该公司在终端应用上也制作了一些出圈产品,比如跳问,专注于拍照识别 app 。
他家的跃问拍照问题,也是最早接入的 iPhone 16 国内大型模型功能由相机控制。

另外,一上线就迅速冲上去 App Store 前三名的食物胃书采用阶跃多模态大模型;
今年在圈内爆红的AI 基于阶跃模型的能力,还开发了一款小游戏作为父亲和灵魂提取器。
像界面财联社这样的金融垂直专业媒体也做过阶跃 AI 合作。

但归根结底,阶跃星给人最深的感觉,还是低调有实力,坚持下去 AGI 初心这两点。
这可能是上海国有资产选择它的另一个原因。
最后,差评君觉得是 AI 该领域逐渐降温 2024 年底,智谱和阶跃星先后获得了国家队的投资,这是国内的 AI 这个行业也是一个重要的信号。
一方面,这意味着行业的方向已经开始逐渐清晰,顶级国家队也希望尽快看到 AGI 。
另外一方面,这也可以说是拉开了国内大模式下半场的序幕:
本文来源:差评