【概览】国产新架构RWKV、LiNo同日斩获融资与论文突破,宣告“后Transformer”元年正式开启;字节跳动Infinity、VAR刷新文生图SOTA,多模态赛道进入“中国并行”阶段。硬件、具身智能、AI4Science与监管同步升温,行业从单一算力竞赛迈向多元技术栈混战。
01 | 非Transformer新架构崛起
RWKV运营主体元始智能拿下数千万天使轮,北大-港理工联合团队发布LiNo框架,在同等算力下长序列任务平均提速28%、显存占用下降40%,性能全面超越Transformer。资本与学术同步押注,标志大模型基础结构进入“多轨竞争”时代,推理芯片、框架层及下游应用将面临新一轮重写。
02 | 国产多模态大模型突破
字节跳动一日连发Infinity自回归文生图模型与VAR视觉自回归框架,在MS-COCO FID指标上首次将扩散模型拉下王座;北大空间智能模型单图生成3D代码登顶AAAI 2025。国产多模态完成从“跟随”到“并行领跑”的跨越,为AIGC、元宇宙及机器人导航提供核心引擎。
03 | AI PC与端侧硬件混战
英伟达GB300 AI服务器拟二季度上市,水冷散热订单已锁定台积电与奇鋐;微软“迷你AI PC”曝光,搭载自研Maia芯片。黑芝麻车规级芯片成功部署通义千问7B模型,边缘端跑大模型进入车规量产阶段,消费电子与汽车电子供应链同步重写。
04 | 具身智能与机器人展望
云深处发布工业级具身智能方案,昆仑万维创始人周亚辉预测“2030机器人保有量超10亿台,社会财富分配逻辑被重塑”。头部资本已把人形机器人视为“下一个新能源赛道”,硬件、数据集及安全法规全链投资窗口打开。
05 | 模型参数泄密与Scaling瓶颈
微软官方论文意外披露GPT-4o仅200B、o1约300B参数,远低于业界猜测,引爆“Scaling Law撞墙”大讨论。CMU与DeepMind提出自生成记忆机制,在数据枯竭场景下仍可维持指数级性能提升,预示大模型训练从“堆参数”转向“效率工程”。
06 | AI安全与监管收紧
加州新法案将深度伪造刑责最高提至5年监禁;音乐出版商与Anthropic签署首份版权保护协议,要求Claude系列模型实时过滤受保护歌词;苹果因Siri窃听赔偿9500万美元。监管从“倡议”升级为“可执行法律”,合规成本将成为模型落地前置条件。
07 | AI for Science与垂直模型
AlphaFold2获诺奖效应持续发酵,SynAsk化学大语言模型对外开放API,坦索罗辛老药AI重定位进入临床II期。大模型正从通用对话下沉至“垂直科学计算”,新药、新材料研发周期有望再缩短30%-50%。
【展望】当Transformer不再唯一、参数规模不再神秘,AI竞争主线快速转向“架构效率×场景深耕×合规能力”。2025年,谁能把新架构装进车规芯片、谁能把多模态模型变成工业臂上的“眼睛”,谁就能在下一轮洗牌中占据先手。