【概览】
周日,AI 硬件与软件同时迎来“破局者”:一支仅 24 人的初创团队发布每秒 17 k token 的推理芯片,直指英伟达腹地;学术侧,北航开源动态评测基准 Code2Bench,试图终结代码大模型刷榜内卷。从算力、评测到虚拟人、应用分发,行业正在多条战线同步重塑。
01 | AI芯片性能竞赛
由 AMD 前高管领衔的 24 人“梦之队”今日揭晓首款推理专用芯片,实测每秒可生成 17 000 个 token,功耗与成本均低于同级 GPU。该芯片采用存算一体架构,跳过 HBM 堆叠,直接挑战英伟达在 AI 推理环节的定价权,被视为后摩尔时代算力格局的最大变量。若量产顺利,云厂商与大模型公司将获得新的议价筹码,边缘 AI 生态亦可能借此跳过“GPU 税”。
02 | 代码模型评测革新
刷分时代或将终结。北航联合开源社区发布 Code2Bench,通过“双扩展”机制持续生成全新题库,模型无法提前背答案,迫使算法展现真实编程与泛化能力。该基准已被 ICLR 2026 接收,官方同步开放评测平台,吸引多家大模型厂商排队打榜。动态对抗式评测一旦普及,将重塑社区对“代码 AI”的信任标尺,并倒逼训练数据与策略升级。
03 | 数字分身与UGC新范式
Pika 推出 AI Selves,用户只需自然语言描述性格、记忆与外观,即可在数分钟内“养大”可交互的数字分身,并一键嵌入社交或元宇宙场景。平台同步开放 API,允许主播、品牌方批量生成虚拟员工,显著降低虚拟人制作与运营成本。随着门槛下探,UGC 虚拟内容或迎来爆发,但身份伦理、深度伪造风险亦随之升高。
04 | 学术顶会动态
CVPR 2026 录用结果凌晨放榜,投稿量再破万篇,扩散模型、3D 生成与多模态大模型占据半壁江山。朋友圈刷屏背后,显示计算机视觉仍是产学研资金最密集的赛道。录用论文名单与开源项目预计将在未来一周内集中释放,为工业界提供新一年度的算法路线图。
05 | 应用商店模式争议
Andrej Karpathy 在周末推文断言“App Store 模式已死”,主张未来属于即时生成、即用即走的 Prompt 应用,激起社区两极讨论。支持者认为“提示即服务”将消灭安装包与版本更新,反对者则指出即兴生成缺乏审核、版权与分成机制,难以撼动现有移动生态。争论背后,AI 应用的分发逻辑与商业模型仍待重新定型。
【展望】
当“小团队+专用芯片”撕开算力垄断裂缝,动态评测逼出模型真功夫,AI 生产关系正在被重写。接下来一到两个季度,围绕新芯片的实测数据、Code2Bench 榜单震荡以及数字分身平台的用户增长,将决定这些“变量”能否升级为“新主流”。