2026-05-24

AI算力趋势与基础设施

硅谷投资人预测未来推理将消耗70%算力,仅30%留给训练,标志着AI行业从训练驱动向推理驱动转变;星舰V3首飞成功为下一代算力基础设施提供潜在支撑。算力分配格局的变化将深刻影响AI芯片设计、云计算架构和模型优化策略,推动高效推理技术成为行业焦点。
2026-05-23

大模型基础设施与算力经济

全球AI基础设施投资预计达4万亿美元,算力需求正从训练向推理转移(预计占70%)。DeepSeek等国产大模型通过巨额融资与激进定价策略加速市场渗透,智源大会等学术盛会聚焦下一代模型技术路线。
2026-05-05

生成模型训练与评估突破

USC、CMU、CUHK与OpenAI联合提出FD-loss,首次把沿用十年的图像评估指标FID嵌入训练流程,实现端到端可微优化,显著提升生成质量与稳定性;谷歌同步为Gemini API推出Webhooks,用事件推送替代轮询,降低长任务延迟,利好Deep Research、视频生成等耗时场景。
2026-04-25

视觉大模型一体化革命

谷歌 Vision Banana 以统一生成式预训练刷新 2D/3D 多项 SOTA,何恺明等提出用单模型取代专用网络;ERNIE-Image-Turbo 实现 8 步高速文生图,显示视觉任务正走向通用一体化与极致轻量。
2026-04-11

模型架构与训练范式突破

Meta提出“神经计算机”融合模型即计算环境,字节Seed实现推理时原地改参免重训,北大博士单人构建多Agent开放世界,均指向同一趋势:让模型在推理/执行阶段持续、低成本地自我更新与协同,打破“训练-部署”割裂,迈向终身自主智能。
2026-03-29

大模型物理推理与机器人新范式

视频生成大模型隐式习得物理规律,被首次系统迁移到机器人操控任务,仅用732M参数即超越7B模型,显著降低对人工演示数据的依赖,为“数据困境”提供突破口,标志着“预训练物理先验+小参数策略”成为机器人学的新主流路线。
2026-03-22

具身智能与机器人竞速

国内人形机器人企业突破140家,汽车、手机、电商巨头跨界入局,但机器人大模型成熟度低、高质量训练数据匮乏制约“能走”到“会思考”。谁能率先突破数据与模型瓶颈,将定义下一代具身智能标准。
2026-03-19

AI版权与数据治理风暴

苹果、Meta等巨头因训练数据含盗版书籍与内部AI泄露敏感信息接连被告与自查;ICML一次性拒稿497篇“AI审稿”论文,学术与工业界同步提高数据合规、模型安全与版权门槛,AI治理进入高压周期。
2026-03-15

底层架构与评测革新

哈工深提出模长感知线性注意力,显存直降92.3%;MIT新算法挑战“后训练RL已死”共识;CVPR 2026论文用视觉Token变化量无损加速VLM 1.87倍;arXiv宣布脱离康奈尔独立并招聘CEO,底层算法、评测与知识分发体系同步洗牌。
2026-03-08

多模态与高效推理创新

Yann LeCun、谢赛宁联合强调多模态预训练是后LLM时代主路径;Parallel-Probe破解无效并行,推理提速35.8%;30B参数REDSearcher以低成本实现深度搜索Agent,高效能与多模态并进。
2026-01-20

AI版权诉讼风暴

英伟达被曝主动接触盗版网站安娜档案馆,企图获取500TB电子书训练模型,遭作家集体诉讼。该案成为“AI训练数据是否构成合理使用”的里程碑事件,或重塑全球数据获取规则与模型合规成本。
2026-01-09

端侧与本地AI算力崛起

戴尔推出桌面超级计算机GB10,可在本地跑70亿参数模型;摩尔线程升级SimuMax分布式训练仿真平台,摩尔线程与戴尔共同推动“云-边-端”协同,缓解GPU内存瓶颈,让中小开发者摆脱昂贵云依赖,进入普惠AI时代。
2026-01-08

模型评测与后训练新范式

LMArena以众包盲测获1.5亿美元融资,估值17亿美元;潞晨云8元跑通强化学习全流程,后训练进入“按Token计费”时代。评测即流量入口,低成本RLHF成为新基础设施,降低初创公司追赶门槛。
2025-12-27

Agent成本骤降

浪潮元脑HC1000把推理成本压至1元/百万token,Meta SSR实现零人类数据自我训练,JarvisEvo一句话调用200+修图工具,三箭齐发打通Agent规模化“最后一公里”,商业化临界点提前。
2025-12-16

大模型训练范式革新

CMU、Mamba作者等团队提出“压缩即智能”、无预训练76K小模型登ARC-AGI榜三,OpenAI开源99.9%稀疏模型,挑战堆数据、堆算力传统Scaling Law,揭示推理能力可脱离巨量预训练,为低算力、高可解释新路线奠基。
2025-12-11

多模态大模型竞速

阿里Qwen3-Omni-Flash、谷歌Gemini TTS 2.5、Meta Avocado等全模态/语音/图像模型密集发布,OpenAI GPT-5.2与GPT Image 2同步内测,巨头围绕“实时交互+情绪级语音+太空训练”展开技术军备赛,标志生成式AI进入全感官时代,直接决定2026年模型格局与云边端部署标准。
2025-12-01

Scaling Law遇瓶颈

Ilya公开宣称“单纯堆参数已死”,SemiAnalysis爆料OpenAI两年半未跑出新一代前沿模型,引发行业对“后预训练”范式的集体反思,世界模型、持续学习、数据合成成为新焦点。
2025-11-29

后训练范式革新

中兴通讯AIM团队提出GRPO-only方法,仅用难样本、无需SFT即可在多模态基准上刷新SOTA,为行业提供数据高效、成本低的后训练新范式,降低大模型迭代门槛。
2025-11-27

Scaling时代终结

Ilya Sutskever等顶级研究者连续发声,认为仅靠堆参数、堆算力的“Scaling Law”已撞墙,AI需回归基础科学与新范式。观点引发行业共振,标志大模型竞争从‘暴力美学’转向‘科学探索’,或将重塑研发资源分配与创业逻辑。
2025-11-23

具身智能融资与低成本硬件

蚂蚁投资腾讯系具身智能公司、范浩强凭5000元“丐版硬件”获10亿融资,显示资本对高性价比机器人方案的追捧;同时3D仿真生成技术降低训练门槛,推动具身智能从Demo走向落地。