2025-09-11
开源模型与推理加速突破
阿联酋K2 Think以320亿参数实现2000 tokens/秒刷新开源速度纪录;月之暗面开源Checkpoint Engine可在20秒内热更新万亿模型;清华提出ReST-RL统一强化学习范式,显著改善LLM推理一致性,开源生态正从“可用”迈向“高效”与“可信”。
2025-07-20
大模型极限压力与鲁棒性研究
清华&上海AI Lab提出REST框架,通过多任务并发输入暴露DeepSeek等模型性能骤降近30%;谷歌DeepMind亦证实GPT-4o在遭遇反对意见时易放弃正确答案,凸显大模型鲁棒性与可信度短板。
2024-09-21
多模态生成大爆发
视频、3D、图像生成进入“秒级高清”时代:可灵 1.5 不加价升级 1080P 并上线运动笔刷,智谱开源 CogVideoX-5B-I2V 图生视频模型,清华团队提出 3D Scaling Law 并发布 VAST 工具,Grok 图像引擎母公司 Black Forest Labs 火速融资 1 亿美元,多模态创作门槛与成本骤降。