2025-10-05
蛋白质语言模型可解释突破
InterPLM利用稀疏自编码器从ESM-2表示中提取数万个人类可读特征,首次揭示PLM以“叠加”方式编码结合位点、结构基序等概念,为药物设计提供可解释基石。
2025-09-07
万亿级模型争霸
阿里Qwen3-Max与OpenAI GPT-5 Pro相继亮相,参数规模突破万亿,编码、推理刷新SOTA,标志大模型进入“10倍速”迭代期,直接重塑全球AI性能天花板与商业落地节奏。
2025-09-07
AI Coding 范式迭代
从Vibe Coding到CLI Agent,Cursor估值百亿、Windsurf淡出,Karpathy点赞GPT-5编码10分钟完赛,显示AI编程正从“辅助写代码”升级为“自主完成工程任务”,重塑开发者工作流。
2025-06-29
长视频理解技术进展
HoPE混合位置编码方法显著提升视觉-语言模型在长视频上的长度泛化能力,为安防、教育、直播等场景的大模型落地扫清关键障碍。
2025-06-14
AI编程工具进化
OpenAI Codex团队透露正从“补全”走向“异步自主Agent”,红杉专访称“程序员将不再写代码”;谷歌Gemini Code Assist集成Gemini 2.5,支持个性化规则与长上下文管理,AI编程竞争进入深水区。
2025-06-02
中文AI原生创新
哈工大在ACL以手写传感器让AI“写”懂汉字字形获评审最高分,阿里通义开源MaskSearch框架让小模型在开放问答上媲美大模型,中文社区从“追跑”转向“定义标准”。
2025-05-23
Claude 4 最强编码模型
Anthropic 发布 Claude 4 系列,连续 7 小时无中断编码刷新行业纪录,被 GitHub 选为 Copilot 新底层模型,编程与推理能力全面超越 Gemini 2.5 Pro,标志大模型进入“长时自主编码”时代。
2025-05-03
AI+科学计算纵深发展
清华与微软在药物设计领域提出“活性悬崖感知”强化学习,约翰霍普金斯团队用掩码语言模型解析蛋白编码上下文,两项研究共同展示AI对高价值科学数据的精细建模能力,有望缩短新药与蛋白工程研发周期。
2025-04-20
推理模型可解释性突破
Goodfire开源基于DeepSeek-R1的稀疏自编码器,首次把推理模型“黑箱”拆解为可观测特征,为幻觉、对齐、安全研究提供显微镜级工具;伯克利同期发现推理链可跳过仍保精度,双重冲击将重塑模型训练与评测范式。
2025-04-15
GPT-4.1系列模型发布
OpenAI正式推出GPT-4.1/4.1-mini/4.1-nano,上下文长度统一扩展到1M tokens,编码与多模态能力全面超越GPT-4o,价格更低,已被Cursor、Windsurf等主流工具第一时间集成,并配套发布官方提示工程指南,标志着大模型进入“长上下文+高性价比”新阶段。
2025-03-09
模型架构与视觉基础模型创新
英伟达提出Mamba-Transformer混合视觉骨干MambaVision,在精度与吞吐双破SOTA;港大&伯克利发布SimDINO系列,用编码率正则化简化DINO训练,为视觉-语言模型提供更高效编码器。
2025-01-14
AI编程与自动化威胁开发者岗位
扎克伯格、Meta及OpenAI接连释放“AI将替代中级程序员”信号,新言意码、Refly等AI编程工具获大额融资,微软CoreAI部门成立,标志着AI编码从辅助走向自主,软件工程师职业面临结构性冲击。
2024-06-22
Claude 3.5 Sonnet 刷新 SOTA
Anthropic 发布 Claude 3.5 Sonnet,在多项基准上全面超越 GPT-4o,编码速度提升 10 倍并新增 Artifacts 交互,价格更低,被业内视为大模型性能与性价比的新标杆,直接搅动闭源模型竞争格局。
2024-06-07
AI可解释性与安全对齐进展
OpenAI联合Ilya发布GPT-4稀疏自编码器,提取1600万可解释特征;复旦郑骁庆团队用表征工程实现攻击防御与人类偏好对齐,显示大模型“黑盒”正被逐步打开,为AI安全、合规及监管提供关键技术支撑。
2024-01-29
模型训练与数据工程
UIUC团队综述代码数据对LLM的三大增益;范畴论课程尝试为机器学习奠定数学基础;何恺明-谢赛宁解构扩散模型回归经典去噪自编码器。研究从数据配方、数学原理到模型架构多维优化,为大模型持续 scaling 提供理论与工程支撑。