2026-01-10
AI制药进入“万亿级”筛选时代
清华团队DrugCLIP三连发登上Science,用对比学习实现一天10万亿分子虚拟筛选,速度提升千万倍,可覆盖全基因组2万种蛋白,把“无药可靶”比例从90%降至潜在50%以下,标志着AI制药从单点突破走向系统化工程,将重塑新药研发成本曲线与产业分工。
2025-11-05
超级模型与多模态突破
llama.cpp 实现本地多模态革命,360 FG-CLIP2 拿下 29 项中英双语第一,谷歌 Gemini Nano Banana2 升级图像生成,北大&兔展 Uniworld V2 刷新中文细节 SOTA,扩散语言模型推理效率大幅提升。端侧与云侧同步跨越,多模态能力正成为下一代模型标配。
2025-10-27
开源模型性能里程碑
上海AI Lab 235B开源模型在国际物理奥赛IPhO夺金,击败GPT-5与Grok-4;MiniMax开源M2代码/代理模型,成本仅为竞品8%;月之暗面开源Kimi CLI,命令行+Agent双模切换;美团LongCat-Video开源即SOTA,开源阵营在科学竞赛、编程、视频生成等多任务上首次实现“性能+性价比”双重领先。
2025-10-16
AI编程与开发工具链爆发
阿里Qoder CLI 200毫秒级响应、Anthropic Claude Haiku 4.5以1/3成本对标Sonnet,LangChain公开质疑OpenAI AgentKit过度工程化,显示AI编程助手正走向“极速、低价、极简”新范式,开发者体验与生态话语权争夺白热化。
2025-10-15
多模态大模型产品密集升级
谷歌Gemini 3.0 Pro可一键生成网页版操作系统,Veo3.1视频模型即将上线;阿里Qwen3-VL推出4B/8B轻量版逼近72B性能;字节开源FaceCLIP实现文本驱动高保真人脸生成,显示多模态能力正快速下沉至边缘与消费级应用。
2025-10-08
AI代理操作界面新范式
谷歌Gemini 2.5 Computer Use模型正式落地,让AI像人一样点击、输入、滚动网页,并配套开源《智能体设计模式》与CLI扩展生态,标志“模型即操作员”时代开启,将重塑RPA、办公自动化与开发者工具链。
2025-10-08
零代码全民开发浪潮
谷歌AI编码应用Opal登陆15国,结合Gemini CLI扩展,让非程序员用自然语言生成完整应用,预示“人人都是开发者”的全民零代码时代加速到来。
2025-10-04
Gemini 3.0 编程能力跃升
谷歌即将发布的 Gemini 3.0 Pro 在内测中展现前端与 Web 编码能力飞跃,并率先把 MCP 协议集成到 CLI,开发者可一键调用,大幅降低配置门槛。同时 Nano Banana 开放 API、Gemini in Chrome 全面推送 Workspace,谷歌正围绕“模型+工具+生态”打出组合拳,意图在编程与生产力场景反超 OpenAI。
2025-09-26
AI编程与代码世界模型
Meta开源32B代码世界模型CWM,能自测自修代码;Exa Code发布亿级代码索引终结LLM幻觉;GitHub Copilot CLI让AI进驻终端,编程范式正从“写代码”转向“模型即程序”。
2025-09-04
开发者工具与平台开源
Raycast推Cursor Agent插件、谷歌发布Gemini CLI GitHub Actions、nano banana官方Prompt模板、Step-Audio 2 mini端到端语音模型开源,以及PosterGen一键学术海报等,降低接入门槛,丰富AI工程化工具链,助力个人与企业快速构建AI应用,形成开源+商业混合生态。
2025-09-03
端侧与消费级AI加速落地
苹果开源FastVLM、MobileCLIP2实现85倍速度提升,Liquid AI推出手机视觉语言模型LFM2-VL,字节Seed新注意力机制让长视频生成计算量降85%,端侧算力与模型协同优化进入实用阶段。
2025-08-08
编程工具链拥抱GPT-5
Cursor、Cline、Augment Code等主流AI编程工具第一时间集成GPT-5,并推出CLI、模型选择器等新功能,显著提升开发者体验,预示编码场景将成为大模型率先规模化落地的垂直领域。
2025-08-01
AI 编程与开发者工具升级
Trae 接入 OpenAI o3 进入 AI 代码编辑新阶段;Cline 获 3200 万美元融资推出企业级编程平台;Bolt 举办全球最大黑客松吸引 13 万开发者;阿里、Augment 等发布 CLI 与低代码新工具,AI 正重塑软件研发全链路。
2025-07-07
开发者工具与开源生态
Glass桌面助手、Gemini CLI、字节Trae-Agent、通义WebSailor等开源项目密集发布,覆盖会议记录、IDE、浏览器Agent等多场景,降低AI应用开发门槛,推动社区创新加速。
2025-06-26
编程Agent开源潮
谷歌免费开源Gemini CLI,百万上下文+多模态+MCP一站支持,直接挑战Cursor;迅雷、TRAE等国内工具跟进,“一句话自动下载/编码”成为新标配,AI编程助手进入零门槛时代。
2025-06-02
多模态与评测基准
360开源1200万细粒度图文对数据集FG-CLIP,浙大等发布5700问空间智能评测基准,双双瞄准“模型幻觉”与“空间盲区”,为多模态大模型提供更高阶的试金石。
2025-05-17
统一多模态模型突破
BLIP3-o、混元图像2.0等模型用“先理解后生成”或实时交互,刷新图文双SOTA,端掉VAE,显示扩散+自回归融合路线已成熟,加速视觉内容生产与编辑平民化。
2025-04-29
多模态与生成式创新
Gen-4 References实现实时图像光影混合;英伟达3B参数DAM模型细节描述媲美GPT-4o;360开源FG-CLIP解决细粒度跨模态对齐;Meta TokenShuffle支持2048×2048高分辨率图像生成;Suno V4.5、FASHN v1.5等工具持续升级,多模态生成进入高保真、高分辨率时代。
2025-04-17
AI编程与开发工具爆发
OpenAI开源Codex CLI五小时获5k星,JetBrains发布智能体Junie AI,FastAPI-MCP零配置转MCP服务器, Windsurf拟被30亿美元收购,AI正重塑开发者生产力全链路。