OpenAI o1完整版支持20万token超长上下文并新增图像理解,Meta AI推出“先思考后回答”的思维偏好优化,Claude 3.5 Sonnet新增PDF图表理解,NeurIPS 2024发布GTA基准评测大模型复杂任务工具调用,标志着大模型在推理深度、多模态与工具使用上进入新阶段,将直接提升科研、金融、办公等高价值场景落地速度。
Physical Intelligence 3B参数π0模型实现单一模型对7种机器人形态的通用家务控制,Meta发布Sparsh触觉编码器让机器人获得“人类级”灵巧操作,MIT新训练框架简化复杂任务求解,港大LightRAG用图结构提升机器人知识检索效率,显示“通用机器人大脑”正从实验室走向家庭与工厂。
Runway推出高级摄像机控制实现导演级视频生成,ComfyUI-MochiEdit开源支持视频转视频与局部编辑,阿里IC-LoRA让扩散模型具备“情节记忆”实现连续故事生成,DecartAI Oasis模型探索实时AI生成游戏,显示生成式AI正从单帧图片迈向长时序、可交互、可编辑的多模态内容时代。
上海AI Lab VirSci模拟AI科研团队创新力超越AI Scientist,微软AI化学模型9秒生成100种候选化合物登Nature子刊,SymProFold精准预测对称蛋白质组装体助力生物材料设计,诺奖效应下AI正成为基础科研“标配”工具,显著缩短假设生成与实验验证周期。
苹果iOS 18.2即将推送更多Apple Intelligence功能并收购Pixelmator强化图像编辑生态,亚马逊将Alexa生成式升级推迟至2025年,Python因AI热潮首次超越JavaScript成GitHub最热门语言,显示终端厂商与平台方正把AI能力作为下一代操作系统与生态竞争核心。
智谱AI获北京人工智能产业投资基金首投,前小鹏高管千万级融资切入AI陪伴机器人,前Pebble CEO Gabor Cselle加入OpenAI参与秘密项目,商汤被质疑数万亿投资能否回本,显示资本寒冬下头部项目仍获加注,顶尖人才持续向大模型头部公司集中。
研究警告2030年AI将产生数百万吨电子废物,谷歌被曝三年前AI设计芯片论文涉嫌造假面临学术不端诉讼,Meta与谷歌因AI生成内容遭遇新诽谤风险,提醒行业在高速迭代同时需同步建设治理、环保与可信体系。