2026-01-20
AI医疗取证与评测突破
BioticsAI胎儿超声AI获FDA批准,清华联合发布科研智能体系统,蚂蚁阿福上线DeepSearch。从产前筛查到科研辅助,AI医疗进入“可验证、可解释、可落地”阶段,评测标准与证据等级成为新焦点。
2025-10-19
AGI定义与评测标准出炉
Bengio牵头发布《A Definition of AGI》,提出可度量、跨任务、超人类性能的量化框架,当前进度条58%,为行业提供统一坐标系,减少“AGI滥用”争议。
2025-09-01
顶尖模型“降智”翻车引信任危机
Anthropic承认Claude Opus 4.1“白天退化”,OpenAI GPT-5被井字棋考倒,Meta与Scale AI合作破裂,连串事件暴露大模型可靠性短板,用户信任与商业落地风险陡增,行业开始反思评测标准与迭代节奏。
2025-08-16
机器人产业链集结
FAIR plus 2026发布会与多档标准评测亮相,3D生成质量榜单、提示词多样性技巧、宇树机器人“撞人逃逸”事件等,显示硬件-算法-场景全链条正加速标准化与商业化。