2025-12-10
AI智能体生态成型
谷歌、微软、亚马逊、OpenAI等成立“AI代理行会”并推基金会,智谱开源AutoGLM打响手机Agent安卓时刻,中关村科金发布企业级智能体路线图,Agent从对话走向跨应用自动操作,标志生态标准化与商业化提速。
2025-12-01
终端AI Agent落地
豆包手机助手、阶跃GELab-Zero、Win11 Copilot等把大模型装进手机与PC,实现GUI自动操作、本地任务流闭环,标志“模型即系统”时代到来,硬件厂商、OS厂商话语权重新洗牌。
2025-09-01
国产开源大模型密集上新
美团LongCat、阿里Qwen-Mobile-Agent-v3、上海AI Lab书生·万象3.5、阶跃Step-Audio 2 mini等国产模型一周内集中发布,参数规模与性能对标国际一线,移动端、多模态、语音、GUI自动化全覆盖,标志中国大模型进入“开源井喷”阶段,开发者生态迎来红利。
2025-07-16
AI操作系统与GUI新范式
NeuralOS、MLX-CUDA等成果显示AI正重塑操作系统:用神经网络直接生成界面、预测下一帧,省去传统渲染栈,带来“零代码”人机交互。华人团队开源实现引爆社区,被视为卡帕西预言落地,可能颠覆Windows/macOS生态。
2025-05-14
国产多模态大模型爆发
字节Seed1.5-VL、阶跃Step1X-3D、清华-AgentCPM-GUI 等国产模型集中开源或上线,在 20B 级参数下拿下 38 项 SOTA,覆盖 GUI 代理、3D 生成与中文场景,标志国产大模型进入“小而强”多模态实用阶段。
2025-05-02
GUI智能体与手机AI新范式
浙大联合vivo、港理工分别推出LearnAct与InfiGUI-R1,让手机AI仅一次示范即可学会复杂操作,并具备任务规划与错误反思能力,为移动端Agent落地提供关键技术支撑。
2025-04-13
移动GUI智能体与知识图谱应用
V-Droid验证器驱动架构刷新AndroidWorld任务成功率,移动GUI自动化迈向实用;Nat. Mach. Intell.发布大规模生物医学知识图谱iKraph,为科研提供超人工精度检索。AI正从通用对话下沉到专业操作与知识管理。
2025-02-17
AI+终端场景渗透加速
Apple Intelligence即将登陆Vision Pro,微软开源OmniParser V2让LLM直接操控GUI,国产QQ浏览器、地图、文档纷纷上线AI搜索与生成,显示大模型正从云端向操作系统、可穿戴、移动App纵深渗透,人机交互范式面临重塑。
2025-01-09
AI智能体与操作系统级交互
Aria-UI纯视觉操控手机电脑、OpenAI即将发布“计算机操作智能体”,结合Notebook LM互动播客,显示AI正从问答助手升级为可跨应用执行任务的数字代理,交互范式面临重塑。
2024-11-24
AI Agent 与 GUI 自动化
Claude 可无脚本操控电脑完成《崩坏:星穹铁道》日常任务,北大 ChatExcel 一句话搞定 20 种复杂表格操作,智能体正从“对话”走向“动手”,零样本 GUI 控制成为落地新热点。
2024-11-23
企业级AI智能体生态
微软宣布构建全球最大AI Agent生态,超10万家企业通过Copilot Studio部署自定义智能体,覆盖工作流自动化、客服、咨询等场景;同时“AI玩手机”移动端GUI智能体与车载情感伴侣大模型涌现,AI Agent正从概念走向千行百业生产力工具。
2024-10-26
AI智能体接管终端
Claude 3.5 Sonnet实现「computer use」,智谱AutoGLM完成「phone use」,微软开源OmniParser降低开发门槛,终端智能体从演示走向产品化,预示GUI自动化与人人可造的智能助手时代到来。