AI快开门

发现最好的AI工具

2025-06-15

AI原生浏览器变革

Comet、Dia、Fellou、豆包等“Agentic Browser”集中亮相,内置多模态Agent可自主比价、写高考作文、跨网页执行任务,传统浏览器厂商被迫跟进,人机交互入口或迎来新一轮洗牌。
2025-02-26

多模态Agent与机器人

微软开源多模态AI Agent“Magma”可同时操控网页下单与机器人动作,智元发布AgiBot Digital World仿真框架,宇树机器人秀中国功夫,MIT扩散算法突破千帧长视频,AI开始打通数字与物理世界边界。
2024-05-08

端侧与多模态Agent爆发

斯坦福Octopus V3以20亿参数实现端侧多模态Agent,函数调用性能超GPT-4,能耗降95%;亚马逊、苹果M4芯片同步强调本地AI算力。端侧轻量化+多模态交互成为新战场,将加速AI在手机、汽车、机器人等场景落地,重构边缘计算生态。
2024-05-04

国产多模态Agent竞速

在中国AIGC产业峰会上,美图、阿里等厂商强调“大模型+垂直工作流+创意场景”才是国产突围路线,多模态Agent成为落地关键,赛事与峰会同步推动生态繁荣。
2024-02-20

多模态Agent与AIGC应用落地

腾讯AppAgent实现“大模型操作手机App”,Meta Agent可自动剪辑视频,LGM 5秒生成高质量3D资产,中国AIGC产业峰会集中展示商业案例,显示多模态Agent正走出实验室,进入广告、电商、短视频、设计等场景,2024年或迎批量落地潮。
2024-02-13

多模态Agent与自动驾驶评测

CMU发布Web Agent基准,普渡实车验证GPT-4驾驶能力,显示多模态大模型已具备在线决策与实时控制潜力,为自动驾驶、网页交互确立新评测与落地路径。