CVPR 2024录用率23.6%,英伟达开源BOP榜6D姿态冠军方法,显示视觉算法持续突破。论文量与质量双高,标志学术与工业界对3D感知、生成等方向的高度关注,为自动驾驶、AR/VR等场景提供新基线。
普林斯顿开源SWE-agent,以GPT-4自动修Bug,追平Devin;同时ChatGPT新增“说几个字P图”能力,智能体观测学习数据集EgoExoLearn发布。代码与多模态Agent工具快速成熟,正重塑软件与内容生产流程。
首届中国具身智能大会召开,探讨让大模型“长身体”进入物理环境;跨视角技能学习数据集EgoExoLearn同步发布,为机器人模仿学习提供新资源。学术界与产业界合力推动下一代能与真实世界交互的通用智能体。
“弱智吧”语料被中科院等验证为最佳中文训练数据,8项评测第一;中科大发现大模型无需看图即可答视觉题,提示数据与评测方法仍存巨大优化空间。数据质量与评测公平性成为模型性能提升的关键变量。
马斯克从特斯拉挖角自研大模型,硅谷春招百万美元年薪抢人,谷歌创始人返场当猎头。顶级人才成为模型与芯片战争的核心资源,反映行业进入高强度竞赛阶段,薪资与组织模式持续被重新定义。
“捏Ta”等AIGC捏娃社区爆火,零绘画基础用户可快速生成同人角色,激活二次元创作生态。技术降低创作门槛,助推UGC内容、虚拟形象及周边消费,展现生成式AI在亚文化商业场景的变现潜力。