2025-03-24 AI话题 - AI快开门

多模态大模型技术突破

谷歌Gemini Live上线屏幕共享与实时视频交互，伯克利TULIP、腾讯混元-T1、阿里LHM等视觉-语言-动作模型集中发布，标志着多模态理解与生成交互进入可用阶段，为机器人、自动驾驶、3D内容创作打开新空间。

vivo成立机器人LAB，腾讯领投智元机器人，上海张江发布人形机器人“启程”，CVPR 2025 CrayonRobo、SeeGround等模型让机器人“看见”并操作物体；Browser Use、秒哒等平台降低开发门槛，AI Agent进入规模部署期。

海洋“瀚海智语”、金融Fin-R1、烹饪“食神”、体重管理“减单”、地质GeoMap-Bench等场景大模型相继亮相，显示大模型正从通用对话走向专业深度，结合私有化一体机方案加速在医疗、金融、工业落地。

AMD GAIA、英伟达Cosmos-Transfer1、RF-DETR、AlphaFold-Metainference 等开源工具链降低本地推理与训练成本；蚂蚁集团MoE大模型把训练费用砍至1/3，推动中小企业与个人开发者无障碍使用大模型能力。

欧盟《人工智能法案》重塑全球合规框架，英国部长呼吁勿抵制版权变革，Cloudflare“AI迷宫”反击恶意爬虫，中美官方与智库密集对话，显示政策与伦理议题已与技术迭代同步进入关键窗口期。

最新调研显示AI已可替代双人团队工作量，却同时加剧管理层与员工矛盾；Zoho与OpenAI CEO警告多数程序员岗位或被AI取代，STEM博士创业率因知识爆炸下降38%，提示组织与人才体系需同步变革。