EMO - AI话题 - AI快开门

2026-07-17

大模型开源与数据基建

开源大模型与高质量数据集竞争白热化。月之暗面发布2.8万亿参数Kimi K3，登顶全球开源模型规模；NVIDIA推出Nemotron 3 Embed系列及超10T tokens数据集；Thinking Machines开源9750亿参数Inkling。GPT-5.6在IQ测试中首破130“天才线”，扩散语言模型后门威胁引发关注，显示模型能力与安全研究同步深化。

2026-04-03

智能体记忆与协作突破

腾讯云“龙虾”Agent Memory、Cursor3统一工作区、TRAE SOLO多角色协同上线，解决大模型“易失忆”与跨仓库协作难题；Anthropic秘密测试“永久在线”Conway，AI首次实现常驻设备主动代理。智能体从单点工具进化为持续协作伙伴。

Agent Memory Cursor3 Conway 智能体协作

2025-10-07

记忆与Agent基础设施

Supermemory获260万美元融资，打造通用AI记忆API，让任何Agent具备跨会话长期记忆；综述指出大模型缺乏行动能力，Agentic强化学习成为补齐短板的新方向。记忆层与Agent框架的完善，为构建可持续学习、可商业落地的智能体提供基础设施，吸引资本与研究者加速布局。

AI记忆 Supermemory Agentic RL 基础设施融资

2025-09-21

AI认知机制与系统科学

北师大《系统科学前沿》课程与产业界“上下文工程→AI Memory”实践呼应，揭示AI记忆-认知架构正在模仿人类意识结构；复杂系统理论与现象学视角为下一代具备自我反思能力的AI提供跨学科底座。

AI Memory 系统科学复杂系统认知拟合现象学

2025-08-27

超高效推理与架构革新

NVIDIA Jet-Nemotron、谷歌Gemini 2.5 Flash Image、华为云384超节点等集中发布，通过FP4/FP8混合精度、后NAS架构、超节点Scale-Up把推理成本砍90%以上，吞吐提升数十倍，标志大模型进入“低价高并发”时代，将直接重塑云厂商定价、AI应用商业模式与边缘部署格局。

推理优化成本骤降超节点 FP4 Jet-Nemotron

2025-08-20

小模型与边缘AI崛起

英伟达开源9B Nemotron Nano v2，速度超Qwen3六倍，专为手表/车载等边缘端优化；康奈尔推出“微波大脑”芯片，176毫瓦实现75%推理准确率。边缘AI在成本、功耗、隐私侧优势凸显，预示“大模型上云、小模型落地”的混合部署时代加速到来。

小模型 Nemotron Nano 边缘AI 微波芯片低功耗

2025-07-21

顶级模型与推理突破

OpenAI、英伟达、谷歌等密集发布新一代大模型：GPT-5数学能力升级、神秘IMO金牌模型刷新奥数纪录，英伟达开源OpenReasoning-Nemotron登顶推理榜，标志通用推理与科学计算进入新阶段，将重塑科研、教育及高端开发工具链。

GPT-5 IMO金牌模型 OpenReasoning-Nemotron 推理突破科学计算

2025-06-05

开源生态全面突围

清华、华为、智源、日本Shisa等相继开源超长视频、MoE训练优化、数学证明及日语大模型，叠加NVIDIA Llama-Nemotron系列，开源模型在性能、效率、多模态上正面抗衡闭源，全球AI创新重心向开源倾斜。

开源模型 Video-XL-2 Shisa V2 Llama-Nemotron 华为MoE

2025-05-16

超长记忆与上下文协议

Supermemory、OpenMemory MCP 等工具打破模型“健忘”与工具孤岛，实现跨会话、跨应用的长久记忆共享；MCP 协议开源生态快速壮大，为 AI 工作流奠定统一上下文基础，被视为个人与开发者效率的下一跳。

长期记忆 MCP协议上下文共享 Supermemory OpenMemory

2024-11-21

AI for Science与生物计算突破

AlphaQubit解码量子错误、BioNeMo加速药物发现、PIONEER预测蛋白互作，显示生成式AI正成为基础科研与生物制药的核心工具，撬动万亿级研发效率革命。

AI4Science AlphaQubit BioNeMo 蛋白质预测量子纠错

2024-10-02

OpenAI生态更新与开发者日

OpenAI在第二届开发者大会发布实时API语音合作名单（Agora、Twilio等），奥特曼暗示下一代模型o2将比o1更强大；同时EMOVA推出类GPT-4o多模态助手，显示OpenAI生态持续扩张但热度不及预期。

OpenAI 实时API 开发者日 EMOVA o2

2024-08-07

端侧多模态模型爆发

面壁智能开源MiniCPM-V 2.6，8B参数对标GPT-4V，手机可跑；华为&复旦EmoTalk3D让3D数字人情感可控，端侧AI进入“看得清、看得懂、演得真”阶段。

端侧AI 多模态 MiniCPM-V 3D数字人 EmoTalk3D

2024-07-09

长上下文与记忆机制创新

Memory3、EAGLE-2、Samba等通过外挂记忆、无损加速及混合状态空间方法，实现更长上下文、更低成本推理，为端侧和无限长度应用打开新路径。

Memory3 EAGLE Samba 长上下文推理加速

2024-06-20

开源模型实力爆发

阿里Qwen2-72B登顶HELM，击败Llama3-70B；英伟达340B Nemotron、DeepSeek-Coder-V2相继开源，在代码、数学、多模态任务上超越GPT-4-Turbo。开源阵营正快速缩小与闭模巨头的性能差距，降低创业门槛，重塑大模型竞争格局。

开源大模型性能超越 Qwen2 Nemotron DeepSeek

2024-04-07

大模型架构与效率突破

谷歌DeepMind连续抛出Mixture-of-Depths（MoD）Transformer与ReadAgent长文本框架，通过动态计算分配和“先摘要后回忆”策略，将推理速度提升50%、有效上下文扩展20倍；MIT/普林斯顿JetMoE则以10万美元成本逼近Llama-2性能，验证MoE+开源数据的小模型路线，为行业降本增效提供可复现范式。

MoD ReadAgent JeMoE 上下文扩展训练成本

2024-03-01

国产大模型技术突破

国内团队在上下文扩展、多模态及评测体系上连续取得进展：陈丹琦团队将Llama-2上下文扩至128k且内存降低83%；阿里EMO实现单图+音频驱动肖像视频；国家队评测显示国产模型数学能力跻身前三。

Llama-2 上下文扩展 EMO 多模态大模型评测

2024-03-01

企业级多模态工具链竞赛

英伟达推出单卡可跑的150亿参数Nemotron-4，Stability AI联合Morph AI发布一体式AI视频创作工具，美图上线局部重绘功能，显示厂商正围绕“小参数、高效率、多模态”争夺企业级落地场景。

Nemotron-4 多模态工具链视频创作美图企业落地

2024-01-25

算力基建与国产替代

顺网科技推出“算力+AI”双板块战略，联想呼吁全栈智能共建生态；英伟达ChipNeMo专为芯片设计定制大模型，微软组建“小模型”团队降低OpenAI依赖。算力芯片、模型压缩与国产生态成为中美科技博弈下的核心赛道。

算力国产替代小模型 ChipNeMo 全栈智能

2024-01-15

国产开源与工具链

中国电信率先开源星辰语义大模型，分享超1T高质量数据；Alluxio+网易优化大数据查询，NeMo框架直播解析大模型训练。国产厂商从模型到工具链全面开源，降低行业落地门槛。

开源大模型星辰训练框架 Alluxio NeMo

# EMO