2026-01-11
AI生态反思与治理
央广网专访梁正呼吁深化“人工智能+”并完善治理体系;Stack Overflow在提问量锐减情况下靠AI数据授权反而盈利,提示社区与AI可共生;DeepSeek等8大明星产品最初均为“意外项目”,折射创新管理的随机性与政策包容的重要性。
2026-01-04
Scaling Law受挑战与架构创新
DeepSeek提出流形约束超连接(mHC)改造残差连接、KAN作者再发檄文反思暴力堆参数,显示行业开始探索不依赖纯规模扩张的新架构,有望降低训练成本并提升可解释性。
2026-01-01
Scaling Law瓶颈与范式反思
Ilya、Hinton、LeCun等顶级学者公开质疑“堆算力+堆参数”路线;NUS尤洋指出300亿美元也难再训出GPT-4级跃迁,行业需回归架构创新与理论突破,预示大模型竞赛从“暴力美学”转向效率与科学驱动。
2025-12-28
AI医疗跨界再思辨
清华百川楼启用圆桌中,王小川提出AI医疗应摆脱“医生复刻”思维,强调技术自主性;AI制药领域亦见扩散模型用于柔性蛋白-配体对接的新成果。学界与产业界共同呼吁AI在医疗、药物研发中突破传统框架,独立探索创新路径。
2025-11-28
顶会最佳论文与算法突破
NeurIPS 2025 揭晓,阿里通义千问“门控注意力”成为唯一中国最佳论文;清华、MIT 等同步刷新扩散模型、强化学习理论,显示华人团队连续占领算法高地,奠定下一代大模型核心架构。
2025-11-18
硬件与系统级创新
港大等提出ADC-less存算一体架构,AI芯片功耗降57%;安谋科技发布周易X3 NPU IP,瞄准端侧生成式AI;OceanBase推出AI原生数据库SeekDB。硬件、数据库、架构协同进化,为AI规模化落地提供底层动能。
2025-11-09
泛在机器人与交互创新
北京大学生携机器人超市打工、健身随行,展现低成本具身智能走入日常;极客公园创新大会集结何小鹏、王小川等探讨AI产品化,反映消费级机器人与场景创新成为C端新热点,提升公众对AI亲和度与商业想象空间。
2025-11-08
人形机器人与具身智能加速落地
特斯拉Optimus与马斯克万亿美元激励计划深度绑定,国家地方共建具身智能机器人创新中心启动实习招聘,北京高校出现机器人技能训练新玩法,预示人形机器人从实验室走向产业化和消费级应用的关键窗口期。
2025-10-26
Transformer架构反思与后注意力时代
“Attention”作者公开呼吁告别Transformer,叠加NeurIPS高分论文用判别式监督重塑推理LLM,凸显社区对Scaling Law边际效应的担忧,后Transformer架构与训练策略成为下一波核心竞争点。
2025-09-29
国产小模型逆袭与高效训练
北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽,验证“小即美”路线,降低算力门槛,推动端侧部署与私有化落地。
2025-09-13
AI产业落地与场景创新
高德“扫街榜”用真实行为数据重构本地生活评价,美团Agent切入生活秘书,中国石化设80万奖金大赛推动能源化工智能化,显示AI正从“炫技”走向“实利”,在到店、能源、校园等场景批量落地。
2025-09-04
AI硬件与终端创新
从硬币大小的Anker AI语音记录器、Nest新设备到特斯拉金色Optimus、洗碗人形机器人,硬件形态多点开花;华为麒麟9020三折叠、腾讯混元世界模型原生3D重建,显示AI正向可移动、可穿戴、家居与机器人端渗透,加速“模型-硬件-场景”闭环落地,带动供应链与消费级市场升级。
2025-08-29
硬件+光学新架构探索
英伟达Q2数据中心收入达411亿美元仍难掩市场焦虑,UCLA用光学芯片首次实现彩色梵高生成,波士顿动力Spot秀空翻体现控制算法进步,表明AI算力与物理载体正同步革新,后摩尔时代硬件创新重回焦点。
2025-07-11
模型架构与训练新范式
北大/华为开源纯卷积DiC,速度超DiT 5倍;Inception Labs推扩散式语言模型Mercury,写代码快10倍;上交团队凭DeepSeek-R1外挂刷新“人类最后考试”国内纪录。后Transformer创新进入爆发期,训练效率与推理质量双升。
2025-06-29
WAIC青年优秀论文风向标
2025世界人工智能大会公布TOP20青年优秀论文,覆盖机器学习、CV、NLP、智能芯片等方向,成为观察中国AI基础创新下一代主力的重要窗口。
2025-05-24
AI硬件与产品形态创新
OpenAI首款可穿戴AI项链由乔布斯爱将操刀,主打iPod Shuffle式优雅无屏交互;豆包实时视频通话功能把大模型装进摄像头,预示AI终端正从手机APP向随身硬件、实时视觉交互演进,将重塑用户习惯与产业链分工。
2025-03-30
模型架构与训练新范式
OverLoCK“复活”卷积网络作为视觉基础模型;浙大团队提出“下一邻域”视觉生成范式,吞吐提升13.8倍;无标注调优将Llama 3.3 70B推至GPT-4o水平,显示架构创新与训练策略正重塑模型性能边界。
2025-03-16
学术前沿算法突破
MetaGPT团队提出“Atom of Thoughts”将推理链原子化,4o-mini在多项推理任务上反超专用模型;Block Diffusion把自回归与扩散模型统一为“逐块生成”,提升长序列质量;ConFIG、SiT等方法分别解决无冲突训练与视觉预训练迁移难题。多项算法创新为下一代模型架构提供新基线。
2025-02-11
Scaling Law与架构争议
OpenAI、奥特曼重申Scaling Law继续有效并预测成本年降10倍,而清华&字节研究指Transformer组合能力逼近上限,MIT提出COAT自回归搜索新框架,学界与产业界对下一代架构路径分歧加剧。