Token - AI话题 - AI快开门

2026-02-24

国产大模型全球爆发

春节前后，MiniMax、Kimi、智谱等国产模型在OpenRouter token消耗榜前十占六席，总份额破60%，带动海外收入飙升、估值破百亿，标志中国大模型从技术追赶进入生态输出阶段。

2026-02-02

多模态大模型技术突破

谷歌、DeepSeek、阶跃星辰等密集发布新一代多模态基座模型，在视觉Token效率、推理速度、Agent适配等维度刷新SOTA；世界模型与可交互虚拟环境同步成熟，标志着“一句话生成可执行宇宙”进入公测阶段，为游戏、自动驾驶、机器人提供通用模拟器。

多模态世界模型 Agent 视觉Token SOTA

2026-01-31

多模态大模型新范式

Emu3在Nature发文，仅用“预测下一Token”统一视觉-语言任务，挑战扩散模型霸权；阿里2步扩散提速40倍，SkyReels-V3开源一张图生成2K视频，标志多模态生成进入“快、统一、开源”新阶段，为AGI探路。

Emu3 多模态 Token 扩散模型视频生成

2026-01-24

国产大模型与多模态突破

百度2.4万亿参数文心5.0正式版登顶LMArena国产榜首，LeCun创业公司以RAE架构挑战Next-Token范式并获35亿美元估值，显示国产与学术派在大模型架构、多模态及商业化上正形成双轨突破。

文心5.0 RAE Next-Token 国产大模型多模态

2026-01-21

资本与能源重构AI格局

OpenAI ARR两年翻10倍至200亿美元，算力Scaling Law验证；纳德拉称“token即商品”，能源成本决定国家AI竞争力；盖茨基金会5000万美元携手OpenAI补非洲医疗缺口，资本、能源、公益三重力量重塑全球AI价值链。

OpenAI收入能源Scaling token商品化非洲医疗资本

2026-01-08

模型评测与后训练新范式

LMArena以众包盲测获1.5亿美元融资，估值17亿美元；潞晨云8元跑通强化学习全流程，后训练进入“按Token计费”时代。评测即流量入口，低成本RLHF成为新基础设施，降低初创公司追赶门槛。

LMArena 模型评测后训练强化学习 Token计费

2025-11-20

小模型逆袭与架构革新

微博15亿参数VibeThinker数学基准反超6710亿DeepSeek-R1；何恺明团队提出无Tokenizer扩散范式，Just Image Transformers简化生成链路；蚂蚁OceanBase三行代码构建AI应用，显示“小即美”与架构简化正成为新趋势。

小模型扩散模型 Tokenizer 架构简化 OceanBase

2025-11-07

AI基础设施与成本骤降

OpenAI-AWS 380亿美元大单、谷歌圣诞岛数据中心、Gemini API文件搜索免费嵌入，叠加token年降900倍，AI算力与存储成本快速下探，加速应用普及。

AI基础设施算力成本 token降价云合作数据中心

2025-11-02

长文本高效处理突破

南理工等高校联合提出VIST框架，用“视觉中心化”思路把长文本当图像压缩，内存占用降50%、token用量减56%，在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。

长文本视觉压缩 token效率 NeurIPS 低成本推理

2025-10-16

多模态大模型军备赛

谷歌Veo 3.1、字节豆包1.6、OpenAI Sora2、通义千问记忆版集中升级，视频生成时长、音频同步、上下文记忆成为竞速焦点，标志生成式AI进入“长时长+多模态+个性化”新阶段，直接决定流量入口与商业变现场景的重新洗牌。

视频生成多模态长上下文记忆机制 Token规模

2025-10-16

国产模型调用量与生态普惠

豆包大模型日均Tokens突破30万亿，百度搜索AI短剧平台公测，万兴科技推视频教程共创计划，显示国产大模型进入“规模换生态”阶段，通过免费/低价策略快速吸收场景数据，反哺模型迭代并挤压海外竞品空间。

国产大模型 Token规模生态普惠内容创作平台战略

2025-10-12

巨头算力军备与资本竞速

OpenAI一年烧70亿美元研发算力，微软发布全球首台GB300超算专供万亿模型训练，谷歌月消耗1.3千万亿Tokens创纪录，Reflection AI一夜吸金20亿美元打造十万亿token模型，显示头部厂商在算力、资本与模型规模上的军备竞赛已进入白热化阶段。

算力军备 70亿美元 GB300 千万亿Tokens 资本竞速

2025-10-05

推理效率优化新进展

Meta提出新方法将大模型思维链推理token减少46%，显著降低长链推理成本，为端侧部署和实时应用打开空间。

思维链推理优化 token压缩 Meta 端侧部署

2025-09-15

成本与商业链重构

OpenAI计划削减微软分成以缓解算力支出，xAI裁员500名数据标注员，Cursor用强化学习降低Token开销，显示高算力成本正倒逼模型方、云厂商与开发者重新分配价值链，AI商业化进入“降本增效”深水区。

算力成本收入分成裁员降本增效 Token

2025-07-25

AI编程与科学计算新范式

阿里Qwen3-Coder登顶代码榜，南洋理工多token预测微调编程准确率提升11.67%，北航OmniArch求解11类PDE，微软BioEmu加速蛋白质模拟10万倍，显示AI在科研与工程计算中正形成“模型即实验”的新范式。

AI编程科学计算代码模型蛋白质模拟多token预测

2025-07-13

Transformer架构新挑战

Mamba作者再发论文，提出H-Net动态分块网络，跳过tokenization实现端到端序列建模，为“无Tokenizer时代”奠基；流匹配成为ICML 2025热门主题，扩散模型与物理启发算法持续冲击Transformer统治地位。

Mamba H-Net 无Tokenizer 流匹配 ICML

2025-07-12

模型架构新范式探索

Mamba作者再发论文提出无Tokenizer架构挑战Transformer，北大&港中文借鉴大脑功能分化推出Fast-in-Slow VLA，ICCV2025自回归多视图生成新范式，预示后Transformer时代多样化路线加速涌现。

无Tokenizer Mamba VLA 多视图生成

2025-07-05

DeepSeek冷热反差

DeepSeek-R1以极致低价引爆API使用量，却面临官网流量下滑、份额缩水，其“Token经济学”与内部AGI战略转移暴露大模型商业化的流量-盈利两难。

DeepSeek Token经济学降价商业化流量