AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
Jet-Nemotron
相关话题
2025-08-27
超高效推理与架构革新
NVIDIA Jet-Nemotron、谷歌Gemini 2.5 Flash Image、华为云384超节点等集中发布,通过FP4/FP8混合精度、后NAS架构、超节点Scale-Up把推理成本砍90%以上,吞吐提升数十倍,标志大模型进入“低价高并发”时代,将直接重塑云厂商定价、AI应用商业模式与边缘部署格局。
推理优化
成本骤降
超节点
FP4
Jet-Nemotron