AI快开门

发现最好的AI工具

2025-06-09

端侧与高效推理创新

面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-04-30

端侧与低成本推理方案

Unsloth推Qwen3动态量化2.0、NVIDIA NIM Operator 2.0、14.9万元DeepSeek一体机及Simular Mac本地助手相继发布,目标在功耗、成本与隐私约束下把大模型塞进笔记本甚至DOS系统,端侧AI进入“平民化”拐点。
2024-05-11

高效训练与推理框架

Unsloth×Qwen2宣称训练提速47%、显存节省39%,国产开源方案将8GB级显存门槛打穿;Jacobi解码+一致性损失的新LLM并行生成方法再提速2.4-3.4倍;Medusa2级高效解码框架亦在跟进,大模型落地成本有望进一步腰斩。
2024-05-09

模型训练降本增效

Unsloth框架结合QLoRA把Llama3-8B微调显存压缩至7.75GB,1080Ti即可训练;ICLR颁发首届时间检验奖给VAE,凸显高效训练与生成式基础架构持续创新,将降低中小团队进入大模型研发的门槛。