AI快开门

发现最好的AI工具

2025-10-18

多模态大模型与视频生成突破

Google AI Studio统一Playground、百度分钟级长视频与蒸汽机模型、北大-牛津CVM一致性挑战赛等,显示多模态生成正从“能生成”走向“高一致、可商用”。视频时长、角色一致、端侧推理速度等核心痛点被集中攻克,为广告、影视、UGC平台带来即刻落地的新产能。
2025-06-09

端侧与高效推理创新

面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-03-14

端侧与消费级AI

M3 Ultra芯片跑满血DeepSeek-R1仅需15万元家用设备;Windows记事本内测AI摘要;Android Studio Gemini多模态一键生成UI代码,显示大模型正快速下沉到个人开发者与消费场景。
2025-03-11

多模态与端侧推理提速

Zoom“草稿链”砍掉80%推理token,LayerSkip自推测解码加速大模型,字节开源MoE训练代码,RTX 5000 Ada成端侧新宠,显著降低延迟与成本,为端侧大模型规模化部署铺平道路。
2025-03-07

端侧与低成本推理

FP8训练显存省40%、速度提1.4倍,两台512G M3 Ultra即可跑满血DeepSeek-R1,阿里QwQ-32B笔记本可部署,Q-Filters无训练压缩KV缓存,端侧与消费级硬件正成为大模型推理新常态,边缘AI门槛快速降低。
2025-01-06

AI硬件创新潮

英伟达RTX 5090/5080显卡、三星Vision AI电视、Roborock机械臂扫地机、Circular Ring2智能戒等集中亮相,AI算力与场景硬件同步升级,边缘推理成本下降,端侧智能进入落地爆发期。
2024-08-12

AI硬件与端侧部署

哈佛初创推出ChatGPT专用芯片,微软亚研开源T-MAC让CPU跑大模型提速4-5倍,苹果被曝下一代iPhone SE将集成Apple Intelligence,显示AI正向低成本、低功耗、端侧普及快速渗透。
2024-08-09

端侧与CPU推理加速

微软亚研院开源新技术让大模型在手机CPU运行速度提升4-5倍,LG发布韩国首个开源模型Exaone 3.0,推动端侧部署门槛大幅降低,将加速边缘AI应用与隐私计算落地。
2024-07-03

模型效率与边缘AI创新

苹果端侧小模型、Prism框架把感知与推理解耦,2B参数即可媲美20B;上海理工卷积光神经网络成像视野扩大271倍,显示“小模型+专用硬件”成为端侧落地新范式,将加速手机、IoT、机器人场景商用。
2024-06-12

端侧推理与效率优化

上交PowerInfer-2让470亿大模型手机端提速29倍,Yandex YaFSDP打破LLM训练效率瓶颈,TiTok用32 token重建图像提速410倍,端侧与训练双重提效,为AI大规模普及扫清算力与能耗障碍。
2024-04-24

端侧小模型爆发

微软Phi-3系列以3.8B参数在手机端跑出ChatGPT级能力,引爆“边缘AI”赛道;OpenAI、谷歌同步加码,标志大模型轻量化进入可用阶段,将重塑移动应用、IoT与隐私计算格局。
2024-04-02

端侧与推理框架提速

Google JAX 在七项基准中超越 PyTorch/TF,成为 GPU 训练推理新标杆;Transformer-Lite 实现手机 GPU 高效运行 LLM;苹果发布设备端模型性能超 GPT-4。框架与硬件协同优化,让大模型离线和边缘部署进入实用阶段。
2024-01-22

视觉Mamba架构革新CV

华科王兴刚团队首次将Mamba引入ViT,精度超DeiT、速度提升5倍;中科院等推出VMamba,宣告视觉Mamba迎来Swin时刻。线性复杂度+全局感受野让Mamba成为CNN与Transformer之外的新主流,有望重塑端侧视觉芯片与推理框架。
2024-01-01

大模型性能与部署优化

2023年,大模型压缩、微调与边缘部署技术集中突破:MIT提出无需重训即可提升30%性能的层剪枝方法;美图/浙大发布骁龙888端侧实时多模态大模型MobileVLM;NVIDIA分享生产级部署技巧;Hugging Face总结开源LLM爆发趋势。这些进展显著降低算力门槛,加速大模型在端侧和中小企业的落地。