AI快开门

发现最好的AI工具

← 返回列表

2024-01-18 AI 话题

RSS
📊 7 个话题 📰 5 条新闻

InternLM2、GLM-4、Stable Code 3B 等国产或国内可用开源大模型密集发布,在代码、长文本、多模态等维度逼近或超越 GPT-4,标志中国模型进入“可用+可商用”阶段,显著降低开发者门槛并重塑全球开源竞争格局。


DeepMind 与谷歌相继在 Nature 发表几何定理证明模型,达到 IMO 金牌水平,超越传统吴文俊法;NeurIPS MATH-AI 研讨会聚焦 LLM 数学推理极限,显示 AI 正向形式科学核心领域渗透,为科研自动化打开新范式。


ResGen、CAPLA、DCNv4 等新模型将药物-靶点亲和力预测、3D 分子生成速度提升 8 倍并降低结合能;多模态图像 Transformer 仅凭影像即可精准估计生物学年龄,AI 正成为新药研发与精准医疗的核心生产力。


AMC 自动压缩、Lightning Attention-2、DCNv4 等新技术在 CNN 与 Transformer 上实现 40% 无损加速、无限序列长度恒定算力、显存占用减半,为大模型端侧落地与实时应用铺平道路。


《纽约时报》诉 OpenAI 侵权案升级,LeCun 公开站队;谷歌被曝用 AI 替代 3 万岗位,IMF 警告全球 40% 职位受冲击;2024 超级大选年 AI 造假风险加剧,版权、就业、选举三大治理难题集中爆发。


Stable Code 3B 以 2.7B 参数媲美 7B Code Llama,支持 18 种语言、100K 上下文且可离线运行;中科院调研 102 篇论文指出大模型可自动生成测试输入、快速找 Bug,软件工程进入“自编程+自测试”新阶段。


RoPE 及其长度外推方法成为大模型标配,社区图解其特性并总结多种改进方案,为低成本扩展上下文、提升长文档理解与代码仓库级推理提供关键技术支撑。