← 返回列表

2026-03-08 AI 话题

📊 8 个话题 📰 25 条新闻

“人类最后考试”与HardcoreLogic新基准双双揭示:顶级大模型在深度数学证明、多步符号推理任务上仍远不及人类专家,最高得分仅50%,凸显原创性与严谨逻辑仍是AI核心短板,为后续算法突破指明方向。


OpenAI发布GPT-5.4,支持百万级上下文与原生Computer Use,可端到端操作Excel等桌面应用,直接替代咨询、投行、律所等复杂白领流程,标志AI从“助手”跃升为“自主执行者”,引发5.7万科技岗位震荡。



Yann LeCun、谢赛宁联合强调多模态预训练是后LLM时代主路径;Parallel-Probe破解无效并行,推理提速35.8%;30B参数REDSearcher以低成本实现深度搜索Agent,高效能与多模态并进。


Claude两周自动挖出火狐22个漏洞含14个高危;187篇论文因“套壳API”数据污染导致准确率暴跌;Anthropic发布劳动力影响新框架,AI评估、安全与可复现性成为学术与产业共同焦点。



Nat. Mach. Intell.刊登SequenTx,用强化学习设计肿瘤序贯药物;李飞飞团队为LLM测「空间智商」;丰田开源最大规模VLA训练教程,AI深入生物、物理、机器人科研方法论。


量子位启动“2026值得关注的AIGC企业/产品”评选,聚焦规模化落地;清华披露毕业生去向,出国比例仅8.5%,华为字节成最大雇主,显示国内AI产业对高端人才吸引力持续增强。