2025-11-24
具身智能融资与开源爆发
蚂蚁领投腾讯系星尘智能 A++ 轮估值破 20 亿元;小米开源跨域具身大模型 MiMo-Embodied 刷新 29 项 SOTA;睿尔曼发布全球最多模态真机数据集。资本与开源双轮驱动,具身智能正从实验室走向工业与家庭场景。
2025-10-25
大模型训练效率革命
数据集蒸馏WMDD/GUARD用10%样本保持全量性能;斯坦福AgentFlow让7B模型在线强化学习超越GPT-4o;北大RiskPO针对低概率高信息路径优化后训练。三大研究齐指“降本增效”,缓解算力焦虑。
2025-08-18
AI安全与伦理治理
深度伪造、AI水印被秒破、假书泛滥、儿童聊天机器人涉“浪漫对话”等事件集中爆发,凸显生成式AI滥用风险。蚂蚁开源180万深度伪造定位数据集、Anthropic给Claude“自保”终止功能、我国首个法律垂直大模型“小包公”上线,标志行业从“先发展”转向“边治理”,技术与规则同步升级。
2025-04-26
具身智能与机器人数据革命
港中大(深圳)发布10万+人手交互视频数据集TASTE-Rob,结合语言指令提升模仿学习泛化;清华等提出Mona微调仅调5%参数即超全调,CVPR2025接连收录,预示机器人学习进入“大数据+小算力”阶段。
2025-04-13
开源数学与中文推理新基座
MegaMath开源3710亿数学token,刷新最大高质量数学预训练数据集纪录;32B中文推理模型以1/20参数量击败DeepSeek-R1并免费商用,两大开源项目降低垂直领域门槛,有望催化教育、金融等行业的模型平民化。
2025-03-18
具身智能与机器人“安卓时刻”
「慧思开物」发布首个通用具身智能平台,国家队真机直播;美的首曝人形机器人样机;深圳机器人复刻《功夫》斧头帮舞;AgiBot开源百万轨迹机器人学习数据集GO-1,预示机器人开发将从“单机专用”走向“通用操作系统+数据共享”新阶段。
2025-03-17
具身智能与人形机器人加速落地
深圳机器人复刻「斧头帮」舞蹈爆红,傅利叶开源3万条人形机器人数据集,联想服务器单机跑671B DeepSeek吞吐6708 token/s,硬件-模型协同推动具身智能从Demo走向产业应用。
2025-03-12
视频生成与编辑新范式
清华RIFLEx一行代码打破时长限制,VideoPainter实现提示词驱动局部编辑,云天励飞发布200万视频编辑数据集,长视频可控生成进入实用阶段。
2025-02-14
AI医疗与科研纵深突破
百川智能AI儿科医生落地北京儿童医院,Owkin构建世界最大癌症空间组学数据集,David Baker团队AI设计酶提升6万倍,显示AI在诊断、药物研发与生物设计领域正取得实质性临床与科研价值。
2024-12-31
机器人数据与平台开源
智元机器人开源百万真机数据集 AgiBot World,英伟达 7 亿美元收购 Run:ai 后反向开源 GPU 管理软件,两者共同降低机器人与加速卡开发门槛,推动产业链标准化与生态爆发。
2024-12-30
具身智能与机器人数据爆发
稚晖君开源百万级机器人真机数据集,清华团队提出空间泛化Scaling Law,比亚迪启动人形机器人项目,具身智能进入“ImageNet时刻”,数据、算法、硬件三线并进,为通用机器人落地奠定基座。
2024-11-26
创业融资与产业趋势
Pyramid Analytics、CuspAI等获数千万美元融资,Meta发布OCx24催化剂数据集,FFAI拟更名聚焦AI,资本与上市公司持续加注,显示AI商业化落地进入资金与资源加速整合期。
2024-11-14
机器人数据集与评测
宇树开源G1机器人操作数据集并采用LeRobot框架,李飞飞团队发布具身智能决策新基准,CASBOT发布家务机器人,低空经济钉钉方案亮相,机器人学进入“数据+评测”标准化快车道。
2024-11-13
具身智能与机器人
Figure AI获微软支持、宇树开源机器人数据集、南大WHALE世界模型、清华等提出LongReward长文本奖励,算法-数据-算力协同推进人形机器人量产,AI+硬件融合进入验证期,但仍受工程化与成本制约。
2024-10-25
具身智能与机器人热潮
DeepMind开源Open X-Embodiment数据集,清华团队CoRL 9连发,Torso肌肉机器人吸睛,优必选核心成员流向小米、小鹏。数据、算法、硬件同步突破,人形与四足机器人进入场景验证期,产业链热度持续升温。
2024-10-13
开源数据集与工具生态
上交开源libcom图像合成工具箱下载破万,浙大发布GTSinger歌唱数据集,FineVideo提供43k视频-文本对,均填补开源社区空白;高质量数据与工具开放降低研发门槛,助推中小团队创新。
2024-08-29
AI for Science与数据开源
阿里云发布国际首个“月球科学多模态大模型”,华中科大推出14万张甲骨文数据集助ACL夺魁,NIS+框架量化因果涌现,AI驱动科学大奖启动,显示大模型正向基础科研渗透并反哺数据共享。
2024-08-24
大模型长文本生成突破
清华开源LongWriter-6k数据集,首次把模型单次输出扩展到10k+字,为报告、小说、学术写作等场景扫清长度瓶颈,标志着大模型从“读长”到“写长”的关键跃迁。
2024-08-24
视频分割进入SAM 2时代
Meta开源SAM 2,实现图像+视频任意对象一键分割,并同步开放含50.9K真实世界视频的SA-V数据集,降低视频编辑、自动驾驶标注等应用门槛。
2024-08-10
垂直领域模型与数据
阿里Qwen2-Audio在多项语音任务超越OpenAI Whisper,德州大学联合NIH发布21.5万张X光问答数据集Medical-CXR-VQA,Fireworks提出可解释量化评估框架,显示大模型正快速向医疗、语音、数学等垂直场景深化,数据与评测方法同步升级。