字节跳动Seed
字节发布的Seed系列模型,Seed1.6、Seedream 4.0、Seedance 1.0等
网站介绍
【基本信息】
- 语言支持:中文、英文
- 价格模式:研究预览阶段,核心模型与论文开源免费,企业级服务通过火山引擎按量计费
- 适用平台:Web 浏览器、Linux/Windows 训练节点、火山引擎 API
- 访问方式:在线阅读技术报告、下载模型权重、调用云端推理 API、申请内测
- 其他特色:背靠字节跳动,模型与飞书、豆包、即梦等 10+ 产品无缝落地,工业级数据与算力持续反哺
【功能与特色】
Seed1.6 多模态大模型
统一文本、图像、音频、视频 token,引入“自适应思考”机制,根据问题难度动态分配推理深度,在 GSM-8K、MMBench 等 60+ 基准刷新 SOTA;4B 轻量版可在单卡 A100 实时推理,为边缘场景提供 GPT-4 级体验。
Seedream 4.0 图像创作引擎
基于扩散-Transformer 混合架构,支持 2K 分辨率、多风格、多主体一致性生成;提供 PSD 分层输出与矢量路径,可直接用于商业海报、游戏原画,已在即梦 APP 累计生成 3 亿张高质量图片。
Seedance 1.0 视频生成模型
业界首个多镜头叙事模型,一次提示可自动生成分镜脚本并输出 1080p、24 fps 流畅视频;语义理解模块可解析影视术语如“推轨镜头”“仰拍”,5 分钟完成传统动画团队半天工作量。
Seed LiveInterpret 2.0 同声传译
端到端语音到语音,延迟 < 2 秒;声纹复刻保留原说话人音色,在多人混叠、口音嘈杂的会议场景 BLEU 提升 8.3 分,已服务 200 场国际会议。
Seed GR-3 机器人大模型
把长序列操作抽象为“文本+视觉 token”,在 100 个新厨房零样本任务成功率 78%,相比 RT-2 提升 21%;与清华合作夺得 RoboCup 人形组世界冠军,模型与数据集同步开源。
Seed Diffusion 极速代码模型
离散扩散架构专为代码生成优化,推理速度 2146 tokens/s,比同规模自回归模型快 5.4 倍;在 HumanEval pass@1 达到 84.6%,4 秒生成完整 Web 应用骨架。
VeOmni 多模态训练框架
一套代码支持任意模态混合训练,自动并行策略让千卡集群线性加速比 ≥ 92%,把原本 3 周的多模态预训练压缩到 3 天,已开源并在 GitHub 获 6k star。
【一句话总结】
字节跳动 Seed 用一套全模态、全链路、全开源的大模型体系,把前沿研究、工业落地与开发者生态拉到同一高速跑道,让多模态 AI 真正“可用、可改、可商用”。
网站截图