Seedance2.0乱杀后,豆包2.0终于来了!字节在接近自己的Gemini 3时刻

2026-02-14 14:30:41 来源: 硅星人

作者 | 王兆洋邮箱 | wangzhaoyang@pingwest.com

价格只有Gemini 3 pro的1/4、多模态理解和推理能力顶级、从底层支撑了现象级Seedance2.0大杀四方的大一统基座模型豆包2.0,终于来了。


【资料图】

这是最近最被期待的模型之一。即便这个春节的AI圈如此热闹,你也不得不承认,目前字节跳动成功抢走了绝大部分注意力。

先是Seedance2.0的惊艳亮相——各个社交网络上都是它制作的惊人的视频,被形容为“杀死比赛”和结束AIGC童年期,并且被很多人用来与去年DeepSeek效应对比;再是媲美Nano Banana,在理解和推理上有很大进步的Seedream模型;然后就是刚刚,为前两个模型提供了底层智能基础的基座模型豆包2.0最终亮相。

这次豆包大模型2.0系列(Doubao-Seed-2.0)提供了多个模型选择:包含 Pro、Lite、Mini 三款多模态通用模型,以及面向开发者的 Code 模型(Doubao-Seed-2.0-Code),以满足不同场景下企业和用户对延迟和成本的不同需求。

至此,字节整个豆包大模型家族到齐。三连击,注意力拉满。

其实围绕模型的刷屏,以前在DeepSeek,Kimi 和千问身上都看到过,但这一次发生在豆包系列“三连击”身上的“刷屏”还是有挺大的的不同:

它自己没怎么强调、外界也还没怎么讨论它的“榜单”排名,但人们第一时间就这么用起来甚至是疯狂地玩了起来。在即梦里,在剪映里,在豆包里,在火山引擎的api里,在各种社交网络里。

模型被广泛讨论,而且是以一种真正被大家用起来的方式流行起来,让人不再太关注什么模型指标,参数,网状评分图,甚至Seedance 2.0都快让你不需在意什么专业提示词这些东西了——这才是这次“杀疯了”的豆包模型系列最不一样也最值得关注的地方。

1

一心要解决真实世界问题的豆包模型

仔细看看这次发布的几款模型以及研究字节在模型上一贯的策略和思路,能更好理解这种不同。

最为惊艳的Seedance2.0,此次最核心的几个特点包括对物理规律理解,对复杂指令的跟随,更真实的音效与视频的配合,以及对复杂运镜和特效的把握,这些都是专业以及普通人们的影视和视频创作里最真实的需求。

在诸多的使用里,你会发现大家在表达一个感受:Seedance2.0吸引人的不只是模型能力,还有它的交互和使用的顺滑。让人感觉已经把产品交互的需求“训”到了模型层面。除了讨论模型,用户会觉得它是一个完善的为真实需求服务的agent,一个用户需求满足的很好的产品。

而豆包这个基座模型,解决的也全是真实世界的难题。

从最初几款模型瞄准的更广泛而基本的问题,到今天的复杂系统问题。字节通过用火山引擎,豆包App等与豆包的彻底连通,来让真实的用户和使用者的需求直接一杆子捅到底,影响基础模型训练的方向和标准。

这都体现在了豆包2.0的更新里。

它的VLM提升了视觉与多模态理解能力,特意为那些最容易产生幻觉的场景做优化,同时它提升了复杂指令执行能力,对“记忆”的理解开始更加真实,让模型在复杂真实任务里更依赖实时判断的推理逻辑而非死记硬背。此外,它增强了搜索能力、让知识更强,此次也同时发布了专为coding场景服务的分支模型。

而且,在豆包2.0背后,字节再次强调了它自己的一整套基于真实世界任务构建的内部评估,它是完成端到端任务的关键。据硅星人了解,字节还为这些看起来很“普通”的工作分配了充足的算力资源。

这种“务实”并不意味着模型不再涌现新能力。

在我们看到的一份预览报告里,豆包2.0在处理一个真实的复杂代码生成任务时,它的解决方案策略不同于评测基准的官方参考实现。这虽然没有被字节形容为DeepSeek论文里那种“aha moment”,但也有了这个意味。因为这背后模型不再仅仅是针对已知解决方案做模式匹配,而是表现出在复杂计算领域进行严格问题求解的能力。这才是推理能力投射到真实世界任务后该有的作用。

豆包作为字节唯一的基座模型,选择了大一统的多模态原生框架,也就是所有模态都从一开始就训在一起,推理能力agent能力也都是原生支持多模态的。这样的基础能力正是Seedance这些“垂直”模型给人惊艳体验的根本。

在基于视觉的推理能力上,豆包2.0展示了对GUI操作界面的很强的理解和推理,甚至是进一步增强了的实时反思能力,这些都是做一个好的agent的基础。

一个例子是freeCAD任务。CAD软件其实是个非常高噪音的图形操作环境,在其中进行语义 GUI 理解,需要通过视觉理解环境,然后通过反思、退出甚至循环的方式分析反馈,自我诊断,从错误里学习,最终自己学会一种“在环境里学习”的能力。

此前同样让人眼前一亮的豆包手机背后,也是这样的模型能力提供支撑。

而这些能力会进一步提供给Seedance和Seedream这样的模型。

在Seedance2.0这次亮眼的能力中,就有一个很有代表性的细节。我用它花了不到10分钟做了一个风格迁移的动画片,你可以看到它的“参考”能力,已经进入了风格的层面,这是单纯的视频模态的模型无法具备的,它来自于豆包2.0这个基座模型,来自于一个把所有能力和所有模态进行大一统训练的强大底层模型。

(我做了一个阿凡提动画片风格,瑞克和莫蒂主演的“杭州宣传片”)

1

字节自己的Gemini3时刻

豆包2.0这次的整体更新非常值得仔细品味。

根据字节内部透露,它非常重视在一些基础科学里的任务表现,比如一些数学猜想、广义相对论和量子编译器调试以及计算化学的各种任务。

这样的偏好说明字节尝试让它继续打好通用能力的基础,考察和训练的一大重点,都是理解抽象科学概念、主动发现并修复真实漏洞的能力。

所以,如果用人们习惯的“屠榜”视角去看,豆包系列有个很大不同,它其实没有去卷最惊艳的那些塔尖上的任务,它花了大量精力去寻找多模态横向增加智能维度,与更靠谱的处理最广泛基础需求的能力之间的微妙平衡。而这无疑是挺考验耐心和节奏的把握的。

这背后也有“只有字节能这么做”的理由,那就是豆包app。

豆包已经是个国民级产品,所以当它背后的模型更新时,意味着大量天天用豆包的活跃用户的一个离不开的产品的更新,那么它当然要提高最广泛最基础的任务的完成度和能力。这是其他模型可能不需要考虑,也无法“利用”的局面。

换句话说,豆包系列模型是少有的真的在面对大量真实鲜活具体用户做训练和优化迭代的模型。

而负责把这种思路落实下来的一个关键环节,是火山引擎。在此前我们和字节模型团队的交流里,他们选择了一条很接近字节做产品的思路的方式在做模型:模型的设计其实最终是和真实用户一起完成的,火山引擎作为模型对外统一的出口,和字节的模型部门Seed紧密合作,火山的模型策略团队会把市场上的需求反馈收集和抽象出来,直接影响到模型的重要功能和研发方向,一切都要用真实业务价值来衡量模型能力。

在最近的三连击过程里,火山引擎也开始面对甜蜜的烦恼,Seedance2.0等模型的需求暴增,给火山带来巨大需求,对它算力基础设施的要求越来越高。不过,正是这个增长过程里积累的真实经验,在反过来帮助模型在训练中得到更高的token利用率和更好的算力效率。

这一切都不得不让人想到Google。在我们此前的文章《火山有了自己的token经济学》里,我们就提到,字节和Google是同一个路线:关键技术全部自研,模型闭源,产品到研发直接全面打通。

以及,豆包就对应着Gemini,一个大一统的多模态agent模型。Seedance 紧跟Veo,甚至超过了对方。这一切的技术基础也和Google类似,都长在自己的以AI为核心的机器学习平台和云服务上,然后这些“Gemini同款”和“豆包同款”细化成产品再提供给外界。

而Google是在Gemini 3 的发布之后,真正证明了自己这一整套路线的正确,从此真正进入自己的节奏里。

此次豆包系列所创造出的氛围也异曲同工。Google在发布Gemini3时的一个变化是,新模型和自己国民级应用以及自有基础设施平台第一次在第一时间紧密结合,Gemini 3第一时间上线Google各种应用,同时,Nano Banana Pro紧随其后进一步确立它模型在使用者中的地位。而字节这一次的节奏也很有意思,Seedance并非单独上线,而是和一系列产品紧密结合,从即梦到小云雀到剪映再到豆包,最终和豆包大模型一起在火山上提供给更多用户,你都可以想象春晚期间多少人在这些平台上创造自己的“短剧”,火山的token会继续井喷。

坚定地选择把全模态和通用能力都全部训到一起,坚持要把产品和模型打通,把对外服务的基础设施看到的产业需求和模型功能设计打通,这是两家公司的相同决定。而Google的选择在很长一段时间并非公认的正确方向,甚至质疑不断,直到Gemini 3的到来;而字节在以开源为主战场的模型竞争氛围里继续坚持了闭源和与真实规模化的应用结合的路线,同样曾经是,也许现在依然是一个“非共识”的方向。

现在都到了turning point。

在我们去年底的预测里我们曾预测了字节的豆包系列模型的转折点,我们当时这样写道:

“2025年,DeepSeek的成功改变了中国模型厂商们的技术策略,开源成了最优选择,字节成了仅有的几个依然闭源的厂商,这样的决策在2026年将迎来“证明时刻”,字节在模型研发上的各种积累其实已经有迹可循,Seed是时候交出一份闭源答卷了。”

看起来,今天这个预言似乎正在应验。在模型和落地上按自己的想法走出一条路,并且用一代模型直接证明了这条路的正确,字节在这个二月,算是接近它自己的Gemini 3时刻了。

点个“爱心”,再走 吧

关键词: 字节 豆包 模态 编译器 旗舰模型 gemini seedance

精选 导读

这些异丁醛行业股票名单,你应该知道!(2026/2/13)

据南方财富网概念库数据显示,异丁醛行业股票有:1、诚志股份(000990):2024年报显示,诚志股份实现营收110.66亿,同比增长-10.88%;净利润2.31亿,同比增长29.98%;毛利率15

发布时间: 2026-02-15 21:14
资讯   2026-02-15

网游前十排名(2025第三季度相关企业毛利率排名前十名)

《南方财富网概念库》财报工具数据整理,截至2025第三季度,网游相关企业毛利率排名中,慈文传媒位列第一位,毛利率达到123.35%;吉比特排名第二,毛利率为94.59%;冰川网络排名第

发布时间: 2026-02-15 15:03
即时   2026-02-15
发布时间: 2026-02-15 14:11
综合   2026-02-15

当前关注:国足vs卡塔尔!U17亚洲杯稳赢一战,冲3连胜头名出线,剑指世界杯

国足vs卡塔尔!U17亚洲杯稳赢一战,冲3连胜头名出线,剑指世界杯,国足,亚洲杯,世界杯,卡塔尔,印尼队,东道主,天津女排

发布时间: 2026-02-15 07:31
综合   2026-02-15

*ST东易: 关于公司股票可能被终止上市的第二次风险提示的公告

*ST东易:关于公司股票可能被终止上市的第二次风险提示的公告

发布时间: 2026-02-14 21:12
即时   2026-02-14

新春年味浓 服务暖人心 山东移动泰安分公司新春主题活动温情上线|每日快报

鲁网2月14日讯新春将至,年味渐浓。为弘扬文化,践行“心级服务,让爱连接”承诺,山东移动泰安分公司各营业厅同步开展新春主题活动,以民俗体验、笔墨送福、暖心服务为

发布时间: 2026-02-14 20:10
热点   2026-02-14

能源互联龙头股票是哪些_A股4大能源互联龙头名单(2/13)

能源互联概念股有比亚迪、阳光电源、国电南瑞、特变电工、电投产融、金风科技、卧龙电驱、正泰电器、国轩高科、千里科技等69家上市公司。能源互联龙头股是哪几只?南方财富网

发布时间: 2026-02-14 15:04
聚焦   2026-02-14

Seedance2.0乱杀后,豆包2.0终于来了!字节在接近自己的Gemini 3时刻

Seedance2.0乱杀后,豆包2.0终于来了!字节在接近自己的Gemini3时刻,字节,豆包,模态,编译器,旗舰模型,gemini,seedance

发布时间: 2026-02-14 14:30
资讯   2026-02-14

豆包正式加入AI红包大战 最高可领8888元!千问“请客”第二轮今晚开启 官方:有重头戏|观焦点

春节AI红包大战再升级。2月13日晚,“豆包过年”新春活动第一阶段正式启动,“豆包红包”话题词冲上热搜。当晚多数用户反馈金额在0.1元~8.88元(如1.66元、1.88元较常见),少数晒出66.6元

发布时间: 2026-02-14 11:05
快报   2026-02-14

大同机械附属完成出售合肥格兰美新材料有限公司的全部股权

大同机械附属完成出售合肥格兰美新材料有限公司的全部股权

发布时间: 2026-02-14 10:27
资讯   2026-02-14

热点 推荐

微山县宏盛卫生用品有限公司成立 注册资本100万人民币

天眼查App显示,近日,微山县宏盛卫生用品有限公司成立,法定代表人为盛利,注册资本100万人民币,经营范围为一般项目:个人卫生用品销售;卫生用品和一次性使用医疗

发布时间: 2026-02-14 07:08
快报   2026-02-14

马伊琍带家人聚餐,妈妈豹纹裙配红高跟很时尚,小女儿巨漂亮? 焦点

马伊琍带家人聚餐,妈妈豹纹裙配红高跟很时尚,小女儿巨漂亮?,素颜,知性,马伊琍,小女儿,豹纹裙

发布时间: 2026-02-13 20:30
快报   2026-02-13

苏豪弘业:《四大名柱》、玉雕《白菜螳螂》等藏品存放于江苏省工艺美术馆内妥善保存-焦点信息

证券日报网讯2月13日,苏豪弘业(600128)在互动平台回答投资者提问时表示,《四大名柱》、玉雕《白菜螳螂》等藏品存放于江苏省工艺美术馆内妥善保存,紫檀

发布时间: 2026-02-13 20:27
热点   2026-02-13

帕尔马对阵维罗纳防线告急,奎斯塔评估应对方案

帕尔马对阵维罗纳防线告急,奎斯塔评估应对方案,弗朗哥,维罗纳队,帕尔马队,国际米兰,恩迪亚耶,伊诺森特·奎斯塔

发布时间: 2026-02-13 17:32
聚焦   2026-02-13

机构评级|长江证券给予裕同科技“买入”评级 未给出目标价 今日热文

2月13日,长江证券发布关于裕同科技(002831)的评级研报。长江证券给予裕同科技“买入”评级,但未给出目标价。其预测裕同科技2025年净利润为17.06亿

发布时间: 2026-02-13 17:28
热点   2026-02-13

本市拟放宽医保个人账户使用范围-微头条

本报讯(记者解丽)昨日,市医保局联合北京金融监管局等多部门,共同发布《北京市支持商业健康保险高质量发展的若干措施》(以下简称《若干措施》),旨在进一步推动商业

发布时间: 2026-02-13 15:13
即时   2026-02-13

2月13日稀缺资源板块跌幅达2% 要闻速递

2月13日14点47分,稀缺资源板块指数报36405.8点,跌幅达2%,成交819.03亿元,换手率1.96%。板块个股中,跌幅最大的前5个股为:洛阳钼业报21.95元,跌5.22%;厦门钨业报59.

发布时间: 2026-02-13 15:07
资讯   2026-02-13

科华生物:公司没有慢阻肺筛查诊断产品

南方财经2月13日电,有投资者在互动平台向科华生物(002022)提问:公司有慢阻肺筛查诊断产品吗?科华生物回复,公司没有该产品。

发布时间: 2026-02-13 12:08
快报   2026-02-13

当前关注:苏尼特左旗:“一窗通办”便民利企

近日,在苏尼特左旗政务服务大厅,“1+4”综合服务窗口前秩序井然。苏尼特左旗琛瑜房地产开发有限公司经理姬全军在新整合的综合窗口前,快速办结了企业员工参保登记业务

发布时间: 2026-02-13 11:30
综合   2026-02-13

既要多读书,更要读好书(有所思)-热点评

作家梁晓声曾说,人应该有两个故乡,一个是现实地理的故乡,另一个则是精神上的故乡。阅读,正是人们抵达“精神上的故乡”的重要途径。书页翻动之间,视野被打开,人们得以

发布时间: 2026-02-13 09:14
即时   2026-02-13