
视频模子Seedance 2.0、图像模子Seedream 5.0 Lite经营刷屏后,2月14日,字节跳跃肃穆晓示推出豆包大模子2.0(Doubao-Seed-2.0,简称豆包2.0)系列。
自2023年,豆包大模子运行测试版上线,2024年肃穆对外发布,豆包代际模子版块更新已进程去近一年半时间。其间捏续在文本基础、多模态强化、深度想考、Agent(智能体)奉行等方面更新,直至这次版块,在2.0万能力升级。
这次备受温柔的2.0版块,具备全栈模子矩阵+多模态雄厚+企业级Agent +极致本钱四大互异化上风,已踏进寰球第一梯队,成为Agent期间的要道玩家。在多项公开测试集上表现杰出,接近Google Gemini3,和具备更高性价比。
字节跳跃官方明确暗示,旗舰版豆包2.0 Pro“面向深度推理与长链路任务奉行场景,全靠近标GPT 5.2与Gemini 3 Pro”。从期间参数到居品定位,豆包2.0与Google Gemini的一样性正在从“对标”走向“一致”。而这种“一致”并非偶而的“撞车”,履行是寰球顶尖AI实验室在通往通用东说念主工智能(AGI)旅途上达成的政策共鸣——AI最终需要为东说念主类完成任务奉行,而这需要对简直天下物理运行划定的雄厚。
版块代际更新
这次更新,豆包2.0系列模子提供Pro、Lite、Mini三款不同尺寸的通用Agent模子。该系列通用模子的多模态雄厚能力杀青全面升级,并强化了LLM与Agent能力,使模子在简直长链路任务中大概踏实推动。同期进一步把能力范围从竞赛级推理彭胀到推敲级任务,在高经济价值与科研价值任务评测中达到业界第一梯队水平。
据官方先容,这次豆包2.0针对大鸿沟分娩环境的使用需求进行系统性优化,旨在更好地完成简直天下的复杂任务。
其中,在言语模子基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌获利,数学和推理能力达到天下顶尖水平。
另外,大模子奉行长链路复杂任务,需要丰富的天下常识。豆包2.0加强了长尾领域常识粉饰,在SuperGPQA等多项公开测试集上表现杰出,科学领域常识测试获利与Gemini 3 Pro和GPT 5.2极端,在跨学科常识利用上也排行前线。
在老师、文娱、办公等繁多场景中,大模子需要雄厚图表、复短文档、视频等内容。对此,豆包2.0全面升级多模态雄厚能力,视觉推理、空间感知、长高下文雄厚等泰斗测试均取得业界最好表现。
靠近动态场景,豆包2.0强化了对时间序列与通顺感知的雄厚能力。以健身场景为例,接入豆包2.0的智能健身App可及时期析用户行为视频,一朝检测到深蹲姿势偏移,立即语音修订——这恰是环境感知与主动交互能力的落地。现时,滚球app官网这一能力已蔓延至穿搭提倡、老东说念主护理等领域。
Agent能力是大模子具备行能源的要道。测试获利暴露,豆包2.0 Pro在指示撤职、器用调用和Search Agent等评测中达到顶尖水平,在HLE-Text(东说念主类的临了老成)上更是赢得54.2的最高分,大幅当先于其他模子。
现时,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户摄取群众花式即可对话体验。火山引擎也已上线豆包2.0系列模子API就业。
价钱方面,豆包2.0 Pro按“输入长度”区间订价,32k以内的输入订价为3.2元/百万tokens,输出订价为16元/百万tokens,比较Gemini 3 Pro和GPT 5.2有较大的本钱上风。豆包2.0 Lite更是极具性价比,概括性能卓越两个月前发布的上一代主力模子豆包1.8,百万tokens输入价钱仅为0.6元。
强化奉行任务能力
这次豆包2.0的全面升级,中枢落点在“简直天下复杂任务的奉行力”。而这一能力的根基,恰是多模态雄厚层的冲破——惟有让模子信得过看懂物理天下的动态与逻辑,它才能从“答题者”进化为“奉行者”。
字节模子团队不雅察到一个典型失衡:言语模子照旧不错告成责罚竞赛贫穷,但放在简直天下中,它们依然很难端到端地完成履行任务——比如一次性构建一个盘算推算清雅、功能完好的小门径。
LLM和Agent为什么在处理现实问题时屡屡碰壁?团队合计,原因主要来自两点:简直天下任务常常跨越更万古间模范、包含多个阶段,而现存LLM Agent难以自主构建高效责任流,并在万古间跨度中蓄积申饬;简直天下常识具有很强的领域壁垒且呈长尾散播,各行业的申饬不在教育语料的高频区,导致即便模子擅长数学与代码,其在专考场景中常常价值有限。
在晋升了长程任务奉行能力的同期,Seed2.0还进一步镌汰了推理本钱。其模子适度与业界顶尖大模子极端,同期token订价镌汰了约一个数目级。在现实天下的复杂任务中,由于大鸿沟推理与长链路生成将破费大宗token,这一册钱上风将变得更为要道。
另外皮多模态雄厚能力方面,豆包2.0Pro在视觉推理、空间感知、通顺雄厚、长视频雄厚等维度,在大多数关联基准测试中取得最高分。此前刷屏AI视频模子Seedance2.0恰是多模态能力支捏的体现之一。
Seedance 2.0中枢升级主要体当今原声息画同步、多镜头长叙事、多模态可控生成。用户输入辅导词与参考图,可一键生成带完好原生音轨的多镜头视频,模子自动说明叙事逻辑,确保扮装、光影、作风与氛围高度长入。此前马斯克点评称:模子发展相等飞速。
据官方先容,豆包2.0不错处理复杂视觉输入,并完成及时交互和利用生成。岂论是从图像中索求结构化信息,照旧通过视觉输入生成交互式内容,Seed2.0都能高效、踏实地完成任务。
这恰是Gemini一直强调的“原生多模态”能力——不是浮浅拼接视觉与言语,而是在底层杀青跨模态的深度对皆。豆包2.0的升级场合与Google的Gemini 3 Pro在视频雄厚、空间推理上的上风高度一致。
而豆包2.0与Gemini在基础模子层面均摄取死磕多模态滚球app,履行上是在进行一场“天下模子”的武备竞赛。它们不再满足于让AI作念一个“言语游戏高东说念主”,而是但愿AI成为一个能看懂、听懂、雄厚物理天下复杂性的“数字东说念主类”。惟有当模子信得过雄厚了杯子为什么会碎、东说念主为什么会笑、视频里的东说念主在作念什么行为,它才能在现实天下中可靠地奉行任务。
买球投注平台app官网
备案号: