
新浪科技讯 5月13日下昼音信体育游戏app平台,本日在 FORCE LINK AI 改进巡展·上海站,火山引擎官方表露,新发布的豆包1.5·视觉深度想考模子(Doubao-1.5-thinking-vision-pro),激活参数仅20B,但具备弘远的多模态分解和推明智商,在60个公开评测基准中,有38个得回 SOTA 表现,在视频分解、视觉推理、GUI Agent智商等方面均处于第一梯队。当今,该模子已在火山方舟上线。
在视频分解方面,补助动态帧率采样,视频时序定位智商权贵增强,斟酌向量搜索,可精确定位视频中与文本刻画相对应的片断。
同期,新增视频深度想考智商。模子学习了数万亿多模态标志数据,掌持曩昔视觉常识,斟酌强化学习,使视觉推明智商大幅升迁。举例,在复杂的图形推理题中,模子提议假定,进行推理捕快,当发现和假定不通常时,还能进行束缚反想,提议新的揣度,直到得出正确谜底。
此外,该模子新增GUI Agent智商。基于弘远的GUI定位性能,可在PC端、手机端等不同环境中完成复杂交互任务。举例,可对新设立的APP功能进行自动化检测,当今该功能仍是掌握于字节起始多款APP家具的设立测试中。(罗宁)
包袱剪辑:刘万里 SF014
【免责声明】本文仅代表作家本东说念主不雅点,与和讯网无关。和讯网站对文中敷陈、不雅点判断保持中立,不合所包含本色的准确性、可靠性或好意思满性提供任何昭示或表露的保证。请读者仅作参考体育游戏app平台,并请自行承担一起包袱。邮箱:news_center@staff.hexun.com

