SpatialBench 榜单更新:阿里千问霸榜前二,超越 Gemini3、GPT5.1
发布时间:2025-11-26 00:00
发布者:花韻仙語
浏览次数:据悉,SpatialBench是近年来备受关注的第三方空间推理评测榜单,专注于评估多模态大模型在空间结构、路径规划及几何理解等方面的综合能力,被AI领域广泛视为衡量“具身智能”发展水平的重要新兴标准之一。该测试不仅考察模型的知识储备,更重视其在二维与三维环境中对抽象概念的“感知”与操作能力,这对于机器人、自动驾驶等实际应用场景至关重要。
最新榜单显示,阿里通义千问系列的视觉语言模型Qwen3-VL-235B和Qwen2.5-VL-72B分别以13.5分和12.9分的成绩位居前二,大幅领先于Gemini 3.0 Pro Preview(9.6)、GPT-5.1(7.5)以及Claude Sonnet 4.5等国际先进模型。尽管如此,当前AI系统整体仍远未达到人类水平——人类在该测试上的基准得分约为80分,能够熟练处理如电路设计、CAD建模和分子结构分析等高复杂度空间任务,而现有大模型尚无法完全自主完成此类工作。
Qwen2.5-VL于2025年发布并开源,而Qwen3-VL是阿里巴巴在2025年推出的全新一代视觉理解模型,在视觉感知与多模态推理方面实现显著突破。该模型在32项核心能力评测中超越Gemini2.5-Pro与GPT-5,不仅能调用抠图、搜索等工具执行“带图推理”,还可仅凭一张手绘草图或一段小游戏视频实现“视觉编程”。此外,Qwen3-VL特别强化了3D检测能力,能更精准地理解空间布局,基于此,机器人可准确判断物体位置、视角转换与遮挡关系,成功实现对远处苹果的精确抓取。
目前,Qwen3-VL已开源多个版本,涵盖2B、4B、8B、32B等密集参数模型,以及30B-A3B、235B-A22B等MoE稀疏架构模型,每种均提供指令微调版与推理优化版两款类型,成为当下最受企业与开发者青睐的开源视觉模型之一。同时,Qwen3

源码地址:点击下载
# 2025年
# 还可
# 点击下载
# 此类
# 等方面
# 多个
# 分子结构
# 多模
# 榜单
# 开源
# 电路设计
# 架构
# cad
# gemini
# 通义千问
# 阿里巴巴
# 大模型
# claude
# gpt-5
# gpt
# ai
# 苹果
# 工具
# app
相关文章:
真正的《小小梦魇3》!《生灵重塑》过于血腥获M18评级
夜游已成为提振夜间消费的重要组成部分:从“看夜景”到“享夜境”
苹果Apple Watch高血压提醒在七国上线 涉及这些机型
小米和三星两款阔折叠手机曝光 2亿像素镜头成标配?
莲驱召唤物狙击单位完全攻略
供应短缺DRAM价格飞涨:指标性产品飙涨4成!甚至一度暂停报价
孩子寒假学习就用鸿蒙版少年得到:碰一碰分享好课,|直播|课程智能提醒
从北京各区两会看文旅发展动向
怀柔文旅融合发展推介大会
寒假宅家更省心三星AI神洗烘护组合呵护全家人的穿搭日常
三星Galaxy S26系列官方渲染图曝光 2月25日正式发布
超级小爱最新能力升级汇总:跨端操控、抢票提醒等
从“卖房间”到“给情绪”,抖音生活服务BOSS|直播|间引领高端酒店内容营销变革
OPPO ColorOS二月功能升级汇总 将覆盖上百款机型!
卡普空上线《大神》20周年纪念网站 多项活动即将公开
台积电董事会首度移师日本 熊本二厂评估导入3奈米
超能打 超长续航 还超安静! 酷睿Ultra X9 388H创造三大奇迹
苹果手机价格为何不受内存心片影响?答案其实很简单
iOS 代码库泄露新款M5芯片代号 包含M5 Max与M5 Ultra
无视泡沫化警讯!Meta资本支出翻倍至1350亿美元 祖克柏暗示AI将引发裁员潮
闯门切磋游戏攻略精粹之旅
曝OPPO Find X9s将全球首发天玑9500s 后置三摄组合
曝真我GT9系列考虑全系普及2亿像素镜头
三星三折叠Galaxy Z TriFold在美首发数分钟内即售罄
苹果iPhone 18 Pro将搭载两项新技术:支持可变光圈
阿里旗下半导体公司“平头哥”发布自研 AI 芯片:真武 810E
网传OPPO新机图片确认为Find X9s Pro!搭载双2亿镜头
交出年度最差业绩!“非洲手机之王”传音即将退位?
屯田区升级秘笈:帝国成长的秘密引擎
春节追《成何体统》《生命树》,你的姿势对了吗?鸿蒙爱奇艺有新招
相关栏目:
【
科技资讯38001 】
【
网络动态13059 】
【
技术学堂11871 】
【
网络推广75774 】
【
品牌营销52040 】
【
AI推广53525 】
【
推荐站点126806 】






