篮球 足球 综合
当前位置:首页 > 体育 > 电竞

AI玩《超级马力欧兄弟》:Claude模型操作最溜,推理模型表现不佳

时间:2025-03-04 16:26:01 来源:24直播网
加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室(Hao AI Lab)上周五开展了一项独特的研究,将人工智能(AI)引入经典游戏《超级马力欧兄弟》中,以测试其性能表现。研究结果显示,在参与测试的 AI 模型中,Anthropic 的 Claude 3.7 表现最为出色,紧随其后的是 Claude 3.5。相比之下,谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 则表现不佳。

需要明确的是,此次实验所使用的并非 1985 年最初发布的《超级马力欧兄弟》版本。游戏运行在一个模拟器中,并通过一个名为 GamingAgent 的框架与 AI 进行连接,从而让 AI 能够控制马力欧。GamingAgent 由 Hao 人工智能实验室自主研发,其向 AI 提供基本指令,例如“如果附近有障碍物或敌人,向左移动或跳跃以躲避”,同时还提供游戏内的截图。随后,AI 通过生成 Python 代码的形式来操控马力欧。

据实验室介绍,该游戏环境迫使每个 AI 模型“学习”如何规划复杂的操作并制定游戏策略。有趣的是,实验发现像 OpenAI 的 o1 这样的推理模型(它们通过逐步思考问题来得出解决方案)表现不如“非推理”模型,尽管它们在大多数基准测试中通常表现更强。研究人员指出,推理模型在实时游戏中表现不佳的主要原因之一是它们通常需要花费数秒时间来决定行动。而在《超级马力欧兄弟》中,时机至关重要,一秒钟的差别可能意味着安全跳过和坠落死亡的不同结果。

数十年来,游戏一直是衡量 AI 性能的重要工具。然而,一些专家对将 AI 在游戏中的表现与技术进步直接挂钩的做法提出了质疑。与现实世界相比,游戏往往是抽象且相对简单的,并且能够为 AI 训练提供理论上无限的数据。

IT之家注意到,最近一些引人注目的游戏基准测试结果引发了 OpenAI 研究科学家、创始成员安德烈・卡帕西(Andrej Karpathy)所说的“评估危机”。他在 X 平台上发表的一篇帖子中写道:“我目前真的不知道该关注哪些 AI 指标。”他总结道:“我的反应是,我目前真的不知道这些模型到底有多好。”

上一篇: 新华社采访多位国内游戏制作人:国产单机游戏未来拥有无限的可能!

下一篇: mayumi更博晒照:一周内就抵达中国

热门数据

更多

相关信息

相关集锦

热门TAG

查拉库迪市女足 鲜血 倒闭 城市 泰维安-琼斯 蔚蓝 扎卡 苏格兰女足U17 显现 预定 启蒙教练 萨索洛迪 预感 崩塌 泰联杯 海伦·里索 骑士公布杯赛 吆喝 主流 拉姆齐 格雷米奥 奥伯华特 转会交易 春秋 东契奇 韩国k联赛直播 湖人最新排名今天 nba2012全明星赛录像 欧冠今天比赛 2026年冬奥会 今日cba赛程直播 2022年足球赛事时间表 体育赛事频道高清直播 114nba直播网 007探球网球比分 拉齐奥1-1马德里竞技 2018世界杯冠军 手机看中超直播比赛 cctv5直播nba季后赛 湖人交易最新消息 特拉普 保罗加索尔 英超直播免费观看 足球直播在线直播观看免费直播吧 湖人vs掘金直播 2024德国欧洲杯赛程 2012nba总决赛第四场 西班牙人比赛直播免费观看 f1高清直播 ncaa直播

足球直播24小时为广大球迷提供全面及时的赛事直播和资讯 完全绿色安全无插件,稳定安全的直播网,每天收集最新的体育直播资讯,原创大数据足球篮球赛果预测,历史战绩,情报分析,足球直播所有直播信号均由用户收集或从搜索引擎搜索整理获得,所有内容均来自互联网,我们自身不提供任何直播信号和视频内容 如有侵犯您的权益请通知我们,我们会第一时间处理。

Copyright © 2021-2024 24直播网. All Rights Reserved. 鲁ICP备13015161号-1