<ul id="mwmk6"><sup id="mwmk6"></sup></ul>

<ul id="mwmk6"></ul>

<abbr id="mwmk6"></abbr>

<ul id="mwmk6"></ul>

<ul id="mwmk6"><sup id="mwmk6"></sup></ul>

資訊在沃

當前位置：沃資訊 > 游戲 > 正文內容

AI挑戰《超級馬力歐兄弟》，Claude系列領先，推理模型為何落?。?/h1>
發布時間：2025-03-04 16:03 來源：ITBEAR 作者：顧青青

加利福尼亞大學圣地亞哥分校的Hao人工智能實驗室最近進行了一項別開生面的研究，他們將AI技術引入了經典游戲《超級馬力歐兄弟》中，以此作為測試AI性能的獨特平臺。研究結果顯示，在這次測試中，Anthropic公司的Claude 3.7版本AI展現出了卓越的能力，緊隨其后的是Claude 3.5版本。相比之下，谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o則未能達到預期表現。
值得注意的是，這次實驗所用的并非1985年原版《超級馬力歐兄弟》，而是在一個模擬器中運行的游戲版本。Hao人工智能實驗室研發的GamingAgent框架作為橋梁，連接了AI與游戲，使AI能夠操控馬力歐。GamingAgent不僅向AI發出如“避開附近障礙物或敵人”等基本指令，還提供了游戲內實時截圖。AI則通過生成Python代碼來指揮馬力歐的行動。
據實驗室介紹，這種游戲環境對AI模型提出了高要求，迫使它們學習如何規劃復雜的操作并制定有效的游戲策略。一個有趣的發現是，像OpenAI的o1這樣的推理模型，雖然在多數基準測試中表現出色，但在此次實驗中卻不如“非推理”模型。研究人員指出，推理模型在實時游戲中往往因決策時間過長而表現不佳。在《超級馬力歐兄弟》這樣的游戲中，時機至關重要，一秒鐘的延誤可能導致完全不同的結果。
游戲作為衡量AI性能的工具已有數十年歷史，但一些專家對此提出了質疑。他們認為，與現實世界相比，游戲環境相對抽象且簡單，為AI訓練提供了理論上無限的數據。這種局限性可能使得游戲基準測試結果無法全面反映AI技術的真實水平。
近期，一些引人注目的游戲基準測試結果引發了廣泛的討論，甚至引發了OpenAI研究科學家安德烈?卡帕西的“評估危機”言論。他在一篇帖子中表示，面對眾多AI指標，他感到困惑，不知道應該關注哪些。他總結道，目前難以準確評估這些AI模型的真實能力。
盡管存在這些爭議和挑戰，但觀看AI玩《超級馬力歐兄弟》仍然是一種有趣的體驗。這一研究不僅展示了AI技術的潛力，也引發了人們對AI性能評估和未來發展的深入思考。

更多>同類內容

Outlook新功能上線：郵件已讀回執，讓你掌握閱讀動態！

03-04

雷軍兩會提案：加強AI換臉擬聲治理，呼吁保護個人權益

03-04

華為車輛原地轉向專利曝光，哪款新車將率先搭載這項黑科技？

03-04

iOS 18.4 Beta 2來了！蘋果新增8款趣味Emoji，你最喜歡哪一個？

03-04

MWC 2025亮點紛呈：高通5G平臺、榮耀新品、華為AI方案引領科技潮流

03-04

努比亞Flip 2小折疊新機海外亮相，699歐元起，國內明日發布看點前瞻

03-04

小米模塊化鏡頭：手機秒變單反，影像新革命？

03-03

NVIDIA新驅動難解顯卡問題，用戶反饋游戲異常加劇！

03-03

嵐圖汽車全面擁抱智能化，盧放：給用戶帶來更好的智能出行體驗

03-03

聯想YOGA Pro 9i Aura版：16英寸3.2K屏，雙棧OLED亮度高達1600尼特！

03-03

小米15 Ultra預售超預期，雷軍透露更多影像黑科技

03-03

小米15 Ultra開售：影像旗艦新高度，2億像素潛望鏡頭僅售6499起

03-03

《巫師4》希里臉部造型變動引熱議，導演澄清：未修改，系開發常態

03-03

小米SU7車主置換經歷：官方高價收車，置換Ultra服務獲贊！

03-03

榮耀MWC 2025發布阿爾法戰略，AI終端生態未來已來！

03-03

點擊查看更多 +

全站最新

小米家電新布局！雷軍透露：武漢智能工廠年底投產在即

小米家電新布局！雷軍透露：武漢智能工廠年底投產在即

小米高端戰略再升級！今年將家電推向全球，直面三星LG挑戰

小米高端戰略再升級！今年將家電推向全球，直面三星LG挑戰

小米不銹鋼紙杯熱銷背后：雷軍意外，產線緊急補貨中

小米不銹鋼紙杯熱銷背后：雷軍意外，產線緊急補貨中

蘋果新款MacBook Air來襲，M4芯片加持能否再創輝煌？

蘋果新款MacBook Air來襲，M4芯片加持能否再創輝煌？

雷克沙NM1090 Pro 2TB SSD實測：頂級主控加持，性能爆表溫控出色

雷克沙NM1090 Pro 2TB SSD實測：頂級主控加持，性能爆表溫控出色

雷克沙NM1090 PRO固態硬盤來襲，PCIe 5.0接口速度飆升至14000MB/s！

雷克沙NM1090 PRO固態硬盤來襲，PCIe 5.0接口速度飆升至14000MB/s！

Outlook新功能上線：郵件已讀回執，讓你掌握閱讀動態！

Outlook新功能上線：郵件已讀回執，讓你掌握閱讀動態！

AMD下代APU性能大爆發，游戲表現能否真超RTX 5070 Ti？

AMD下代APU性能大爆發，游戲表現能否真超RTX 5070 Ti？

熱門內容

本欄最新

Outlook新功能上線：郵件已讀回執，讓你掌握閱讀動態！

Outlook新功能上線：郵件已讀回執，讓你掌握閱讀動態！

雷軍兩會提案：加強AI換臉擬聲治理，呼吁保護個人權益

雷軍兩會提案：加強AI換臉擬聲治理，呼吁保護個人權益

華為車輛原地轉向專利曝光，哪款新車將率先搭載這項黑科技？

華為車輛原地轉向專利曝光，哪款新車將率先搭載這項黑科技？

iOS 18.4 Beta 2來了！蘋果新增8款趣味Emoji，你最喜歡哪一個？

iOS 18.4 Beta 2來了！蘋果新增8款趣味Emoji，你最喜歡哪一個？

MWC 2025亮點紛呈：高通5G平臺、榮耀新品、華為AI方案引領科技潮流

MWC 2025亮點紛呈：高通5G平臺、榮耀新品、華為AI方案引領科技潮流

努比亞Flip 2小折疊新機海外亮相，699歐元起，國內明日發布看點前瞻

努比亞Flip 2小折疊新機海外亮相，699歐元起，國內明日發布看點前瞻

小米模塊化鏡頭：手機秒變單反，影像新革命？

小米模塊化鏡頭：手機秒變單反，影像新革命？

NVIDIA新驅動難解顯卡問題，用戶反饋游戲異常加??！

NVIDIA新驅動難解顯卡問題，用戶反饋游戲異常加?。?/a>

沃資訊門戶 · 資訊在沃千萬用戶的默認資訊主頁合作微信：netspread（注明:沃資訊）
Copyright ? wwo.com.cn All rights reserved. 魯ICP備11015305號-23

午夜精品美女写真福利| 国产精品高清2021在线| 国产成人综合久久精品免费| 99热这里只有精品国产动漫| 国产a不卡片精品免费观看| 精品国产三级a在线观看| 日韩激情淫片免费看| 国内精品一区二区三区最新| 91精品国产成人网在线观看| 亚洲自偷自偷精品| 亚洲精品无码不卡在线播HE | 国产精品久久久小说| 亚洲国产第一站精品蜜芽| 精品久久久久久无码免费| 亚洲av日韩aⅴ无码色老头| 九九精品国产亚洲AV日韩| 久久66久这里精品99| 亚洲AV午夜福利精品一区二区| 国产亚洲精品线观看动态图| 国产精品99久久精品爆乳| 午夜精品久久久久久久99| 国语自产精品视频在线完整版| **毛片免费观看久久精品| 国产精品丝袜一区二区三区| 国产亚洲精品线观看动态图| 日韩在线精品一二三区| 国产福利在线观看精品| 中文字幕一区精品| 国产精品一香蕉国产线看观看 | 亚洲精品中文字幕乱码影院| 亚洲国产精品综合一区在线| porn在线精品视频| 国产成人午夜精品影院游乐网| 亚洲高清国产拍精品熟女| 久久亚洲精品成人AV| 99久久99久久精品| 久久久久se色偷偷亚洲精品av| 2020精品极品国产色在线观看| 欧美激情国产精品视频一区二区| 国产精品99亚发布| 国产精品久久久久国产精品 |