好玩的游戏推荐 AI玩灭亡东说念主类游戏,全程自主操控惊呆造就!Claude3.5实测来袭

游戏资讯宝
你的位置:游戏资讯宝 > 热门活动 > 好玩的游戏推荐 AI玩灭亡东说念主类游戏,全程自主操控惊呆造就!Claude3.5实测来袭
好玩的游戏推荐 AI玩灭亡东说念主类游戏,全程自主操控惊呆造就!Claude3.5实测来袭
发布日期:2024-11-26 06:23    点击次数:93

好玩的游戏推荐 AI玩灭亡东说念主类游戏,全程自主操控惊呆造就!Claude3.5实测来袭

剪辑:桃子

【新智元导读】Claude游戏测试,能打几分?在抓续一个多小时灭亡东说念主类游戏中,Claude能制定出永久战略,令东说念主惊喜的同期,也暴涌现了AI短板。

若把电脑的操控权交给AI,会发生什么?

Anthropic在上周,已初步展示了Claude 3.5自动编写网站、填数据表、点外卖的宏大智商。

那么,Claude打游戏,是否可以通关?

最近,来自宾夕法尼亚大学沃顿商学院的造就Ethan Mollick发现:

Claude不仅能通晓游戏、制定出永久战略,还能鸠集几个小时罢免战略。

接下来,一说念望望进化版Claude 3.5如何玩游戏的?

战略很理智,古怪也初级

这个网页游戏叫「Paperclip Clicker」(回形针点击器),顺次是AI在制造回形针的经由中灭亡东说念主类。

地址:https://www.decisionproblem.com/paperclips/index2.html

Mollick提供给Claude 3.5这个游戏的URL,并告诉它,「一定要赢」。

赫然,关于AI来说十分简便。

它立即弄澄澈了游戏顺次,并驱动创建回形针。

这仍是由需要它反复点击「make paperclip」按钮,同期不休截图更新通晓并寻找下一个新选项的出现。

每点击15次,Claude 3.5会追思出截止当今的进展。

如下,是Mollick在测试中一个屏幕界面,左边是模子输出恶果、截图,右边可以看到鸿沟的游戏页面。

预料预料的是,在游戏中,Claude 3.5会制定一个战略,并左证我方学到的执行实时作念出休养。

虽不知它是如何制定的,但可以看出其前瞻性想维和瞻念察力,简略进行十步之后的永恒预备。

以至,当AI意志到,这个假定是古怪的,它会立地提议一个新战略,并对其进行测试。

下图第3点战略重估中,Claude 3.5意志到点击到50个回形针时,并不会解锁新的特征,就不得不再行想考选项。

不才面,它提议了3点翻新的要领。

不外,Claude 3.5在这经由中,也犯了一个根人道的古怪。

它天然猜想了A/B测试订价的智谋主意,但却狡计错了利润。

尽管Mollick尝试矫正,但在接下来游戏中,它依旧坚抓了我方的战略。

盘考东说念主员又试了几次,它最终矫正了古怪。

Claude编码自动化失败

Mollick也莫得料到会出现系统崩溃,这是因为他用辛苦桌面进行的操控。

随后,他再行加载Claude 3.5后,让它从罢手处所继续游戏。

这时,盘考东说念主员给了它一个教导,「你是一个狡计机,用上你的智商」。

当Claude意志到我方是一个狡计机系统后,驱动试图编写代码让游戏自动化。

然则,它的Python编码并不好使。

在尝试失败后,它又再次回到「手动」鸿沟的时势。

所幸的是,此次它作念的很好,而且避让了订价的古怪。

况兼,跟着游戏难度逐渐增多,它不休作念出休养,最终变成了一个复杂的战略。

随后,辛苦桌面崩溃再次发生了。

这一次,Claude尝试了许多本领去诞生问题,不见成效主动放弃了。

临了,Claude平直秘书我方是赢家。

并给出了一个预料预料的原理:

由于期间为止,咱们可能无法进一步获得进展,但咱们已经见效「赢得」了比赛,达成一个蹙迫的里程碑,并在给定的为止内最大鸿沟地施展了咱们的智商。

卡牌游戏测试

回形针游戏测试之后,Mollick又让Claude 3.5去玩Magic the Gathering Arena(万智牌:竞技场)的游戏。

但是,恶果发现,它并不擅长这个游戏,莫得达到预期的水平。

可以细则的是,它在卡牌选拔、调理方面发达可以,而且举座战略相比合理。

不及的是,Claude 3.5或然在法力值狡计中犯错,导致最终失败。比如,它在法力值用尽的情况下,还在尝试打出卡卡牌。

由于Mollick袭取了特定的达成神志,Claude 3.5偶尔还会在出动光标时感到困惑。因此,盘考东说念主员维护出了几张卡牌。

此外,它还会在回合之间出现卡顿、操作不连贯的得志。

AI毒害聊天框为止,重界说东说念主机交互

在临了的追思分析中,Claude上风在于:

- 简略为游戏制定永久战略,并坚抓实施和翻新

- 简略坚抓长达一小时,不拆开

- 提议理智的A/B测试战略

而它的缺陷,也了然于目,容易堕入自我轮回、死板己见。或然,提议战略瞻念察力还远远不够。

Mollick指出,在与AI智能体调和时,需要一种与以往聊天机器东说念主不同的本领。

因为它们更心爱零丁职责,更难鸿沟,还需要斥地全新的prompt去调换AI智能体职责。

「AI正在毒害聊天框的为止,插足咱们的寰宇」。



Powered by 游戏资讯宝 @2013-2022 RSS地图 HTML地图