ETH官方钱包

前往
大廳
主題

Claude 3模型與Google Gemini Pro v1.0模型的視覺(jué)推理對(duì)決

劍心san | 2024-03-10 20:55:03 | 巴幣 100 | 人氣 676

由於Claude 3模型已經(jīng)正式發(fā)佈,並支援萬(wàn)字以上的分析及圖片推理能力,且聲稱(chēng)全面超越ChatGPT-4 Turbo與Google Gemini Ultra v1.0、Google Gemini Pro v1.0模型,因此,就展開(kāi)了這一次的測(cè)試內(nèi)容,藉此親眼確認(rèn)兩個(gè)模型之間的差異。

首先是拿中國(guó)象棋進(jìn)行測(cè)試:



再來(lái)是Dota 2直播賽事進(jìn)行測(cè)試:



最後是星海爭(zhēng)霸2,因?yàn)闆](méi)有賽事直播,所以這邊直接用截圖的方式來(lái)實(shí)測(cè):




實(shí)際上的比賽結(jié)果為紅色勝出。



從上述的影片內(nèi)容來(lái)看,我們可以初步得知,Claude 3模型在棋類(lèi)遊戲方面的視覺(jué)推理能力,似乎可以跟Google Gemini Pro v1.0模型並駕齊驅(qū),但要說(shuō)出具體細(xì)節(jié)差異的話,Claude 3模型其實(shí)並不會(huì)告知額外的資訊內(nèi)容推理,這一點(diǎn)其實(shí)就跟ChatGPT模型系列很相似。


總結(jié):
但就整體來(lái)說(shuō),該兩者模型在視覺(jué)推理領(lǐng)域的表現(xiàn)上,還是直接碾壓GPT-4 turbo模型。但若要說(shuō)有接近人類(lèi)的推理能力,我自己是覺(jué)得還言之過(guò)早就是了。

送禮物贊助創(chuàng)作者 !
0
留言

創(chuàng)作回應(yīng)

追蹤 創(chuàng)作集

作者相關(guān)創(chuàng)作

相關(guān)創(chuàng)作

更多創(chuàng)作