ETH官方钱包

前往
大廳
主題

ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較

劍心san | 2024-07-27 16:29:40 | 巴幣 110 | 人氣 448

本文同步發(fā)表至:
ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務比較 - Mobile01

首先,我們準備了這兩張圖片




然後一起進行複雜的停車場排位的資訊量測試,要確認該生成式模型是否有理解平面圖與Excel表格之間的關聯(lián)性規(guī)則:

首先是Google Gemini 1.5 Flash模型




再來是ChatGPT-4o模型


透過這樣的比較,我們就可以知道,哪一種生成式ai模型最適合挑戰(zhàn)複雜、推理、決策的任務類型了。(如果讀者有看懂,這兩張圖之間的關聯(lián)性與龐大資訊量的話。)


已經(jīng)產(chǎn)生幻覺內(nèi)容的ChatGPT-4o模型 :



仍能準確分析回答的Google Gemini 1.5 Flash模型:


以下是Google Gemini 1.5 Flash排列的停車格


從表格上打開

就結(jié)果來說,Google Gemini 1.5 Flash輸出Excel表格的成果來說,是可以直接在真實的停車場地上進行無痛使用的(畢竟都有以顏色標記位置區(qū)域),反觀ChatGPT-4o模型只是簡單的排出來,要嘛就是將時間重新生成,不然就是將原本只有四個停車格的凌晨班,硬是塞了好幾輛車牌上去,可見GPT-4o不適合處理資訊量過於龐大的複雜任務,而且很容易產(chǎn)生幻覺(儘管提示詞內(nèi)已經(jīng)有加入具體的凌晨班時段)。
送禮物贊助創(chuàng)作者 !
0
留言

創(chuàng)作回應

相關創(chuàng)作

更多創(chuàng)作