ETH官方钱包

前往
大廳
主題

DeepSeek R1、ChatGPT-4o、Mistral AI 、o3 mini、Google Gemini 2.0 Flash Thinking推理測試

劍心san | 2025-02-08 02:14:26 | 巴幣 4 | 人氣 601

我先說明這個(gè)測驗(yàn),該內(nèi)容不是空穴來風(fēng)、也不是隨便杜撰出來的,而是根據(jù)我職場工作上實(shí)際遇到的問題,所擷取出來的表格畫面,本身沒有針對(duì)模型來優(yōu)化內(nèi)容,畢竟這本來就是針對(duì)人類員工而設(shè)計(jì)的表格,完全是出自於我個(gè)人,在實(shí)際解決問題之後的突發(fā)奇想實(shí)測。

本次的題目:



首先是DeepSeek R1





再來是ChatGPT-4o




緊接著是Mistral AI :





然後是o3-mini




最後是Google Gemini 2.0 Flash Thinking :




那正確答案就是,Google Gemini 2.0 Flash Thinking所推理決策的內(nèi)容,才是真正實(shí)際可行的正確答案,這個(gè)題目對(duì)於從事運(yùn)輸業(yè)十年的資深員工來說,這個(gè)問題本身真的就只是小菜一碟。


送禮物贊助創(chuàng)作者 !
0
留言

創(chuàng)作回應(yīng)

林包包
居然是谷歌勝出
2025-02-08 15:14:04
劍心san
我也感到意外
2025-02-08 18:47:08
追蹤 創(chuàng)作集

作者相關(guān)創(chuàng)作

相關(guān)創(chuàng)作

更多創(chuàng)作