o1滿血版洩露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

2024-11-04 01:34:43 3

o1滿血版洩露了!

沒想到,OpenAI還擱那兒“今年一定”呢,不少網友已經率先上手體驗到了(doge)。

事情是醬嬸的:有網友發現,OpenAI已經在ChatGPT官網上部署了完整版o1,大家夥兒還都能卡bug直接用!

最初發現此事的網友,測試確認洩露模型具有奧特曼所說的影象推理能力

圖源:𝕏@legit_rumors

而日誌也顯示該模型就是o1本模。

於是,趕在OpenAI出手修復之前,網友們抓緊大玩特玩了一波——

滿血o1到底有多牛

和已經發布的o1-preview、o1-mini最直觀的不同是,洩露出來的o1支援上傳附件。

這也就意味著,終於能測測o1的多模態能力了。

網友們也不說廢話,直接上強度,普特南數學競賽的證明題截圖一貼,甩給滿血o1。

對正整數n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。

思考了18秒之後,o1給出答案:18。

答案正確:

再來一道更復雜的,雖然在識圖上遇到了一點小問題,但還是穩穩做對了。

在如此驚豔表現之下,似乎正確識別人類史上首張黑洞照片也不算什麼了(doge)。

不過嘛,也不是沒有翻車案例。比如,讓大模型數數圖裡有多少個三角形。

ID為anagh的𝕏網友,給洩露模型和GPT-4o做了個同屏對比: