ChatGPT、理系チーズのアスペだった。Geminiは数学満点取りつつ文系科目も得意

1 : 2026/04/27(月) 19:10:36.30 ID:vnZQPBmd0

東大・京大の試験を解かせた結果

GPT 5.2 Thinking
・東大理系503点(550点満点、理3最高点453点)
・東大・京大の全科類・学部で首席
・数学4科目と京大化学の計5科目満点
・理系科目に強い
・物理や化学の得点率は9割後半
・国語や東大の歴史は伸び悩む
・東大世界史の得点率は25%(知識はあっても、論理関係が弱く、減点相次ぐ)

Gemini 3 Pro Preview
・東大理系496点
・東大の全科類で首席
・数学3科目満点
・国語などでも点を稼ぐ
・東大の世界史で得点率が8割、日本史も7割近くと苦手科目なし
・東大の文系科目の合計はChatGPTを上回る

OpenAIとGoogle、東大理3「首席合格」数学は満点 得意科目に違い:日本経済新聞
https://www.nikkei.com/article/DGXZQOUC307OD0Q6A330C2000000/

レス1番のリンク先のサムネイル画像
40 : 2026/04/27(月) 19:11:30.24 ID:RePOEWAM0
飼い主に似るんかな
41 : 2026/04/27(月) 19:11:34.36 ID:W3dsuf5l0
文理と陰陽ごっちゃにせんとってくれん?
47 : 2026/04/27(月) 19:14:03.27 ID:LhpJi6hJM
>>41
同じだろ
42 : 2026/04/27(月) 19:11:43.08 ID:vnZQPBmd0
うん……納得
43 : 2026/04/27(月) 19:12:31.48 ID:SOEguBZ30
やっぱりチーズの作ったものだったんだ・・・
どおりでチーズくせえと思った
44 : 2026/04/27(月) 19:12:49.43 ID:aXHsf4Fa0
Geminiの方が人文系強いなとは思ってた
45 : 2026/04/27(月) 19:12:55.01 ID:g6wYFn9W0
5.5になってチャッピーの数学力上がった気がするけど木の精?
46 : 2026/04/27(月) 19:13:35.54 ID:5Mez5Z/X0
これ私だ・・・
48 : 2026/04/27(月) 19:14:14.64 ID:W2tNISTn0
ネットでカンニングし放題やん!
ローカルLLMで勝負しろ!
49 : 2026/04/27(月) 19:14:48.44 ID:OIvGLtqZ0
最近Gemini全然使わなくなったわ
50 : 2026/04/27(月) 19:15:14.03 ID:rlxrhYBK0
チーズが崇拝してそうな(そもそもチーズはマスクしか知らないか)ピーターティールはAIで失業するのは理系だと言ってるもんな
51 : 2026/04/27(月) 19:15:17.64 ID:bEB1GVr60
チズギュドどうすんのこれ…
52 : 2026/04/27(月) 19:16:23.90 ID:iay6xyDV0
東大世界史40点中10点は草
俺以下やん
AIより頭いいんだ俺
60 : 2026/04/27(月) 19:20:10.22 ID:eHXomaaY0
>>52
満点が40点…?
53 : 2026/04/27(月) 19:16:50.85 ID:8g6Xy/HRr
チャッピーって頭いいんだろうけどジェミニの方が日本語うまいよな🥺
54 : 2026/04/27(月) 19:17:06.70 ID:6kVXD3E4H
それらよりGoogle検索のAIが優秀
最新情報幅広く拾ってくれるし
55 : 2026/04/27(月) 19:17:08.36 ID:iQXtOEPqr
Geminiの高速モードって普通の足し算間違えるよな
手抜きすぎだよ
57 : 2026/04/27(月) 19:17:40.31 ID:Nz8nzffx0
Opusは?
59 : 2026/04/27(月) 19:20:04.33 ID:gucBJEvI0
Geminiすげえ
Googleは文系社員も多そうだしな
つうか単にGoogle社員の方がレベル高いだけか
61 : 2026/04/27(月) 19:21:18.90 ID:hIqkfyAb0
いい問題ですね!とか言いながら間違えそうだもんな
62 : 2026/04/27(月) 19:22:17.79 ID:iay6xyDV0
間違えた
東大世界史60点満点で2.5割で15点や
東大は社会二科目で世界史日本史地理から二科目選択で60点60点で計社会120点と英語120国語120数学80計440点だったな文系二次は
あと共テ110点
67 : 2026/04/27(月) 19:24:07.80 ID:eHXomaaY0
>>62
エアプ(笑)
63 : 2026/04/27(月) 19:22:52.31 ID:ja/IJw5t0
なんで1年前のモデル使ってんだよ
64 : 2026/04/27(月) 19:23:24.00 ID:3Lk3/ury0
まあ知識はもうカンニングと同じやから
全問正解は当然で当たり前
僕らはその先を作ろうとしてるんだから
ASI人工超知能を
全知全能は登竜門
66 : 2026/04/27(月) 19:23:56.22 ID:VHVOY+bM0
GPTって今5.5じゃないの
71 : 2026/04/27(月) 19:25:48.10 ID:3Lk3/ury0
>>66
今5.5正直5.4とは比べ物にならないくらい優秀になったクロード4.6ソネットか4.7ソネットくらいかなそれより上かも
コーデックスで雑用でいいから普段使いしてたら違いが分かる
68 : 2026/04/27(月) 19:24:17.00 ID:Rm68Qsgy0
ジェミニがやっぱ頭いい
72 : 2026/04/27(月) 19:27:18.24 ID:3Lk3/ury0
>>68
ジェミニは余り賢くないよ
日本語は一番上手やけど
ただこれからグーグルもアンソロピックに投資するから
技術を借りれたら化けるかも
69 : 2026/04/27(月) 19:24:31.77 ID:3Lk3/ury0
こたえ丸暗記ちゃうからな
1+1は解けても2+2は解けないじゃないから
数式の解き方原子の概念から丸暗記
70 : 2026/04/27(月) 19:24:45.38 ID:lAINErErd
今のは半年前と別人レベルに

性能良くなってるぞ

75 : 2026/04/27(月) 19:30:16.92 ID:5Hv1z3CB0
トレンドがすぐ変わってしまうから開発環境構築が億劫になる
ボタン1つで構築できないの?
76 : 2026/04/27(月) 19:30:17.00 ID:HjGsHhQ90
日本語苦手やからなChatGPT
77 : 2026/04/27(月) 19:34:32.07 ID:iay6xyDV0
60点中15点なら大問三の小問集合くらいしか取れてないんちゃうの?
あれって20点満点だったら単語答えるだけの問三も間違えてるってこと?
79 : 2026/04/27(月) 19:36:59.98 ID:AG/RWoR+0
ChatGPTはガチでアスペの友達と話してる気分になってかったるいわ
ものすごいレアな事例を出して「それは違います」
思い込みが激しくてどれだけ言っても「そんな情報はありません」、無理やり調べさせると前から知ってたように当然のように語る

アスペレベルの深堀りが必要なものはChatGPT、普通の会話はClaudeとしてる

80 : 2026/04/27(月) 19:38:09.35 ID:YJXkQVPA0
満点を100点に設定しないやつはゲェジなんか?
81 : 2026/04/27(月) 19:39:12.79 ID:2cQRziFw0
しょうがないことだけれど、
ChatGPT-5.2 Thinkだともう古い
83 : 2026/04/27(月) 19:41:35.68 ID:Laq37UYZ0
それよりチャッピーが銃乱射アドバイス与えた騒ぎでヤバそう
85 : 2026/04/27(月) 19:44:36.82 ID:2cQRziFw0
>>83
そうやって制限されていくと開発元の素のバージョンと、
サービスリリース版でだいぶ性能の違いが出そうで

コメント

タイトルとURLをコピーしました