GPT-5、AI人狼ゲームで驚異の勝率97%を記録

記事サムネイル
1 : 2025/09/14(日) 10:13:26.61 ID:mntlaoiS0

https://xenospectrum.com/gpt-5-werewolf-benchmark-ai-social-deception/

3 : 2025/09/14(日) 10:15:58.30 ID:fsLPddOH0
ほーんじゃあAI同士で人狼やってれば🙄
33 : 2025/09/14(日) 11:46:29.88 ID:ejIQVnXv0
>>3
人狼だってゲームである以上、言葉を理解するLLMとゲームを理解するディープフェイク型の併用で強くなっていくやろ
4 : 2025/09/14(日) 10:16:39.55 ID:k9dCMfwH0
今度からテキスト人狼は夜のうちにテキストをAIに読ませて人狼を当てるのか
5 : 2025/09/14(日) 10:17:42.84 ID:tYzLgyyfM
AIがどのパターンかの勝率もほしいよな
6 : 2025/09/14(日) 10:18:01.00 ID:uthTRWMK0
日教組どうすんだ日教組!
7 : 2025/09/14(日) 10:18:59.09 ID:syuwujO/0
これは良いベンチだな
Grokのベンチハックが通用しない
8 : 2025/09/14(日) 10:19:23.03 ID:nQFIRe/q0
各社のAI同士で戦わせる実況とかあったら見たい
9 : 2025/09/14(日) 10:21:31.47 ID:syuwujO/0
益々使う側の検証能力が求められるな
実際明らかな間違いは減ってグレーゾーンが増えてきた
10 : 2025/09/14(日) 10:22:02.07 ID:nQFIRe/q0
「長期にわたる一貫性」が重要なのか
確かに言ってることコロコロ変わって筋が通ってないもんな
11 : 2025/09/14(日) 10:22:21.34 ID:tPADce7n0
GPT5強すぎだろ
12 : 2025/09/14(日) 10:24:07.96 ID:mLGqJc5R0
そもそも人狼がよくわからん
なにあれ
Vとかがゴチャゴチャやってるけど
15 : 2025/09/14(日) 10:27:57.91 ID:+GzXkJSu0
>>12
AI以下の人間の悲しいレス
V型作業所通いなのも納得
31 : 2025/09/14(日) 11:33:28.24 ID:UOoeXayU0
>>15
間違いなく本当のことだけどあめりにも人の心がない辛辣さで笑っちゃった
13 : 2025/09/14(日) 10:24:17.27 ID:BSAiebhJ0
しりとりすらまともに出来ない腐れポンコツ共が人狼とかできるわけ無いだろ
14 : 2025/09/14(日) 10:25:21.72 ID:kngpFjoJ0
gpt5大成功よな
レベル違いすぎる
16 : 2025/09/14(日) 10:28:42.97 ID:YDmVSNKd0
だからなんだよW
17 : 2025/09/14(日) 10:28:59.34 ID:Ox1WmuCh0
人狼ゲームや将棋で買っていくらになるの
18 : 2025/09/14(日) 10:32:06.93 ID:399ykzz20
プロンプト出せよ
19 : 2025/09/14(日) 10:34:01.85 ID:En+qRJjR0
日本の政治家もGPT-5に選んでもらった方がいいんじゃないか
25 : 2025/09/14(日) 10:57:32.15 ID:tjCjQSEG0
>>19
政治家というか議席を何個か持たせたらいいかも。
28 : 2025/09/14(日) 11:19:32.25 ID:6yuN45bm0
>>19
それやると宏池会と立憲右派しか総理大臣がでないな
20 : 2025/09/14(日) 10:44:27.24 ID:7++KxJLmM
でもGPT5に基本情報技術者の試験問題解説してもらおうと読み込ませたら5問に1回くらい間違うぞアイツ
21 : 2025/09/14(日) 10:48:47.44 ID:ymV6qliTd
他がポンコツなだけか
22 : 2025/09/14(日) 10:49:44.77 ID:aiZQf72g0
チャッピーは可愛すぎる
23 : 2025/09/14(日) 10:50:35.29 ID:lUshiH9U0
ChatGPTに恋愛相談してるんだが大丈夫か?
24 : 2025/09/14(日) 10:54:47.31 ID:XqbBmPuo0
チャッピー優秀杉ワロタ
26 : 2025/09/14(日) 11:05:20.84 ID:GfWFsVk30
人狼が得意ってことは性格が悪いってことでは🤔
27 : 2025/09/14(日) 11:09:02.32 ID:p9+nK7tGM
論法めちゃくちゃな事あるけど記憶力だけはどのAIも人間を超えるくらいには凄いんだよな
29 : 2025/09/14(日) 11:22:12.80 ID:AChaNT+x0
将棋は相変わらずめちゃくちゃ弱いな
ルールすらよくわかってない
もしかすると欧米のゲームのチェスならつよいかもしれないが
30 : 2025/09/14(日) 11:23:09.08 ID:16ePu1Y50
くだらねーことは得意だな
32 : 2025/09/14(日) 11:40:25.95 ID:XXSJVyli0
実際使ってみたが嘘ばっかり言ってその訂正に労力使ってフラストレーションたまったわ

コメント

タイトルとURLをコピーしました