- 1 : 2026/06/10(水) 14:31:45.88 ID:SJVb2MOS0
-
https://jbpress.ismedia.jp/articles/-/95259
AI音声は見破れるのか、高市首相答弁が問いかけた「声の証拠能力」
情報幾何学やトポロジカル解析で合成音声と自然音声の違いを検証する - 41 : 2026/06/10(水) 14:32:30.39 ID:SJVb2MOS0
- 自民党総裁選などで高市早苗首相の陣営が他候補を中傷する内容の動画を作成してSNSに投稿していたと報じた週刊文春の記事を巡って、衆参両院の予算委員会で野党が首相を厳しく追及しています。
とりわけ、首相の公設第一秘書と動画を作成した人物とのものだという録音された会話について、本当に公設第一秘書の声なのかが、追及と答弁の焦点になっているようです。
さて、今回はこのケースを題材に、AIで作成した音声と本人の肉声を聞き分けられるのかについて取り上げたいと思います。
6月5日の参院予算委員会の答弁で首相は「いずれにしても、やり取りの内容について、他候補を批判するものでもないし、これはどう考えても確認のしようがない」と述べています(産経新聞の記事など)。
政治的な背景のある事案であり、答弁にある「確認のしようがない」という部分も真意はよく分かりません。
しかし、もし「確認のしようがない」というのが、公設第一秘書本人が話しているものかAIが生成した録音なのかを指しているのであれば、当該分野の国立大学教官として指摘したい点があります。
自然な録音とAIによる合成音は、適切な解析を行うことで、相当程度弁別できる場合があるからです。
本稿は具体的な根拠の例とともに、これを広く公衆にお伝えし、未来を危ぶむことのないようリテラシー向上に資したいと考えるものです。
AI合成音声はどう判別できるのか一連の経緯について、郷原信郎弁護士が詳細に解説する動画を公開しています。
郷原さんは東京大学理学部で私の先輩にあたり、様々な仕事で長年のお付き合いがあります。そこで、今回は許可をいただいたうえで彼の声をサンプリング、AIに学習させ「偽郷原弁護士」ボイスを試作してみました。
その波形や「スペクトル(周波数分布)」を用いた各種演算、特に、私の研究室では情報幾何学の父とも称される甘利俊一・東京大学名誉教授が構築された情報幾何の手法を用いる解析を行っていますので、その結果や、材料工学で用いられるパーシステント・ホモロジーによるトポロジカル・マッピングなど進んだ解析による結果もご紹介します。
学習させるのはこのリンクの7分12秒~22秒周辺で、以下のように郷原さんが語っている部分です。
「この・・・、木下秘書の声とされる声は、なんかちょっと違和感を感じました、なんか甲高いような違和感」という音声を取り出してシステムに学習させます。
次に、そのデータをもとに新たにテキストを指定すれば「AIゴウハラ弁護士」に任意の内容を読み上げさせることができます。
各々のデータを見てみましょう。まず、生身の郷原さんによる自然音声は次のようなスペクトルがあります。
- 42 : 2026/06/10(水) 14:32:49.55 ID:Ndz+idkl0
- 普段より音声は
ハキハキしゃべり過ぎな印象
違和感私の感想
- 43 : 2026/06/10(水) 14:33:23.07 ID:dhLYS1GF0
- 意地悪やなあ😢
- 44 : 2026/06/10(水) 14:33:39.78 ID:SJVb2MOS0
- 目視でも分かるように、言葉と言葉の間の間隔がランダムだったり、母音が様々に変化していたり、「一様でないムラ」が随所に見られます。
といっても分かりにくいと思いますので、合成音声のデータと比較してみましょう。
一目見て、下半分の「スペクトル」の赤や黄色が横一線になっているのが分かると思います。
このエリアは<あ、え、い、お、う>など「母音」に当たる周波数帯域で、「自然音声」の場合、生きた人間の声帯振動は決して一様にならないので、ムラが見えます。
これに対して合成音声では、学習データに基づいて生成された音響特徴に一定の規則性が見られ、ムラを創り出すのが難しい。
これは「波形」を拡大するともっと露骨に分かります。
一般に、単純に生成された合成音声では、背景雑音や偶発的な物音が乏しい場合があります。これに対して自然な録音では、まず背景雑音があり、さらに意図せざる物音が随時混ざってきますから「細かい」「汚い」波形になります。
図の上に示したのが「自然な音声の録音」で、下に示したのが「合成音声のゴウハラ弁護士」の同じ0.05秒区間の波形です。
この試作例では、自然音声と合成音声の波形・スペクトルに明瞭な差が見られます。
こうした事情は「AI画像」「AI動画」でも同様で、画像の圧縮や再撮影、編集方法により難易度は変わりますが、「空間周波数」という指標などを用いることで判別の手がかりが得られる場合があります。
以下ソースで
- 57 : 2026/06/10(水) 14:36:39.44 ID:+RPZs0fb0
- >>44
これも「ムラ」でどうこう言ってる時点でボイスロイドレベルの奴を比較対象にしてるだろ - 45 : 2026/06/10(水) 14:33:45.20 ID:HuOZaVBv0
- AI音声は結構制度高めに判別できるらしいな
NHKがやってたアメリカのファクトチェック団体の特集でそういう専門機関があるってやってた - 46 : 2026/06/10(水) 14:33:56.69 ID:SJVb2MOS0
- 晋さん…
- 47 : 2026/06/10(水) 14:34:20.47 ID:+RPZs0fb0
- 高市の件はともかく、判別できるとか言ってる奴はだいたいアホ
- 48 : 2026/06/10(水) 14:34:29.18 ID:c/pjeQ1HM
- ヅラっぽい音響の専門家先生はご存命なのかな
- 83 : 2026/06/10(水) 14:43:05.00 ID:i6OeIIeL0
- >>48
当時急に辞めた時に弟子と不倫駆け落ちしたって聞いた気がするんだがソース見当たらないな
なんで辞めたんだっけ? - 49 : 2026/06/10(水) 14:34:38.63 ID:uFPa72n10
- それでも精度は100%じゃないだろう
まずその教授に左翼や中国との繋がりが無いかも確認しないと - 51 : 2026/06/10(水) 14:34:42.79 ID:vaiF1BWn0
- 画像も動画も分かるんだから音声も分かるよな
- 52 : 2026/06/10(水) 14:34:44.37 ID:Q45K95nw0
- ジェミーもAI音声は判別出来るって言ってた
- 53 : 2026/06/10(水) 14:34:46.67 ID:i6OeIIeL0
- あれ?オルフェウス作った人ってとっくに退官してなかった?
引き継いだ人? - 54 : 2026/06/10(水) 14:35:01.99 ID:qg53L9BPM
- AI音声による捏造と閣議決定
- 55 : 2026/06/10(水) 14:36:02.38 ID:a/Lnq9jO0
- AI音声はようやく不気味の谷を越えたくらいだからなぁ
少なくとも、個人レベルに近いAI音声なら普通にわかるだろ - 64 : 2026/06/10(水) 14:38:01.32 ID:txtWndtYH
- >>55
※わかりません
それはすぐに使える無料だけだよ - 71 : 2026/06/10(水) 14:40:50.98 ID:a/Lnq9jO0
- >>64
NHK等のニュース原稿読みは無料AIだった!? - 85 : 2026/06/10(水) 14:43:34.57 ID:txtWndtYH
- >>71
わからん
AI商業利用を認めてないから報道が用意してるんじゃない?
音声データも大量に必要だからビッグテックは強い - 58 : 2026/06/10(水) 14:36:49.40 ID:ouWzXG470
- ガソリン各国で最安、ナフサ足りてた
野党は政策で勝負できないから
文春ネタで足を引っ張ってる - 61 : 2026/06/10(水) 14:37:03.22 ID:znxv8IoEr
- 東大で合成音声と聞くと嵯峨山教授を思い出してしまうな
- 62 : 2026/06/10(水) 14:37:04.50 ID:NmgwG4300
- A・Iが止まらない!(赤松健著)
- 63 : 2026/06/10(水) 14:37:37.08 ID:77bybjEP0
- 卑劣なファクトチェックは赦してはならない
- 65 : 2026/06/10(水) 14:38:19.32 ID:LJETI++s0
- そもそもやってないんなら、100%違うと言いければよいのでは
- 66 : 2026/06/10(水) 14:38:47.81 ID:FqWs1BPm0
- どうすんのこれ
- 67 : 2026/06/10(水) 14:39:03.40 ID:rSo8IHBp0
- 解析って誰がやるんだろうな
容疑者側はやるわけないし - 68 : 2026/06/10(水) 14:39:10.72 ID:oXHNsO/K0
- 国会中リアタイで鑑定して欲しい
そんなことさせないだろうが - 69 : 2026/06/10(水) 14:39:41.07 ID:onHHkMem0
- 外堀がどんどん埋まってく
- 70 : 2026/06/10(水) 14:40:39.65 ID:43I2puXS0
- 文春はどこかに頼んで既に解析済みだろ
- 72 : 2026/06/10(水) 14:40:51.39 ID:OlMryzaw0
- 🦎だれやぁ!住所握って無い奴は知らない人!
で一発論破
- 73 : 2026/06/10(水) 14:40:53.60 ID:Na+xE8Dm0
- ネトウヨは「耳で聞いたら自然に聞こえるなら判別できない」とか思ってるらしい🥺
そもそも判定以前に数十分の自然な”連続”音声を生成する技術が存在しない.松井だけ超技術を持ってたのかよ😨 - 88 : 2026/06/10(水) 14:44:08.04 ID:37Ok4xoQ0
- >>73
暇空茜が堀口英利はAIで本物は死んでるとか言ってたのとクリソツだわ - 74 : 2026/06/10(水) 14:41:25.49 ID:8gVhFn1A0
- ガチの解析班来ちゃったか…
- 75 : 2026/06/10(水) 14:41:41.58 ID:3VhA3fKt0
- AIはそれっぽくすることに特化していて別に見抜かれないように生成してるわけではないからまだ判別つくだろうね。
多少いたちごっこになるだろつけど無駄に演算力使って見抜かれないように生成できるAIもそのうちできそうやけど - 91 : 2026/06/10(水) 14:45:40.35 ID:a/Lnq9jO0
- >>75
まぁ、現状でもすげぇ金と手間(微調整)をかければ不可能ではないかもしれないけど、現実的には当面は不可能な話だな
「人間の会話と判別てきない」にそれだけの需要があるかも謎だから将来的にも到達しないかもなぁ
判別できた方が社会的にもプラス(自然さではなく、判別をくぐり抜ける進化はするかもだけど) - 76 : 2026/06/10(水) 14:42:08.48 ID:a/Lnq9jO0
- サナウヨが脳の処理能力が低い自慢(AI読みがわからない)になってて草
- 77 : 2026/06/10(水) 14:42:14.28 ID:ss0oCrNk0
- さっさと声紋鑑定しようよ
- 78 : 2026/06/10(水) 14:42:23.37 ID:6ki3K57w0
- AIだってフェーズはもうすぎてるよ
今は決定的な証拠がーって統一されてる - 90 : 2026/06/10(水) 14:44:55.53 ID:jsYxZMmO0
- >>78
やったけど?それが?何が悪いの?
になってない? - 79 : 2026/06/10(水) 14:42:26.01 ID:tQAbRc+/0
- ていうか作った奴が作ったって認めてるしそれを裏付ける証拠も音声以外にも出てきてる時点でもう無理だろ
- 80 : 2026/06/10(水) 14:42:29.99 ID:ScI6GJjt0
- 【朗報】サナの鶴の一声により音声と映像は本日より証拠能力を失いました
- 81 : 2026/06/10(水) 14:42:45.20 ID:AQv/3hV20
- 統一教会、ネトウヨ、テロリスト、赤報隊、
解散命令統一教会思想の犯罪者テロリスト、それが自民党とネトウヨ
連座制で逮捕とかホンマ草w
- 82 : 2026/06/10(水) 14:42:56.27 ID:ZTQnMFLq0
- ネトウヨは一人残らず特定して殺処分しないとね
- 84 : 2026/06/10(水) 14:43:27.65 ID:rSo8IHBp0
- 誰かが解析しても
容疑者が認めなければ意味ないよね
解析する側が法的な建付けのある第三者機関ならともかく - 89 : 2026/06/10(水) 14:44:12.81 ID:8gVhFn1A0
- >>84
警視庁に解析させて身の潔白を証明してもらうか? - 87 : 2026/06/10(水) 14:43:45.38 ID:6ki3K57w0
- 安倍だったらこういうとき根回しして絶対に捕まらないようにするけど
このトカゲ、身内にも敵多いからワンちゃん逮捕あるかもな
高市早苗「秘書の音声に違和感があった。確認しようがない」東大作曲教授「AI音声は見分けられます」😯
嫌儲






コメント