- 君たちはどうジピるか Newsletter
- Posts
- 大規模言語モデルの夢と現実 〜幻覚と現実の狭間で〜
大規模言語モデルの夢と現実 〜幻覚と現実の狭間で〜
「教師のためのChatGPTガイド」が半額セール中!
ほぼ週刊ググレカス Newsletter
無料購読 | 応援する | ChatGPTガイド | プロンプト集
年末年始キャンペーンで半額!(1/11まで)
「教師のためのChatGPTガイド: AIを活用した教育の手引き」がAmazon.co.jpの年末年始キャンペーン対象に選ばれました。
セール価格は税込625円で、期間は2024年1月11日までです。
冬休みのまとまった時間で、ぜひじっくり読んでみてください。新しい時代において教師が何を考え、どう行動すべきかについて書きました。皆さんの周りの先生方やAIに興味のある方々にもお薦めいただければ幸いです。
大規模言語モデルの夢と現実 〜幻覚と現実の狭間で〜
前回に引き続き、生成AIの基礎知識です。今回はAIチャットボットが見せるハルシネーション(幻覚)という現象について、よくある誤解に陥らないように、やさしい言葉でていねいに紹介します。

「幻覚」はバグではなく、LLM最大の特徴なのである
幻覚(ハルシネーション)とは
AIチャットボットが事実でないことを言う現象を「ハルシネーション」と呼ぶことがあります。この間違いには2つのパターンがあると言われています。
学習データが間違っていた(幻覚ではない)
学習データが不足しているので、根拠のない情報を生成した(幻覚)
例えば「日本ではクリスマスにかぼちゃを食べてお祝いします」という文について考えてみましょう。そのような事実はありませんね。
この文章がもし、学習データに基づいて出力されたのであれば、それは学習したテキストに間違いがあったためで、AIに非はありません。
一方、2番のパターンでは、この文脈に関する十分な学習データがなかったため、AIが根拠のない情報を生成しています。これはAIが「幻覚を見ている」という現象に該当します。
例として、筆者がGPT-4に書かせた「クリスマスかぼちゃ」論を引用します:
日本では、クリスマスにかぼちゃを食べる習慣は、独自の文化的要因により形成されたものです。クリスマスが宗教的な意味合いよりも文化的、商業的なイベントとして捉えられていることから、伝統的なクリスマス料理とは異なる選択がされる余地があります。また、かぼちゃは「冬至」にも食される季節的な食材であり、これがクリスマスにも取り入れられる一因となっています。さらに、ハロウィンとの文化的な連携も影響している可能性があり、これらの要素が融合して、日本独自のクリスマスの祝い方としてかぼちゃを食べる習慣が生まれたと考えられます。
いかがですか。非常にもっともらしいことを言っていて、かなり説得力がありますね。
このような「もっともらしい嘘」に、人間が簡単に騙されてしまった事例が既にいくつもあり、AIチャットボットを使う際はハルシネーションに注意し、必ず事実確認を行うことが重要である、という新たな常識が生まれました。
この流れを受けて「LLMには幻覚の問題がある」と言われることも増えましたが、この表現は不正確で、かつ混乱を招くおそれがあります。詳細は以下で述べますが、らいけんの過去の講演や著書にも同様の不正確な表現があったため、この場を借りてお詫びいたします。
「幻覚」はバグではなく、LLM最大の特徴
前回の記事で「LLMとAIチャットボットの違い」について説明した通り、ChatGPTとは大規模言語モデルそのものを指す言葉ではありません。LLMとAIチャットボットとの違いとは、LLMとはGPT-4やGemini Ultraのような言語モデルのことを指す一方、それらの言語モデルをアシスタントサービスとして製品化したものがChatGPTやGoogle BardのようなAIチャットボットである、ということです。
「LLMには幻覚の問題がある」という表現の問題点は、LLMが何をするための機械であるかという理解が不十分なまま、人間本位の身勝手な解釈をしていることです。
大規模言語モデル(LLM)は学習データに基づき、創造的に「もっともらしい」文章を生成するプログラムです。生成された文章が事実かどうかを判定する機能は組み込まれていませんし、そのように設計されたものではありません。この「文章生成器」が書いた文章に嘘が含まれていたとしても大規模言語モデル自体に非はありませんし、それが標準の機能なのですから、問題ですらありません。
もうお気づきかと思いますが、LLMの仕事は言わば「夢を見る」ことなのです。学習データとプロンプトを手がかりに、新たな文章表現を夢想して生成するように設計されているのですから「幻覚」を見ることはバグではありません。むしろそれこそがLLM最大の特徴なのです。
LLMからすれば事実であろうと非事実であろうと同じように生成するわけで、そのプロセスに差はありません。いつもと同じ仕事をしているのに、事実に反する内容が生み出されたときだけ、急に人間が「嘘じゃないか」と文句を言うわけです。何とも愚かで身勝手な話だと思いませんか。
製品としての「AIチャットボット」の幻覚は問題
とはいえ、これが単なる言語モデルではなく、AIチャットボットの挙動となれば話は別です。AIチャットボットはLLMを利用したアシスタントサービスとして売り出している製品ですから、その回答の信頼性は製品の品質そのものと言ってよいでしょう。この場合、事実に反する文章が生成されれば「幻覚の問題が発生した」と言うことができます。
つまり製品としてのAIチャットボット/アシスタントサービスにおいては幻覚は問題であり、対策が必要ですが、テクノロジーの本質としては幻覚を見ることこそが言語モデルの特徴であり、設計通りの振る舞いなのです。
あわせて読みたい
皆さん、無料版のChatGPTをすこし使ってみて、「AIってこんなもんか」と思ってしまっていませんか?それはヤバいです。今すぐGPT-4を無料で使い始めましょう。
1/21 らいけん講演のお知らせ
らいけんが「AIと教育」に関するワークショップを行います。
開催日:2024年1月21日(日)
時刻:エジプト時間11:00-13:00(日本時間18:00-20:00)
タイトル:「君たちはどうジピるか - AIと教育の最前線(仮)」
内容(予定):AI最新動向の紹介、授業準備の効率化、グループ演習など
参加費:無料
「教師のためのChatGPTガイド」出版から半年の間に、再びAIが大きく進化したことについての紹介や、実際にAIチャットボットを使ってみる演習を予定しています。奮ってご参加ください!
Microsoftアカウントをご用意ください
ワークショップの演習ではMicrosoft Copilotを利用する予定で、アカウントが必要になります。普段からPower PointやExcelを使っている方は、まず間違いなくアカウントをお持ちのはずです。上記リンクからサインインできることをご確認ください。
本ワークショップは、「中東・北アフリカ日本語教育オンラインシンポジウム(JLEMENA)2024」というオンラインシンポジウムの一環です。
テーマ:「◯◯年後の日本語教育」
使用言語:日本語
参加費:無料
日時:2024年1月19-21日
スケジュールやプログラムがこちらで見られます。
日本語教育を対象としたイベントですが、ChatGPTの教育利用に関する報告が多く予定されています。
新企画「らいけんさんといっしょ」が始動
「らいけんさんといっしょ」は、らいけんが素敵なゲストを招いて公開レッスンを行う企画です。サポーターの皆さんのお悩みを直接解決するとともに、らいけんの卓越したITスキルを他の多くの皆さんにも積極的に共有するための試みです。
記念すべき第1回のテーマは「画面録画アプリLoomの使い方」です。ゲストにカナダの日本語教師、Amiさんをお迎えしてLoomの基本的な操作をご紹介しました。
📺 YouTubeで公開
レッスンはZoom等で録画し、らいけんのYouTubeチャンネル「ほぼ週刊ググレカス」で公開します。こんな感じです↓
🙋♀ ゲストになるには
公開レッスンの生徒役(ゲスト)は、らいけんをPatreonで応援してくださっているサポーターの皆さんなら、どなたでもお申し込みいただけます。EdtechでもAIでも、英語でも、ギターのレッスンでも構いません。皆さんのご参加を心よりお待ちしております。一緒に学び、一緒に成長しましょう!
ほぼ週刊ググレカス Newsletter
無料購読 | 応援する | ChatGPTガイド | プロンプト