LLMが作る回答は、大きく3つの情報源からできています。
- 事前学習で内部に持つ知識
- 検索インデックス:クロールした情報から取得する情報
- ページ参照:リアルタイムにWebページを読んで得た情報
これらの組み合わせや重み付けはLLMや個々のクエリにより異なります。その違いを整理します。
AIサービスの特徴
Google検索(AIによる概要|AIモード)
情報源
- 主に検索インデックス
- 必要に応じてページ参照
SEO順位の影響
- 強く影響する(Google)
- 上位から引用されやすい
- 文脈と合えば下位からも引用される
- AIによる概要の下に通常の検索結果(ランキング)が表示される
コンテンツ参照領域
- HTML
- レンダリング(JS)
- 構造化データ
クロール範囲
- スパム対策が強力
- クロールは広範囲。頻度はサイト規模により変動
- robots.txt / noindex が有効
- 広告は直接影響なし
引用表示
- 多くのケースで表示され、複数表示もされる
- 引用枠が専用のUIで用意される
Gemini
情報源
- 主に事前学習(カットオフあり)
- 過去の情報も含む
- 必要に応じて検索インデックス(Google)
- 環境やクエリによりページ参照
SEO順位の影響
- 間接的にはある(検索利用時)
コンテンツ参照領域(検索利用時)
- Google検索に準じる
クロール範囲(検索利用時)
- Google検索に準じる
引用表示
- 対話型の要約が中心のため表示は少なめ(特に一般情報で顕著)
- 回答末尾の表示やアイコンメニューからの選択が必要
- 文中表示など増加傾向
ChatGPT
情報源
- 主に事前学習(カットオフあり)
- 過去の情報も含む
- 必要に応じて検索インデックス
- 必要に応じてページ参照
SEO順位の影響
- 事前学習のみの時はほぼ関係がない
- 検索利用時は影響を受ける(Bing中心)
コンテンツ参照領域
- HTML
- 一部画像解析(マルチモーダル推論)
クロール範囲
- 品質フィルタあり
- 基本原則は非公開
- robots.txt はクローラ種別により効く範囲が異なる
- GPTBot / OAI-SearchBotはrobots.txtに従う
- ChatGPT-Userはユーザー操作のため別枠
- 広告の学習への影響は非公開(関係性は低い可能性)
引用表示
- 事前学習のみの時は表示されないことが多い
- 検索を行うと表示が増える
- 文末および回答末尾の「情報源」ボタンで表示
Copilot(チャット)
情報源
- 主に検索インデックス(Bing)
- 補助として事前学習
- ケースによりページ参照
SEO順位の影響
- 影響する(Bing)
- 重みづけの詳細は不明
コンテンツ参照領域
- HTML
クロール範囲
- スパム対策あり
- Googleよりも範囲が狭く、状況に応じた頻度でクロール
- robots.txt が有効
- 広告は直接影響なし
引用表示
- 表示されることが多い
- 文頭、文末およびボタン形式で表示
AIサービス間の違い
LLM事前情報と検索インデックスの利用法の違い
Google検索やCopilotは、検索インデックスの情報を主体として回答を構成し、LLMは文章を構築する補助的な役割を担います。そのため、検索結果や順位から大きな影響を受けることになります。ただし、一回ごとに完結する従来のキーワード検索とは異なり、文脈を持つ複雑な質問(自然言語クエリ)への回答では、必ずしも特定の検索上位サイトが常に引用されるわけではありません。とはいえ、長年運用されている検索インデックスは、スパム対策やクロールにおいて品質が高く、基本的にWebサイトからの情報をソースとしているため、引用される可能性は十分に高いと言えます。
一方、GeminiやChatGPTは、基本的に事前学習した知識を元にLLMが回答を生成します。そのため、一般的な情報や既知の公開情報をサイトから発信しても、引用されることはほとんど期待できません。また、事前学習の手法や対象サイトは非公開であるため、コンテンツ側から直接的な効果を狙うことも困難です。さらに、LLMにはカットオフ(学習データの締め切り)があり、回答生成時に古い情報を含む多様なソースを組み合わせるため、特定の参照元を明示しにくく、結果として引用表示が少なくなります。しかし、最新情報が必要な際には検索を介してインデックスやコンテンツへアクセスするよう進化しており、その場合には引用リンクが表示されます。情報の信頼性担保のため、今後は引用を増やす方向にあるようです。
Webコンテンツには、テキストのほかに構造化データ、JavaScriptで生成される情報、画像、動画など様々な要素が含まれます。現状、全てのサービスでテキストが中心に取り込まれますが、Googleはページをレンダリングし、ユーザーに表示される状態を強く認識します。Bingもレンダリングを行いますが、その網羅性や精度はケースバイケースです。ChatGPTもマルチモーダル推論や自社ブラウザを活用してテキスト以外の情報を取り込み始めていますが、まだ初期段階と言えます。構造化データはAIが情報を判断する上で大きな可能性を持っており、Googleはその重要性と導入を強く推奨しています。特にGoogleが2026年に入ってから構造化データの有用性を整理・定義したことで、今後はこれが業界のスタンダードになる可能性があります。
https://developers.google.com/search/blog/2025/11/update-on-our-efforts?hl=ja
複数のAIサービスに対応する方法
AIO(AIによる概要)における目標の一つは引用リンクを増やすことですが、Google検索やCopilotで引用されるための重要な条件は「上位ランクイン」です。つまり、従来のSEO目標に「AIOへの引用獲得」という要素が加わることになります。検索対策の基本はGoogleもBingも共通しているため、適切なSEO対策はCopilotでの引用にもプラスの効果が期待できます。
「AIOのためにSEOを行う」という考え方は、一見すると意外に思われるかもしれませんが、コンテンツ制作の本質は同じです。AIO対策とは、コンテンツを分かりやすい単位に分割し、AIが処理しやすい「部品」として提供することであり、SEOと共存し、互いに強化し合える関係にあります。
重要なのは、これまでの「単純でボリュームの大きいキーワード」を狙った情報探索型クエリ(インフォメーショナルクエリ)だけでなく、条件や前提を伴う「目的検索(トランザクショナルクエリ)」に対応することです。これにより、将来の顧客開拓に繋がる有用な引用リンクの獲得が期待できます。目的検索に対応するためのコンテンツとは、ユーザーの意思決定に影響を与える製品・サービスの詳細や事例など、AIが持っていない「一次情報」を主体としたものです。
GeminiやChatGPTでは、事前学習データを元に回答を生成するため、サイトの改善策が即座に回答に反映されることは困難です。しかし、検索機能が起動した際には検索エンジンのインデックスが利用され、引用リンクが表示されます。その点において、SEO対策はGeminiやChatGPTに対する有効なAIO対応と見なすことができます。
これらを総合的に考えると、AIO対策においてGoogle検索をメインターゲットとすることが最も合理的です。Googleは多くの施策を取り込むプラットフォームであり、世界最大のインデックスを保持し、Search Consoleを通じて詳細な統計データを確認できるからです。SEOと並行して対策を行うことが結果としてCopilot対応となり、一次情報を充実させて目的検索に対応することは、GeminiやChatGPTでの引用獲得にも必然的に繋がっていくと期待できます。