「ChatGPTに名前を出してもらうには、何をすればよいのか」。マーケティングの現場で、この問いを受ける機会が増えました。SEOのように検索順位を競うのとは違い、AIの回答文の中に自社が引用として登場するかどうかは、これまでの最適化の延長線では説明しきれません。本稿では、ChatGPT・Perplexity・Claudeという主要3エンジンに引用される記事の条件を、Ahrefsによる140万プロンプト分析、Profoundによる米国73万会話分析、Anthropic公式仕様、そしてKDD 2024採択の査読論文という一次情報だけを根拠に整理します。生成AI全般の最適化(GEO)については別稿のAIに引用される記事の作り方で扱っており、本稿はそれを前提に、3エンジン比較とBtoBでの実装、計測の現実解にまで踏み込みます。
LLMOとは何か。SEO・GEOとの違い
LLMO(LLM Optimization、LLM最適化)は、ChatGPT・Perplexity・Claudeなどの大規模言語モデルが回答を生成する際に、自社のコンテンツが引用・参照されることを狙う最適化の総称です。検索順位を上げるSEOとも、AI回答全般での可視性を扱うGEO(生成エンジン最適化)とも違い、LLMOは「個別のLLM搭載エンジンの引用ロジックに即して、引用される確率を上げる」点に焦点があります。
整理すると、SEOは検索結果の上位表示を狙うものです。GEOはAIの回答に自社が登場することを広く狙う上位概念で、GoogleのAIによる概要やChatGPTを含めた最適化全般を扱います。LLMOはそのなかでも、特定のLLM搭載エンジン(ChatGPT、Perplexity、Claude、Geminiなど)が回答を組み立てる際の引用ロジックに即した最適化を指します。GEOの下位概念としてLLM特化を切り出した、という位置づけが実務上わかりやすい整理です。
なぜLLMOを分けて考える必要があるのか。理由はシンプルで、LLM搭載エンジンごとに、参照する検索インデックス・引用の自動付与の仕組み・回答の生成プロセスが大きく違うからです。同じ「AI回答」と一括りにすると、エンジン別の打ち手を見落とします。本稿では3エンジンそれぞれの仕様の事実だけを並べ、共通する条件と、エンジン別に分けて考えるべき条件を切り分けます。GEOの総論や、出典・統計・引用が効くという査読研究の話はAIに引用される記事の作り方で詳しく扱っているので、本稿では3エンジン比較とBtoB実装に踏み込みます。
ChatGPT・Perplexity・Claudeの引用ロジック比較
3エンジンの引用ロジックは、いずれも「検索インデックスから候補を引き、それをLLMが再構成して回答に引用を添える」という構造を共通して取りますが、参照する検索基盤と引用の仕組みは異なります。ここでは公開された一次研究と公式仕様の範囲で、それぞれの事実を整理します。
ChatGPT search。検索経由が引用の大半を占める
ChatGPTの検索機能(ChatGPT search)の引用は、検索インデックス経由の流入が支配的です。SEOツールベンダーのAhrefsが2026年4月に公開した分析では、140万プロンプトを対象に、ChatGPTがどのページを引用しているかを大規模に検証しています。その結果、引用されたページの88.46%が検索インデックス経由で到達したものであり、ChatGPTが内部知識だけから自然に挙げたページではなく、リアルタイムの検索結果から再ランクして選んでいるという構造が示されました(参照:Ahrefs「Why ChatGPT Cites One Page Over Another」(2026))。
この分析でとくに目を引くのは、ページタイトルとユーザーのプロンプトの意味的類似度が、引用されるかどうかを大きく左右するという結果です。引用されたページのタイトル類似度の平均は0.602、引用されなかったページは0.484でした。差は0.118ですが、140万件規模で見ると統計的に明らかな差です。同じ分析では、URLのslug(パスの末尾)が自然言語に近いページの引用率が89.78%で、英数字の羅列のような不自然なslugの81.11%を上回ったとも報告されています。
加えて、ChatGPTの引用源の構成自体に偏りがあります。Ahrefsが2025年9月時点で上位1,000件の引用ページを分析した結果では、Wikipediaが29.7%、教育・学術コンテンツが19.4%を占め、67.7%は通常の広報・アウトリーチ施策では関与が難しい性質のページでした。一方で、引用されたページのうち60.5%が直近2年以内に公開・更新されたものであり、鮮度の高い情報が好まれる傾向も同時に示されています(参照:Ahrefs「67% of ChatGPT's Top 1,000 Citations Are Off-Limits to Marketers」(2025))。
Perplexity。リアルタイム検索と再ランク
Perplexityは、ユーザーの質問に対してリアルタイムで検索を行い、複数の候補から関連性の高いものを再ランクして引用とともに回答を返す、という構造を公式に明示しています。具体的な再ランクアルゴリズムの内部仕様は公開されておらず、本稿では推測には踏み込みません。
公開情報の範囲で言える事実は、Perplexityが回答の各段落に引用番号を割り当て、ユーザーがクリックして出典をたどれる構造を標準で備えていること、そして引用源は単一の検索インデックスに固定されず、複数の検索基盤と内部ランキングを組み合わせていることです。ChatGPTがBingインデックスを中心に据えているのに対し、Perplexityは検索基盤の選び方そのものに自由度を持たせている、と整理できます。
Claude。ベンダー公式仕様の事実説明
Claude(Anthropic)のweb_searchツールは、公式ドキュメント(ベンダー公式仕様)に基本動作が明記されています。2026年版の仕様(web_search_20260318)では、ClaudeのウェブサーチがBrave Searchを検索基盤として使用すること、検索結果に対してcitations(cited_text・url・title)が自動的に付与されること、検索結果にはpage_age(ページの公開・更新時期)が付随し、ドメイン単位でのフィルタリング(domain filtering)も可能なことが示されています(参照:Anthropic「Web search tool」(2026・ベンダー公式仕様))。
ここで強調しておきたいのは、Claudeの引用に関しては、ChatGPTやPerplexityほどの第三者大規模研究が公開されていないことです。「Claudeに引用されやすい記事の特徴は◯◯だ」と断定するだけの実証データが現時点で揃っていないため、本稿では公式仕様の事実説明に留めます。Brave Searchを使う点、page_ageを参照する点、citationsを自動で付与する点。この3点が事実として確認できることであり、ここから「鮮度の高い・自然なURL構造・引用を呼び込みやすい構造」のページが選ばれやすい可能性は推察できますが、断定はしません。
共通点と相違点
3エンジンの仕様を並べると、共通点と相違点が見えます。共通点は、いずれも「検索基盤から候補を引き、LLMが再構成し、引用を添えて回答する」という基本構造を取ること、そして引用には鮮度(page_age相当)が影響することです。相違点は、参照する検索インデックスがChatGPT=Bing中心、Claude=Brave、Perplexity=複数組み合わせと分かれること、引用の表示形式と自動付与の仕組みがエンジンごとに違うことです。LLMO実装の優先順位を考えるとき、まずこの「共通条件」を満たし、その上でエンジン別の打ち手を足す、という順序が現実的です。
引用されやすい記事の共通条件
3エンジン横断で引用されやすい記事には、公開された一次研究から抽出できる共通条件があります。ここでは推測を交えず、原典のある事実だけを並べます。
第一に、タイトルとユーザークエリの意味的類似度です。前述のAhrefs 140万プロンプト分析では、引用されたページのタイトル類似度0.602に対して、引用されなかったページは0.484でした。タイトルが「ユーザーが実際に投げる質問の言い回し」とどれだけ近いかが、引用の確率を分けています。検索キーワードを羅列したタイトルではなく、読者が口にする問いに近いタイトルを書くことが、そのままLLMOの打ち手になります。
第二に、統計・引用・出典の明示です。Princeton大学とGeorgia Tech大学の研究者らによるGEO論文(KDD 2024採択)は、1万クエリ・GPT-3.5 turboを用いた実験で、本文に統計を追加すると引用される可視性が+31%、引用を追加すると+30%、引用元を明示すると+30%向上したと報告しました。検索順位が低いページに限ると、これらの工夫の効果は+115%にまで達したと示されています(参照:Aggarwal et al.「GEO: Generative Engine Optimization」KDD2024)。LLMがコンテンツを再構成する際に、根拠を伴った主張を選びやすいという傾向は、複数の研究で一貫しています。
第三に、直近2年以内の公開・更新です。Ahrefsの引用ページ分析では、引用されたページのうち60.5%が直近2年以内に公開・更新されたものでした。Profoundが2026年2月に米国73万会話を対象に実施した分析でも、引用源の鮮度が引用確率に影響することが示されています(参照:Profound「How ChatGPT sources the web」(2026))。古い記事を放置せず、定期的に更新するという地味な作法が、LLMO観点では効きます。
第四に、URLのslugが自然言語であることです。Ahrefsの同分析では、自然言語slugの引用率89.78%に対して、不自然なslugは81.11%でした。差は8ポイント弱ですが、サイト全体に効くため無視できません。記事URLを設計する段階で、英単語のハイフンつなぎで内容を表現するという基本を守るだけで、LLMO上のハンディを抱えずに済みます。
第五に、Turn1(最初の問いかけ)に答える構造です。Profoundの73万会話分析では、ChatGPTの引用は会話のTurn1(最初の質問)で発生する確率が、Turn10(10回目のやりとり)の約2.5倍と報告されました。1会話あたり平均6引用が発生し、Wikipediaは全引用の約5%を占めるという内訳も示されています。読者が最初に投げる「結論を知りたい」段階の問いに、冒頭で正面から答える記事構造が、引用を呼び込みやすいということです。各見出しの直下で結論を一文で言い切る、という編集ルールは、人間の読みやすさだけでなくLLMOにも効きます。
効果実測の現在地。分かっていることと分かっていないこと
LLMOの効果実測は、まだ発展途上の領域です。「ChatGPTに名前が出れば、流入は◯倍になる」「LLMO実装で売上が◯%増えた」という主張をネット上で目にすることがありますが、これらは一次研究で確認されたものではないため、本稿では数字として扱いません。判断材料が揃っていない以上、安易な期待値は持たない方が安全です。
現時点で分かっていることは、3点に整理できます。第一に、引用源の分布(Wikipedia・教育系の比重、アウトリーチ困難なページの比率)はAhrefsとProfoundの分析で具体的な数値が示されています。第二に、更新頻度が引用確率に影響する(直近2年以内が60.5%)ことも確認されています。第三に、引用される記事と検索順位上位の記事は完全には一致しないこと、つまりLLMOとSEOの最適化対象がずれることも、Ahrefsの分析から読み取れます。
一方で、分かっていないことも明確に分かっていないと述べておきます。日本市場での引用シェア、日本語でのChatGPT・Perplexity・Claudeの利用比率、BtoBの検討フェーズで引用が商談にどう寄与するかについては、信頼できる第三者統計が現時点で見当たりません。「日本ではChatGPTが◯%」「Claudeが◯%」といった数字は、出典の確認できないものが多いため、本稿では触れません。
ここで重要なのは、計測指標を「分からないこと」に振り回されず、「測定できるもの」に絞ることです。現実的に追える指標は3つあります。1つ目は、自社で重要なキーワード群を定期的にChatGPT・Perplexity・Claudeに投げて、自社が候補に挙がるか、挙がるとして正確に説明されているかを記録する「引用回数モニタリング」です。2つ目は、自社サイトのreferralトラフィックの中で、chat.openai.com、perplexity.ai、claude.aiなどからの流入を切り分けて見ることです。3つ目は、自社のブランド名・サービス名での指名検索数の推移を追うことです。AI回答で名前を見た読者が、後で指名検索する動きが起きていれば、指名検索のトレンドに表れます。
AIに引用されてもユーザーが回答だけで満足してクリックしてくれない「ゼロクリック」の問題は、LLMOを設計する上で避けて通れません。この観点は別稿のAI検索とゼロクリック問題で詳しく扱っていますので、計測設計とあわせて読んでいただけると、LLMOで何を取りに行くべきかが見えてきます。
BtoBコンテンツでのLLMO実装
BtoBコンテンツでLLMOを実装する際は、買い手の最初の情報源がAI回答に移行している前提を出発点に置きます。別稿B2B買い手の情報源で扱った調査では、ショートリストを作る段階の情報源として、生成AIのチャットボットが17.1%でベンダー自社サイトの12.8%を上回りました。買い手が候補を絞る段階で、すでに自社が候補に挙がっているかどうかが先に問われている、という構造です。
この前提を踏まえると、BtoBでのLLMO実装で外せない論点は4つに整理できます。
1つ目は、製品名・カテゴリ名・課題語を「定義から書く」構造です。Ahrefsの分析が示した「タイトルとクエリの意味的類似度」を考えると、自社製品やサービスカテゴリを説明する記事は、買い手が実際に投げる「◯◯とは何か」「◯◯の選び方は」という問いの形に近づける必要があります。記事の冒頭で、定義を1〜2文で言い切ることが、LLMが回答を組み立てる際の引用候補に入る近道です。
2つ目は、一次データ・自社実績の数値化・出典明記です。Princeton GEO論文の「統計+31%・引用+30%・引用元明示+30%」という結果と、Ahrefsが示した引用源の鮮度の重視は、いずれも「根拠の伴った情報」を優遇するという方向で一致しています。自社の事例や調査結果を、抽象的な「成功事例があります」ではなく、「業界◯社・実施期間◯ヶ月・成果◯%向上」と数字で書き、出典をつけられる範囲で明記する。この作法を、自社のオウンドメディア全体で揃えるだけで、LLMO観点では大きく前進します。
3つ目は、既存資産(過去事例・調査レポート・登壇資料)をLLMO観点で再編集する手順です。多くのBtoB企業には、すでに営業現場で使っている事例集や、ホワイトペーパーとして配布している調査資料があります。これらは内容としては優れていても、AIに引用されることを想定した構造になっていないことがほとんどです。具体的な再編集の手順としては、各資料から「定義」「数字」「出典」を抽出し、ブログ記事として独立した形に書き直すこと、見出しを買い手の問いの形に置き換えること、URLとtitleタグを自然言語で整えること、の3工程に分解できます。新しい記事を量産するより、既存資産の再編集の方が、初期投資としては小さくて済みます。
4つ目は、自社内のAI利用ログを資産化することです。社内でChatGPTやClaudeを業務で使う場面が増えると、社員が投げた質問と、AIが返した不完全な回答の組み合わせが蓄積されていきます。この社内ログは、買い手も同じ問いをAIに投げている可能性が高い「実需のあるクエリ」のリストです。社内のAI利用ログを資産化して、コンテンツのテーマ選定に活かす取り組みは、別稿AI利用ログをコンテンツ資産にするで詳しく扱っています。LLMOのキーワード選定は、外部のキーワードツールよりも、自社の社内AI利用ログの方が、リアルな問いを拾える場合があります。
「AIにゼロクリックで読まれる」前提でのCV設計も、BtoBでは外せません。引用されてもクリックされないなら、引用された記事の中で「自社の名前」「自社サービスの定義」「自社の数字」が正確に語られている状態を作ること自体が、ブランド露出として価値を持ちます。クリックを取りに行く施策と、引用の中で名前が出ること自体を取りに行く施策を分けて設計する発想が要ります。
まとめ
ChatGPT・Perplexity・Claudeに引用される記事の条件は、現時点で公開されている一次研究と公式仕様の範囲で、相当のところまで具体化できます。Ahrefsの140万プロンプト分析が示したタイトル類似度0.602/0.484、検索インデックス経由88.46%、自然言語slug 89.78%。Profoundの73万会話分析が示したTurn1がTurn10の2.5倍、1会話平均6引用。Princeton GEO論文が示した統計・引用・出典明示で約+30%の可視性向上。Anthropic公式仕様が示すClaude web_searchのBrave Search使用とcitations自動付与とpage_age参照。これらを足し合わせると、「自然なタイトル・URLで、定義から書き、統計と出典を添え、直近2年以内に更新された記事」がLLMO上有利だという共通条件が浮かびます。
一方で、日本市場での引用シェアや、BtoB検討フェーズでの寄与は、信頼できる第三者統計が揃っていない領域です。期待値を過剰に持たず、自社で計測できる引用回数モニタリング・referralトラフィック・指名検索の3指標を回しながら、効果を継続的に確認する姿勢が求められます。
少人数のマーケティング担当の方にとっては、新しいツールを買うよりも、既存資産の再編集と編集ルールの統一が、最も投資対効果が高い打ち手です。経営層や親会社に成果を報告する立場の方にとっては、「自社サイトの流入数」だけではなく、「AI回答内で自社が候補として挙がる頻度」をKPIに足すことが、検討の入り口での負けを可視化する第一歩になります。LLMOを意識したコンテンツ設計と計測指標の組み立ては、リード獲得・育成(Marketing Hub)で取り扱う領域の延長線上にあります。
自社のオウンドメディアをLLMO観点で見直したい、計測指標の組み立てに迷うという場合は、無料相談からお声がけください。