如何在 AI 搜索时代被引用：一份基于最新研究的实操指南

2026-05-0100:46

perseus AI insight

2026-05-01 00:46

perseus AI insight

2026-05-01 00:46

收藏文章

订阅专栏

过去三十年里，"搜索引擎可见性"几乎等同于"Google 排名第一"。这个等式正在 2025 到 2026 年之间静悄悄失效。Pew Research Center 的实地研究记录到一个临界变化——当 Google 在结果页顶部显示 AI Overview 时，用户点击外部链接的比例从 15% 降到 8%，约 26% 的此类搜索以 zero-click 结束 [1]。换句话说，越来越多的查询在 AI 给出合成答案的瞬间就完成了，再也没有"排名第一的链接"什么事。

这种位移在引用层面更剧烈。Brandlight 的追踪数据显示，Google 顶部链接和 AI 引用源的重合度已经从 70% 跌到 20% 以下 [2]。ConvertMate 跨 8000 个域名、12500 个查询的基准研究则发现一个更具冲击力的数字：83% 的 AI Overview 引用来自传统排名前 10 之外的页面 [3]。这意味着 SEO 时代积累的 domain authority 在 AI 时代被部分 reset 了——这既是威胁，也是窗口。

与此同时，AI 搜索的用户基数已经不容忽视。Pew 的另一份调查显示，截至 2025 年中，34% 的美国成年人用过 ChatGPT，是 2023 年的两倍 [4]；Perplexity 在 2025 年 5 月披露月查询量达到 7.8 亿 [5]。要在这个新格局中保持可见，需要同时理解两件事：内容怎么写，以及内容应该被谁引用。

底层机制：检索 - 合成的两阶段管道

要谈优化，先要看清这些系统是怎么工作的。LLM 答案引擎大致分两步走：先把用户的查询 fan-out 成若干子查询，从索引或实时搜索中拉回候选 chunks（这是 retrieval 阶段）；再让模型基于这些候选合成一段答案，并在合成过程中决定引用谁、如何 justify 推荐（这是 synthesis 阶段）。

GEO 和 AEO 的优化必须同时作用于这两层，但这里有个关键的不对称。University of Toronto 的研究团队 2025 年发表的大规模对照实验揭示，source selection 阶段就已经完成了大部分筛选——AI search 在源类型层面就把 Social 几乎完全排除了。在消费电子类目下，GPT 给出的引用 92.1% 是 Earned media，Social 接近零；汽车类目下 GPT 是 81.9% Earned 和 18.1% Brand，Social 同样为零 [6]。这与 Google 形成鲜明对比，后者在同一类目下保持着 Brand、Earned、Social 的三方平衡。

含义很直接：你在 Reddit 上的存在感再强，对 ChatGPT 的引用率几乎没有帮助；反过来，进入 TechRadar 或 Consumer Reports 这一档的编辑媒体，回报会被 AI 引擎反复放大。

内容层：Princeton 的实证结论

2024 年 KDD 上 Princeton、Georgia Tech、Allen Institute 与 IIT Delhi 联合发表的论文 GEO: Generative Engine Optimization 是这个领域的奠基性工作。研究者测试了九种内容优化方法对生成引擎可见性的影响，得出了几个相当反直觉的结论 [7]。

最强的三种方法——Cite Sources、Quotation Addition、Statistics Addition——在 Position-Adjusted Word Count 指标上提升 30 到 40%，在 Subjective Impression 指标上提升 15 到 30%。最强的组合是 Fluency Optimization 加 Statistics Addition，比任何单一方法多 5.5%。而最值得中小站点关注的一点是：低排名站点的提升最显著，部分案例达到 115%。这意味着传统 SEO 中你需要先攒够 domain authority 才能进场竞争，而 GEO 中内容结构本身就是一个可以独立操作的杠杆，不需要先做一年外链建设。

这些发现落到具体动作上，方向是清晰的。把定性描述系统性替换成定量陈述：写"许多公司采用了 X"是给 LLM 一个空信号；写"截至 2025 Q4，财富 500 中有 67% 部署了 X"才是引用候选。引用领域专家或权威机构的原话并附带归属，这增加了 LLM 在 synthesis 阶段判断 authenticity 的依据。在内容内嵌指向 .edu、.gov、同行评议论文的链接，这是 LLM 训练时被反复强化的可信度信号。最后，可读性差的文本即使信息密度高也会被 deprioritize——这一点反直觉但实证支持。

源生态层：Toronto 的引擎差异研究

如果说 Princeton 回答的是"怎么写"，那么 Toronto 团队回答的是"放在哪里、被谁引用"。这是同样重要、但常被中文 SEO 圈忽视的一层。

Toronto 论文对 ChatGPT、Claude、Perplexity、Gemini 做了系统性对照，几个对策略最重要的发现都指向同一个结论：引擎之间的差异，比类目和用户 persona 之间的差异更大。在银行业查询上，Gemini 的 brand 占比经常超过 50%，而 Claude 和 ChatGPT 则极端 earned-heavy，整体大约是 64.6% Earned、34.1% Brand、1.2% Social [6]。这意味着任何 one-size-fits-all 的 GEO 策略基本无效——为 ChatGPT 优化的内容部署到 Gemini 上可能会失效，反之亦然。

跨语言行为的分化更让人意外。Claude 在不同语言下倾向复用同一套英语 authority domains（cross-language domain Jaccard overlap 显著高于 Google）；GPT 则几乎完全切换到本地语言生态，跨语言重叠率接近零；Perplexity 和 Gemini 介于两者之间。对一个想同时进入中文和英文市场的品牌来说，这意味着 Claude 的可见性靠英语 earned media 就能 carry，而 GPT 的中文可见性必须靠攻入中文媒体生态独立解决。

另一个对小品牌至关重要的发现是 Big Brand Bias 的真实存在。在无品牌限定的查询下，ChatGPT 给出的 56.3% 是市场领导品牌，Perplexity 是 67.9%。Niche brand 想被 AI 引用，必须 over-invest 在垂直领域的深度内容和精准 earned media 投放——这不是策略偏好问题，是对系统性偏置的对冲。

最后两个发现也值得记住：paraphrase（改写查询的措辞）对引用品牌列表影响很小，但 language（切换语言）会显著改变整个证据生态；niche 类目还存在新鲜度盲区——Claude 在汽车类目引用文章的平均年龄约 331 天（中位数 148 天），明显落后于消费电子类目，这意味着特定垂直存在"陈旧引用"问题，新内容反而是机会窗口。

落地：从原则到具体动作

技术层面的第一道关，是确认 AI 爬虫能进得来。最常见的失败模式是 robots.txt 阻止 AI 爬虫——Cloudflare 在 2025 年把默认配置改成了屏蔽 AI bot，导致很多站点在不知情的情况下被切断 [2]。先把 GPTBot、ClaudeBot、PerplexityBot、Google-Extended 加入白名单。接下来部署 llms.txt 和 llms-full.txt，根据行业内的实测数据这能让爬取频率提升 5 到 10 倍 [8]。

内容结构层面，最重要的是把每个 section 改造成可以独立成立的 Answer Block。在 section 顶部放 40 到 60 词的精简答案——AEO 实践者称之为"50-Word Rule" [9]。AI 引擎通常只抽取前 1 到 2 句判断这个 section 是否回答了查询，开头如果是铺垫性的"在今天瞬息万变的数字时代……"，等于直接把流量让给竞品。

更深一层是 justification asset 的概念。AI search 在做的事情不是返回十条蓝色链接，而是合成一份 shortlist——所以内容必须显式包含可被抽取的 justification attributes：comparison table、pros/cons list、bolded value proposition（"最长电池续航"、"最适合小厨房"）。把自己的网站当成一组 API for AI agents 来设计，而不是当成一份给人看的杂志。

Schema 标记是这个思路的技术实现。FAQ schema、HowTo schema、Article schema 是基本盘；更深一层是 entity optimization——确保品牌、产品、作者作为实体能在知识图谱中被解析。添加 author schema（尤其是专家作者）已经被实证可以提升旧内容的引用率 [10]。

但所有这些都比不上一件事：earned media 投资。Toronto 论文最强的 implication 就是这个——与其在 owned content 上堆资源，不如系统性攻入垂直领域的 top-tier publisher。金融垂直里 Bankrate 和 NerdWallet 是 anchor，消费电子是 TechRadar、Tom's Guide、RTINGS，汽车是 Car and Driver、Edmunds、Consumer Reports。这些是 AI 引擎反复 fall back 的引用源，进入这一档媒体的回报会被反复复用。

具体到不同引擎，策略需要分化。Perplexity 包含较多 YouTube 和零售域名，意味着视频内容投资和零售页面 listing 准确性都会有回报。Claude 和 ChatGPT 极端 earned-heavy，意味着 owned content 的边际回报很低，资源应该集中在 top-tier 编辑媒体。Gemini 相对 brand-friendly，意味着自有内容的深度建设加严格 schema 是有效的。多语言市场则需要按引擎、按地区分别审计 authority landscape，不能用单一策略覆盖。

测量：从 referral 到 citation tracking

GA4 看 referral 流量（chatgpt.com、perplexity.ai、gemini.google.com）只是起点。真正能反映 AI 时代可见性的指标是 citation tracking：跨平台定期 query 目标关键词，记录被引用的频次。但这件事比想象中难——在一项涉及 80000 prompt 的研究中，月度引用波动很大，今天被引用的内容下个月可能就不会 [10]。这意味着 GEO 不是一次性项目，而是一个需要持续监测和迭代的工程。

结语

如果要把这篇文章压缩成一句话，那就是：GEO/AEO 不是 SEO 的替代品，而是它的合成层补丁。Princeton 论文回答的是"怎么写"——statistics、quotations、citations、fluency 这些内容工程；Toronto 论文回答的是"放在哪、被谁引用"——earned media 是 anchor，每个引擎需要单独打。这两者结合，才是 2026 年完整的可见性 playbook。

83% 的 AI 引用来自传统前 10 之外，这意味着 domain authority 在 AI 时代被部分重置了。先动的人占便宜，但窗口会越来越窄。

Sources

[1] Pew Research Center (2025). Google users are less likely to click on links when an AI summary appears in the results. https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/

[2] LLMrefs (2026). Generative Engine Optimization (GEO): The 2026 Guide to AI Search Visibility. https://llmrefs.com/generative-engine-optimization

[3] ConvertMate (2026). GEO Benchmark Study 2026: What Actually Drives Visibility in Generative Search. https://www.convertmate.io/research/geo-benchmark-2026

[4] Pew Research Center (2025). About a third of U.S. adults have used ChatGPT; usage has increased over the past year. https://www.pewresearch.org/short-reads/2025/06/25/34-of-us-adults-have-used-chatgpt-about-double-the-share-in-2023/

[5] Perplexity AI (2025). CEO says Perplexity hit 780M queries in May 2025.

[6] Chen, M., Wang, X., Chen, K., & Koudas, N. (2025). Generative Engine Optimization: How to Dominate AI Search. arXiv:2509.08919. https://arxiv.org/abs/2509.08919

[7] Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735. https://arxiv.org/abs/2311.09735

[8] Amsive (2025). Answer Engine Optimization (AEO): Your Complete Guide to AI Search Visibility. https://www.amsive.com/insights/seo/answer-engine-optimization-aeo-evolving-your-seo-strategy-in-the-age-of-ai-search/

[9] Cubitrek (2026). AEO 101: The Definitive Guide to Answer Engine Optimization in 2026. https://cubitrek.com/blog/aeo-101-answer-engine-optimization-guide/

[10] Frase.io (2026). What is Generative Engine Optimization (GEO)? 2026 Guide. https://www.frase.io/blog/what-is-generative-engine-optimization-geo

【免责声明】市场有风险，投资需谨慎。本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

App Store

Android

推荐专栏

一起「遇见」未来