如何在 AI 搜索时代被引用:一份基于最新研究的实操指南
2026-05-0100:46
perseus AI insight
2026-05-01 00:46
perseus AI insight
2026-05-01 00:46
收藏文章
订阅专栏

过去三十年里,"搜索引擎可见性"几乎等同于"Google 排名第一"。这个等式正在 2025 到 2026 年之间静悄悄失效。Pew Research Center 的实地研究记录到一个临界变化——当 Google 在结果页顶部显示 AI Overview 时,用户点击外部链接的比例从 15% 降到 8%,约 26% 的此类搜索以 zero-click 结束 [1]。换句话说,越来越多的查询在 AI 给出合成答案的瞬间就完成了,再也没有"排名第一的链接"什么事。

这种位移在引用层面更剧烈。Brandlight 的追踪数据显示,Google 顶部链接和 AI 引用源的重合度已经从 70% 跌到 20% 以下 [2]。ConvertMate 跨 8000 个域名、12500 个查询的基准研究则发现一个更具冲击力的数字:83% 的 AI Overview 引用来自传统排名前 10 之外的页面 [3]。这意味着 SEO 时代积累的 domain authority 在 AI 时代被部分 reset 了——这既是威胁,也是窗口。

与此同时,AI 搜索的用户基数已经不容忽视。Pew 的另一份调查显示,截至 2025 年中,34% 的美国成年人用过 ChatGPT,是 2023 年的两倍 [4];Perplexity 在 2025 年 5 月披露月查询量达到 7.8 亿 [5]。要在这个新格局中保持可见,需要同时理解两件事:内容怎么写,以及内容应该被谁引用。


底层机制:检索 - 合成的两阶段管道

要谈优化,先要看清这些系统是怎么工作的。LLM 答案引擎大致分两步走:先把用户的查询 fan-out 成若干子查询,从索引或实时搜索中拉回候选 chunks(这是 retrieval 阶段);再让模型基于这些候选合成一段答案,并在合成过程中决定引用谁、如何 justify 推荐(这是 synthesis 阶段)。

GEO 和 AEO 的优化必须同时作用于这两层,但这里有个关键的不对称。University of Toronto 的研究团队 2025 年发表的大规模对照实验揭示,source selection 阶段就已经完成了大部分筛选——AI search 在源类型层面就把 Social 几乎完全排除了。在消费电子类目下,GPT 给出的引用 92.1% 是 Earned media,Social 接近零;汽车类目下 GPT 是 81.9% Earned 和 18.1% Brand,Social 同样为零 [6]。这与 Google 形成鲜明对比,后者在同一类目下保持着 Brand、Earned、Social 的三方平衡。

含义很直接:你在 Reddit 上的存在感再强,对 ChatGPT 的引用率几乎没有帮助;反过来,进入 TechRadar 或 Consumer Reports 这一档的编辑媒体,回报会被 AI 引擎反复放大。


内容层:Princeton 的实证结论

2024 年 KDD 上 Princeton、Georgia Tech、Allen Institute 与 IIT Delhi 联合发表的论文 GEO: Generative Engine Optimization 是这个领域的奠基性工作。研究者测试了九种内容优化方法对生成引擎可见性的影响,得出了几个相当反直觉的结论 [7]。

最强的三种方法——Cite Sources、Quotation Addition、Statistics Addition——在 Position-Adjusted Word Count 指标上提升 30 到 40%,在 Subjective Impression 指标上提升 15 到 30%。最强的组合是 Fluency Optimization 加 Statistics Addition,比任何单一方法多 5.5%。而最值得中小站点关注的一点是:低排名站点的提升最显著,部分案例达到 115%。这意味着传统 SEO 中你需要先攒够 domain authority 才能进场竞争,而 GEO 中内容结构本身就是一个可以独立操作的杠杆,不需要先做一年外链建设。

这些发现落到具体动作上,方向是清晰的。把定性描述系统性替换成定量陈述:写"许多公司采用了 X"是给 LLM 一个空信号;写"截至 2025 Q4,财富 500 中有 67% 部署了 X"才是引用候选。引用领域专家或权威机构的原话并附带归属,这增加了 LLM 在 synthesis 阶段判断 authenticity 的依据。在内容内嵌指向 .edu、.gov、同行评议论文的链接,这是 LLM 训练时被反复强化的可信度信号。最后,可读性差的文本即使信息密度高也会被 deprioritize——这一点反直觉但实证支持。


源生态层:Toronto 的引擎差异研究

如果说 Princeton 回答的是"怎么写",那么 Toronto 团队回答的是"放在哪里、被谁引用"。这是同样重要、但常被中文 SEO 圈忽视的一层。

Toronto 论文对 ChatGPT、Claude、Perplexity、Gemini 做了系统性对照,几个对策略最重要的发现都指向同一个结论:引擎之间的差异,比类目和用户 persona 之间的差异更大。在银行业查询上,Gemini 的 brand 占比经常超过 50%,而 Claude 和 ChatGPT 则极端 earned-heavy,整体大约是 64.6% Earned、34.1% Brand、1.2% Social [6]。这意味着任何 one-size-fits-all 的 GEO 策略基本无效——为 ChatGPT 优化的内容部署到 Gemini 上可能会失效,反之亦然。

跨语言行为的分化更让人意外。Claude 在不同语言下倾向复用同一套英语 authority domains(cross-language domain Jaccard overlap 显著高于 Google);GPT 则几乎完全切换到本地语言生态,跨语言重叠率接近零;Perplexity 和 Gemini 介于两者之间。对一个想同时进入中文和英文市场的品牌来说,这意味着 Claude 的可见性靠英语 earned media 就能 carry,而 GPT 的中文可见性必须靠攻入中文媒体生态独立解决。

另一个对小品牌至关重要的发现是 Big Brand Bias 的真实存在。在无品牌限定的查询下,ChatGPT 给出的 56.3% 是市场领导品牌,Perplexity 是 67.9%。Niche brand 想被 AI 引用,必须 over-invest 在垂直领域的深度内容和精准 earned media 投放——这不是策略偏好问题,是对系统性偏置的对冲。

最后两个发现也值得记住:paraphrase(改写查询的措辞)对引用品牌列表影响很小,但 language(切换语言)会显著改变整个证据生态;niche 类目还存在新鲜度盲区——Claude 在汽车类目引用文章的平均年龄约 331 天(中位数 148 天),明显落后于消费电子类目,这意味着特定垂直存在"陈旧引用"问题,新内容反而是机会窗口。


落地:从原则到具体动作

技术层面的第一道关,是确认 AI 爬虫能进得来。最常见的失败模式是 robots.txt 阻止 AI 爬虫——Cloudflare 在 2025 年把默认配置改成了屏蔽 AI bot,导致很多站点在不知情的情况下被切断 [2]。先把 GPTBot、ClaudeBot、PerplexityBot、Google-Extended 加入白名单。接下来部署 llms.txt 和 llms-full.txt,根据行业内的实测数据这能让爬取频率提升 5 到 10 倍 [8]。

内容结构层面,最重要的是把每个 section 改造成可以独立成立的 Answer Block。在 section 顶部放 40 到 60 词的精简答案——AEO 实践者称之为"50-Word Rule" [9]。AI 引擎通常只抽取前 1 到 2 句判断这个 section 是否回答了查询,开头如果是铺垫性的"在今天瞬息万变的数字时代……",等于直接把流量让给竞品。

更深一层是 justification asset 的概念。AI search 在做的事情不是返回十条蓝色链接,而是合成一份 shortlist——所以内容必须显式包含可被抽取的 justification attributes:comparison table、pros/cons list、bolded value proposition("最长电池续航"、"最适合小厨房")。把自己的网站当成一组 API for AI agents 来设计,而不是当成一份给人看的杂志。

Schema 标记是这个思路的技术实现。FAQ schema、HowTo schema、Article schema 是基本盘;更深一层是 entity optimization——确保品牌、产品、作者作为实体能在知识图谱中被解析。添加 author schema(尤其是专家作者)已经被实证可以提升旧内容的引用率 [10]。

但所有这些都比不上一件事:earned media 投资。Toronto 论文最强的 implication 就是这个——与其在 owned content 上堆资源,不如系统性攻入垂直领域的 top-tier publisher。金融垂直里 Bankrate 和 NerdWallet 是 anchor,消费电子是 TechRadar、Tom's Guide、RTINGS,汽车是 Car and Driver、Edmunds、Consumer Reports。这些是 AI 引擎反复 fall back 的引用源,进入这一档媒体的回报会被反复复用。

具体到不同引擎,策略需要分化。Perplexity 包含较多 YouTube 和零售域名,意味着视频内容投资和零售页面 listing 准确性都会有回报。Claude 和 ChatGPT 极端 earned-heavy,意味着 owned content 的边际回报很低,资源应该集中在 top-tier 编辑媒体。Gemini 相对 brand-friendly,意味着自有内容的深度建设加严格 schema 是有效的。多语言市场则需要按引擎、按地区分别审计 authority landscape,不能用单一策略覆盖。


测量:从 referral 到 citation tracking

GA4 看 referral 流量(chatgpt.com、perplexity.ai、gemini.google.com)只是起点。真正能反映 AI 时代可见性的指标是 citation tracking:跨平台定期 query 目标关键词,记录被引用的频次。但这件事比想象中难——在一项涉及 80000 prompt 的研究中,月度引用波动很大,今天被引用的内容下个月可能就不会 [10]。这意味着 GEO 不是一次性项目,而是一个需要持续监测和迭代的工程。


结语

如果要把这篇文章压缩成一句话,那就是:GEO/AEO 不是 SEO 的替代品,而是它的合成层补丁。Princeton 论文回答的是"怎么写"——statistics、quotations、citations、fluency 这些内容工程;Toronto 论文回答的是"放在哪、被谁引用"——earned media 是 anchor,每个引擎需要单独打。这两者结合,才是 2026 年完整的可见性 playbook。

83% 的 AI 引用来自传统前 10 之外,这意味着 domain authority 在 AI 时代被部分重置了。先动的人占便宜,但窗口会越来越窄。


Sources


[1] Pew Research Center (2025). Google users are less likely to click on links when an AI summary appears in the results. https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/

[2] LLMrefs (2026). Generative Engine Optimization (GEO): The 2026 Guide to AI Search Visibility. https://llmrefs.com/generative-engine-optimization

[3] ConvertMate (2026). GEO Benchmark Study 2026: What Actually Drives Visibility in Generative Search. https://www.convertmate.io/research/geo-benchmark-2026

[4] Pew Research Center (2025). About a third of U.S. adults have used ChatGPT; usage has increased over the past year. https://www.pewresearch.org/short-reads/2025/06/25/34-of-us-adults-have-used-chatgpt-about-double-the-share-in-2023/

[5] Perplexity AI (2025). CEO says Perplexity hit 780M queries in May 2025.

[6] Chen, M., Wang, X., Chen, K., & Koudas, N. (2025). Generative Engine Optimization: How to Dominate AI Search. arXiv:2509.08919. https://arxiv.org/abs/2509.08919

[7] Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735. https://arxiv.org/abs/2311.09735

[8] Amsive (2025). Answer Engine Optimization (AEO): Your Complete Guide to AI Search Visibility. https://www.amsive.com/insights/seo/answer-engine-optimization-aeo-evolving-your-seo-strategy-in-the-age-of-ai-search/

[9] Cubitrek (2026). AEO 101: The Definitive Guide to Answer Engine Optimization in 2026. https://cubitrek.com/blog/aeo-101-answer-engine-optimization-guide/

[10] Frase.io (2026). What is Generative Engine Optimization (GEO)? 2026 Guide. https://www.frase.io/blog/what-is-generative-engine-optimization-geo

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

专栏文章
查看更多
数据请求中

推荐专栏

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

Download QR Code