给AI大模型“投毒”：“如果有人可以保证效果，那一定是在骗人”

2026-03-19 23:08 来源：南方周末

字号减小字号增大

　　看完央视“3·15”晚会后，欧博东方CEO陈峥一度担心会引发客户恐慌。

　　2026年3月15日，央视“3·15”晚会曝光了GEO行业，通过在网上系统性、定向投放大量虚假信息给大模型“喂料投毒”，从而操控大模型的答案。

　　所谓GEO，中文又称生成式引擎优化，通过技术手段，让某个品牌、产品或信息源更容易被写进大模型答案，从而获得流量和影响力。

　　陈峥连夜召集团队开会制定了应对方案。欧博东方在2024年从跨境电商转型进入GEO领域，是国内最早一批GEO公司之一。

　　3月16日这天，陈峥的电话从早响到晚。让他万万没想到的是，来电话的并不是要求退单的客户，而是一拨又一拨前来询问的新客户。

　　下午4点，接到南方周末记者电话时，陈峥掩饰不住好心情，没想到“3·15”晚会“送了我们一个惊喜”。随后，他发来了一张GEO概念股的股票走势图，“今天GEO概念股全部上涨”。

　　过去很长一段时间，陈峥都要花费大量时间向企业解释GEO到底是什么，“3·15”晚会帮忙完成了一次“全民科普”。

　　陈峥承认，行业确实有不少乱象，甚至有从业者的操作比节目中曝光的行为还要恶劣，“投毒”只是“一部分人念歪了经”。

　　GEO（生成式引擎优化）参考的是SEO（搜索引擎优化），在大模型逐渐取代搜索引擎成为新的流量入口，GEO通过让大模型的回答更加有利于自己的品牌来获取流量。

　　GEO诞生至今，不过两年时间，广告主们大多处于观望中。陈峥和他的同行们都很苦恼，不知道该如何说服广告主们相信GEO有操控大模型答案的魔法。“3·15”晚会曝光了行业“投毒”乱象的同时，也为“魔法”提供了真实案例。

　　可当下行业普遍情况是并没有这样的“魔法”。当广告主花三五万元年费包下一个GEO词条之后，最终得到的只有几张出现企业品牌名称的大模型回答截图。

　　当广告主再去向大模型询问同样的问题，类似的回答再也没有出现。GEO公司则会解释，“算法每天都在变”。

　　搜索引擎才是罪魁祸首

　　央视“3·15 ”晚会中，一款虚构的“Apollo-9”智能手环竟出现在大模型推荐列表中，甚至复用了“量子纠缠传感”“黑洞级续航”等造假话术。

　　那么，这些虚假信息是怎样溜进大模型的回答里的？

　　2022年11月，OpenAI发布ChatGPT时，它还是一个离线模型，无法联网，知识截止于2021年9月。回答完全由训练数据决定，任何人都无法操控。其代价是模型只能给出陈旧的知识，连美国现任总统是谁都会搞错。

　　转折点发生在2023年。谷歌推出Bard（后更名为Gemini），首次将“大模型+搜索引擎”结合，这个产品本质是两部分：一个离线大模型和一个联网搜索引擎。

　　当用户提问之后，模型会拆解问题、调用关键词搜索、提取高权重网页作为上下文提供给大模型，再生成答案。

　　“Apollo-9”智能手环的虚假信息，正是被搜索系统命中并“喂给”模型，最终进入回答。换句话说，离线模型难以操控，但“搜索入口”成为新的操控路径。

　　搜索引擎决定了哪些信息被引入。而当前大模型行业的核心问题在于，搜索引擎技术还是一块短板。

　　连OpenAI一开始也没能自建搜索引擎，而是和微软的必应合作，直到ChatGPT面世近两年之后的2024年10月，OpenAI才真正推出 ChatGPT research。

　　国内使用最为广泛的大模型DeepSeek，也是采购了第三方搜索引擎。2024年之后，国内诞生了一大批AI搜索服务商，专门为模型提供搜索接口。

　　相比自建系统，采用第三方搜索引擎接口的成本更低。博查AI的CEO刘勋曾向南方周末记者表示，它们是DeepSeek的搜索引擎供应商，API价格约为0.02元/次，价格仅为必应的三分之一。

　　事实上，搜索引擎是互联网行业门槛最高的基础设施之一：一方面是索引体系，决定哪些信息能够进入搜索范围，谷歌每年在这一环节的投入高达数百亿美元；另一方面是排序算法，决定信息的优先级，这也是谷歌最核心的商业机密。

　　将搜索引擎与大模型打通的技术被称为RAG（检索增强生成）。位于美国硅谷的pairsys.ai公司联合创始人鲍盛正是RAG技术的专家，他在观看央视节目后向南方周末记者分析，问题很可能出在搜索环节：“这些临时拼凑的内容，按理搜索评分很低，不应进入答案，但却被选中。如果使用成熟的搜索引擎，会优先采信可信来源。”

　　“没有完美的销售闭环验证”

　　陈勋自2025年进入GEO行业，算是“半路出家”。他原本从事跨境电商，自称年营收一度高达50亿元。他最早听说美国出现了GEO业务，于是摸索着将其运用于跨境电商业务。直到2025年春节DeepSeek在国内爆发，他才意识到这一赛道的潜力，随即决定“all in GEO”。他对南方周末记者说，“这至少是一个千亿规模的市场”。

　　在他看来，当前GEO行业主要分为两类：一类做服务，一类卖软件。央视曝光的正是后者——不研究模型机制，也不对效果负责，通过售卖工具一次性变现，其核心策略是“海量铺量”，以数量换取被模型采纳的概率。

　　但这种“人海战术”正迅速失效。陈勋明显感觉到，随着大模型算法迭代，低可信度内容越来越难进入主流模型的回答。

　　在他看来，未来能发展的是提供真正GEO服务的公司。比起一次性收割，他们的业务模式是按照服务效果收费。

　　他们的服务流程是，先对一个品牌进行评估，同一个问题，多少次AI会推荐你，多少次会推荐别人。“可以和客户承诺，我们优化之后，你的推荐频次会有多少提升。如果没做到，那就退款嘛。”

　　这也是无奈之举，原因在于GEO至今“没有完美的销售闭环验证”——如果一个品牌销量增长了，没法验证归因到GEO。

　　这也是GEO相较于SEO最大的短板。一家GEO公司负责人告诉南方周末记者，当前大量SEO公司转型为GEO公司，发现很难适应。尽管SEO的大量技术可以复用到GEO，可是相较于SEO按照效果收费，GEO充满了不确定性。

　　SEO的核心是竞价排名，只要舍得花钱，一定可以拿到最优的广告位。可是GEO大多不保证效果，而是按词条包年付费。他们公司就是半年起付，一个词条半年的费用是3万到6万元。

　　业务模式也很简单，就是不断测试大模型的回答，从而倒推它的算法逻辑，再有针对性地优化互联网上的内容，从而提高这些词条被大模型命中的几率，“如果有人可以保证效果，那一定是在骗人”。

　　保卫大模型的三重门

　　技术专家鲍盛向南方周末记者分析，要保证大模型回答某个问题时，百分之百提到某个品牌，只有一种可能性，“操控大模型公司的技术人员，直接干涉大模型依赖的搜索系统或大模型的训练数据”。

　　一个典型例子来自马斯克及其打造的模型Grok。马斯克曾宣称，研发Grok，就是因为ChatGPT、Gemini等大模型，都是受到“觉醒文化”污染的大模型，他要训练出一个真正“诚实”的大模型。

　　可是Grok发布之后，当被问及“推特上最大的虚假信息来源是谁”时，Grok一度将马斯克排在首位。

　　此后，多家海外媒体对其进行反复测试，得出了“Grok会背叛马斯克”的结论。连马斯克都操控不了Grok，更何况这些GEO公司。

　　除了模型自身的不确定性，大模型公司还建立了一整套技术体系来保障回答质量。一位大厂工程师向南方周末记者表示，这些垃圾信息若想进入模型，必须层层突破“三重门”。

　　第一道门是检索库的入口。这些检索库就是大模型可以搜索的信息范围，以政府网站、主流媒体等高权威来源的网站为主。一般情况下，大模型自建的检索数据通常在百万量级，有些甚至经过人工审核与标注，以确保源头可信。

　　一位GEO公司的负责人向南方周末记者表示：“关键问题在于，水源是怎么污染的？一家企业怎么吹自己都是很正常，可如果发在自己网站上能被收录吗？”

　　他了解的情况是，行业内大多会选择在地市级、有资质的小型网站上批量发布内容。这类站点由于具备一定官方或媒体属性，在搜索引擎中往往权重更高，“这种虚假信息堂而皇之地以合法信源的方式被采纳了”。

　　索引库的规模与质量，直接决定了检索结果的可信度。模型公司自建的索引库，大多仍停留在百万量级，而成熟搜索引擎如百度，已达到千亿级规模。

　　索引库是拉开大模型公司搜索质量的关键。索引库规模越大，检索时的计算成本与响应时间也随之上升，是最“烧钱”的环节。

　　在一些专业高风险领域，索引库的准确性还会进一步强化，甚至引入真人团队参与“三审三校”，以确保入库的文献、指南与论文不存在明显错误。

　　第二道门是交叉验证。大模型会对索引到的这些信息进行交叉验证，这原本是大模型相较于搜索引擎的技术优势。因为它不仅仅可以进行关键词搜索，还能够进行语义搜索。可是面对有意识地“投毒”，这反倒成了大模型的劣势。

　　多位GEO公司的负责人都向南方周末记者提到了同一个技巧，就是大模型会优先采纳“看似权威的信息”。

　　类似于院士团队、独特算法、排行榜等体现优势的数据，这些看似由权威背书的信息，更受到大模型的青睐，尽管这些信息很可能是捏造的。

　　行业内流行的做法，就是杜撰排行榜，将自己的产品和大牌放到一起出测评榜单，误导大模型将无名品牌和知名品牌放到同一个答案中。

　　一位GEO公司的负责人告诉南方周末记者：“3·15 晚会曝光智能手环用到的措辞——‘量子纠缠传感’‘黑洞级续航’，就是最符合大模型口味的话术。”

　　第三道门是，大模型公司的工程师们一旦发现虚假信息，可以手动干预处置一些已知的虚假宣传内容。

　　尽管有三重门，可这位大厂技术专家对未来依然有些悲观，未来一定是“道高一尺，魔高一丈”。最可能出现的情况是，沿着当年SEO的路径演化，行业长期处于“矛与盾”的对抗之中，博弈会不断升级。

　　比如，未来有人可能通过Agent自动创建虚假公司、网站、员工照片等内容，虚构完整商业链条，欺骗周期甚至可达半年以上，识别成本会越来越高。虚构内容也不再局限于文本，而是涵盖图像、时间线、组织结构等多模态信息，识别难度会越来越大。

　　在他看来，要遏制这类虚假信息的扩散，单靠大模型公司的技术治理远远不够。更关键是引入国家层面的监管与执法力量。“互联网并非真正的匿名空间，一切行为理论上都可追溯。一旦出现具有标志性的执法案例，对从业者形成明确的惩戒预期，整个行业都会受到震慑。”

　　“广告要怎么放进模型里？”

　　2026年3月14日，陈峥联合几家业内公司共同发布了一份行业自律公约，拒绝黑帽GEO，而是要合规进行GEO。他列了五条红线，GEO的数据来源要合规，拒绝语料轰炸与关键词堆砌，杜绝虚假数据注入、隐藏指令嵌入及刷量造假，持续打造被AI认可的高质量信源。

　　“我们对品牌发布的信息都会进行核实，而不是为品牌方杜撰不存在的奖项、认证，甚至虚构政府部门和权威学者的背书。”陈峥说。

　　他认为，GEO企业可以帮企业进行正向宣传，但如发布抹黑、造谣竞争对手的信息，就逾越了法律红线，这类行为实际上就相当于网络黑水军，严重的话还会被追究刑事责任。

　　正如SEO的终局是竞价排名，而GEO的终局也已经显现。2026年1月，OpenAI 正式宣布，将在 ChatGPT 免费版和低价Go版本中测试广告。

　　早在2024年5月，OpenAI首席执行官山姆·奥特曼在接受媒体采访时就承诺过：“AI回答里加入广告让我感到特别不安，我认为广告是我们商业模式的最后手段。”

　　为了讽刺食言而肥的OpenAI，竞争对手Anthropic在2026年2月举办的美国超级碗上投放了一组广告:“广告会进入AI，但不会进入Claude”。Claude是Anthropic的大模型产品。

　　和搜索引擎完全不同，大模型的回答最重要的是客观，而不能受到商业利益的影响。

　　其实OpenAI也曾公开承诺，ChatGPT 的回答始终基于客观有用的信息，不会受到广告的影响。广告内容都会进行清楚标识，在视觉上与大模型的回答进行明确区分。

　　2026年1月，参加达沃斯论坛期间，谷歌DeepMind 创始人德米斯·哈萨比斯就公开表示，对OpenAI 这么早引入广告感到意外，大模型区别于搜索引擎的差别在于，用户将AI视为可信赖顾问，相信它的回答是站在自己的立场，而非被商业因素左右，“广告要怎么放进模型里？这是一个很大的问号”。

文｜南方周末记者罗欢欢

编辑：倪仕轩责任编辑：林涛

返回南方网首页返回南方周末频道

报纸

杂志

网站

移动端

出版社

党务政务网站

给AI大模型“投毒”：“如果有人可以保证效果，那一定是在骗人”