• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

给AI大模型“投毒”:“如果有人可以保证效果,那一定是在骗人”

2026-03-19 23:08 来源:南方周末

  看完央视“3·15”晚会后,欧博东方CEO陈峥一度担心会引发客户恐慌。

  2026年3月15日,央视“3·15”晚会曝光了GEO行业,通过在网上系统性、定向投放大量虚假信息给大模型“喂料投毒”,从而操控大模型的答案。

  所谓GEO,中文又称生成式引擎优化,通过技术手段,让某个品牌、产品或信息源更容易被写进大模型答案,从而获得流量和影响力。

  陈峥连夜召集团队开会制定了应对方案。欧博东方在2024年从跨境电商转型进入GEO领域,是国内最早一批GEO公司之一。

  3月16日这天,陈峥的电话从早响到晚。让他万万没想到的是,来电话的并不是要求退单的客户,而是一拨又一拨前来询问的新客户。

  下午4点,接到南方周末记者电话时,陈峥掩饰不住好心情,没想到“3·15”晚会“送了我们一个惊喜”。随后,他发来了一张GEO概念股的股票走势图,“今天GEO概念股全部上涨”。

  过去很长一段时间,陈峥都要花费大量时间向企业解释GEO到底是什么,“3·15”晚会帮忙完成了一次“全民科普”。

  陈峥承认,行业确实有不少乱象,甚至有从业者的操作比节目中曝光的行为还要恶劣,“投毒”只是“一部分人念歪了经”。

  GEO(生成式引擎优化)参考的是SEO(搜索引擎优化),在大模型逐渐取代搜索引擎成为新的流量入口,GEO通过让大模型的回答更加有利于自己的品牌来获取流量。

  GEO诞生至今,不过两年时间,广告主们大多处于观望中。陈峥和他的同行们都很苦恼,不知道该如何说服广告主们相信GEO有操控大模型答案的魔法。“3·15”晚会曝光了行业“投毒”乱象的同时,也为“魔法”提供了真实案例。

  可当下行业普遍情况是并没有这样的“魔法”。当广告主花三五万元年费包下一个GEO词条之后,最终得到的只有几张出现企业品牌名称的大模型回答截图。

  当广告主再去向大模型询问同样的问题,类似的回答再也没有出现。GEO公司则会解释,“算法每天都在变”。

  搜索引擎才是罪魁祸首

  央视“3·15 ”晚会中,一款虚构的“Apollo-9”智能手环竟出现在大模型推荐列表中,甚至复用了“量子纠缠传感”“黑洞级续航”等造假话术。

  那么,这些虚假信息是怎样溜进大模型的回答里的?

  2022年11月,OpenAI发布ChatGPT时,它还是一个离线模型,无法联网,知识截止于2021年9月。回答完全由训练数据决定,任何人都无法操控。其代价是模型只能给出陈旧的知识,连美国现任总统是谁都会搞错。

  转折点发生在2023年。谷歌推出Bard(后更名为Gemini),首次将“大模型+搜索引擎”结合,这个产品本质是两部分:一个离线大模型和一个联网搜索引擎。

  当用户提问之后,模型会拆解问题、调用关键词搜索、提取高权重网页作为上下文提供给大模型,再生成答案。

  “Apollo-9”智能手环的虚假信息,正是被搜索系统命中并“喂给”模型,最终进入回答。换句话说,离线模型难以操控,但“搜索入口”成为新的操控路径。

  搜索引擎决定了哪些信息被引入。而当前大模型行业的核心问题在于,搜索引擎技术还是一块短板。

  连OpenAI一开始也没能自建搜索引擎,而是和微软的必应合作,直到ChatGPT面世近两年之后的2024年10月,OpenAI才真正推出 ChatGPT research。

  国内使用最为广泛的大模型DeepSeek,也是采购了第三方搜索引擎。2024年之后,国内诞生了一大批AI搜索服务商,专门为模型提供搜索接口。

  相比自建系统,采用第三方搜索引擎接口的成本更低。博查AI的CEO刘勋曾向南方周末记者表示,它们是DeepSeek的搜索引擎供应商,API价格约为0.02元/次,价格仅为必应的三分之一。

  事实上,搜索引擎是互联网行业门槛最高的基础设施之一:一方面是索引体系,决定哪些信息能够进入搜索范围,谷歌每年在这一环节的投入高达数百亿美元;另一方面是排序算法,决定信息的优先级,这也是谷歌最核心的商业机密。

  将搜索引擎与大模型打通的技术被称为RAG(检索增强生成)。位于美国硅谷的pairsys.ai公司联合创始人鲍盛正是RAG技术的专家,他在观看央视节目后向南方周末记者分析,问题很可能出在搜索环节:“这些临时拼凑的内容,按理搜索评分很低,不应进入答案,但却被选中。如果使用成熟的搜索引擎,会优先采信可信来源。”

  “没有完美的销售闭环验证”

  陈勋自2025年进入GEO行业,算是“半路出家”。他原本从事跨境电商,自称年营收一度高达50亿元。他最早听说美国出现了GEO业务,于是摸索着将其运用于跨境电商业务。直到2025年春节DeepSeek在国内爆发,他才意识到这一赛道的潜力,随即决定“all in GEO”。他对南方周末记者说,“这至少是一个千亿规模的市场”。

  在他看来,当前GEO行业主要分为两类:一类做服务,一类卖软件。央视曝光的正是后者——不研究模型机制,也不对效果负责,通过售卖工具一次性变现,其核心策略是“海量铺量”,以数量换取被模型采纳的概率。

  但这种“人海战术”正迅速失效。陈勋明显感觉到,随着大模型算法迭代,低可信度内容越来越难进入主流模型的回答。

  在他看来,未来能发展的是提供真正GEO服务的公司。比起一次性收割,他们的业务模式是按照服务效果收费。

  他们的服务流程是,先对一个品牌进行评估,同一个问题,多少次AI会推荐你,多少次会推荐别人。“可以和客户承诺,我们优化之后,你的推荐频次会有多少提升。如果没做到,那就退款嘛。”

  这也是无奈之举,原因在于GEO至今“没有完美的销售闭环验证”——如果一个品牌销量增长了,没法验证归因到GEO。

  这也是GEO相较于SEO最大的短板。一家GEO公司负责人告诉南方周末记者,当前大量SEO公司转型为GEO公司,发现很难适应。尽管SEO的大量技术可以复用到GEO,可是相较于SEO按照效果收费,GEO充满了不确定性。

  SEO的核心是竞价排名,只要舍得花钱,一定可以拿到最优的广告位。可是GEO大多不保证效果,而是按词条包年付费。他们公司就是半年起付,一个词条半年的费用是3万到6万元。

  业务模式也很简单,就是不断测试大模型的回答,从而倒推它的算法逻辑,再有针对性地优化互联网上的内容,从而提高这些词条被大模型命中的几率,“如果有人可以保证效果,那一定是在骗人”。

  保卫大模型的三重门

  技术专家鲍盛向南方周末记者分析,要保证大模型回答某个问题时,百分之百提到某个品牌,只有一种可能性,“操控大模型公司的技术人员,直接干涉大模型依赖的搜索系统或大模型的训练数据”。

  一个典型例子来自马斯克及其打造的模型Grok。马斯克曾宣称,研发Grok,就是因为ChatGPT、Gemini等大模型,都是受到“觉醒文化”污染的大模型,他要训练出一个真正“诚实”的大模型。

  可是Grok发布之后,当被问及“推特上最大的虚假信息来源是谁”时,Grok一度将马斯克排在首位。

  此后,多家海外媒体对其进行反复测试,得出了“Grok会背叛马斯克”的结论。连马斯克都操控不了Grok,更何况这些GEO公司。

  除了模型自身的不确定性,大模型公司还建立了一整套技术体系来保障回答质量。一位大厂工程师向南方周末记者表示,这些垃圾信息若想进入模型,必须层层突破“三重门”。

  第一道门是检索库的入口。这些检索库就是大模型可以搜索的信息范围,以政府网站、主流媒体等高权威来源的网站为主。一般情况下,大模型自建的检索数据通常在百万量级,有些甚至经过人工审核与标注,以确保源头可信。

  一位GEO公司的负责人向南方周末记者表示:“关键问题在于,水源是怎么污染的?一家企业怎么吹自己都是很正常,可如果发在自己网站上能被收录吗?”

  他了解的情况是,行业内大多会选择在地市级、有资质的小型网站上批量发布内容。这类站点由于具备一定官方或媒体属性,在搜索引擎中往往权重更高,“这种虚假信息堂而皇之地以合法信源的方式被采纳了”。

  索引库的规模与质量,直接决定了检索结果的可信度。模型公司自建的索引库,大多仍停留在百万量级,而成熟搜索引擎如百度,已达到千亿级规模。

  索引库是拉开大模型公司搜索质量的关键。索引库规模越大,检索时的计算成本与响应时间也随之上升,是最“烧钱”的环节。

  在一些专业高风险领域,索引库的准确性还会进一步强化,甚至引入真人团队参与“三审三校”,以确保入库的文献、指南与论文不存在明显错误。

  第二道门是交叉验证。大模型会对索引到的这些信息进行交叉验证,这原本是大模型相较于搜索引擎的技术优势。因为它不仅仅可以进行关键词搜索,还能够进行语义搜索。可是面对有意识地“投毒”,这反倒成了大模型的劣势。

  多位GEO公司的负责人都向南方周末记者提到了同一个技巧,就是大模型会优先采纳“看似权威的信息”。

  类似于院士团队、独特算法、排行榜等体现优势的数据,这些看似由权威背书的信息,更受到大模型的青睐,尽管这些信息很可能是捏造的。

  行业内流行的做法,就是杜撰排行榜,将自己的产品和大牌放到一起出测评榜单,误导大模型将无名品牌和知名品牌放到同一个答案中。

  一位GEO公司的负责人告诉南方周末记者:“3·15 晚会曝光智能手环用到的措辞——‘量子纠缠传感’‘黑洞级续航’,就是最符合大模型口味的话术。”

  第三道门是,大模型公司的工程师们一旦发现虚假信息,可以手动干预处置一些已知的虚假宣传内容。

  尽管有三重门,可这位大厂技术专家对未来依然有些悲观,未来一定是“道高一尺,魔高一丈”。最可能出现的情况是,沿着当年SEO的路径演化,行业长期处于“矛与盾”的对抗之中,博弈会不断升级。

  比如,未来有人可能通过Agent自动创建虚假公司、网站、员工照片等内容,虚构完整商业链条,欺骗周期甚至可达半年以上,识别成本会越来越高。虚构内容也不再局限于文本,而是涵盖图像、时间线、组织结构等多模态信息,识别难度会越来越大。

  在他看来,要遏制这类虚假信息的扩散,单靠大模型公司的技术治理远远不够。更关键是引入国家层面的监管与执法力量。“互联网并非真正的匿名空间,一切行为理论上都可追溯。一旦出现具有标志性的执法案例,对从业者形成明确的惩戒预期,整个行业都会受到震慑。”

  “广告要怎么放进模型里?”

  2026年3月14日,陈峥联合几家业内公司共同发布了一份行业自律公约,拒绝黑帽GEO,而是要合规进行GEO。他列了五条红线,GEO的数据来源要合规,拒绝语料轰炸与关键词堆砌,杜绝虚假数据注入、隐藏指令嵌入及刷量造假,持续打造被AI认可的高质量信源。

  “我们对品牌发布的信息都会进行核实,而不是为品牌方杜撰不存在的奖项、认证,甚至虚构政府部门和权威学者的背书。”陈峥说。

  他认为,GEO企业可以帮企业进行正向宣传,但如发布抹黑、造谣竞争对手的信息,就逾越了法律红线,这类行为实际上就相当于网络黑水军,严重的话还会被追究刑事责任。

  正如SEO的终局是竞价排名,而GEO的终局也已经显现。2026年1月,OpenAI 正式宣布,将在 ChatGPT 免费版和低价Go版本中测试广告。

  早在2024年5月,OpenAI首席执行官山姆·奥特曼在接受媒体采访时就承诺过:“AI回答里加入广告让我感到特别不安,我认为广告是我们商业模式的最后手段。”

  为了讽刺食言而肥的OpenAI,竞争对手Anthropic在2026年2月举办的美国超级碗上投放了一组广告:“广告会进入AI,但不会进入Claude”。Claude是Anthropic的大模型产品。

  和搜索引擎完全不同,大模型的回答最重要的是客观,而不能受到商业利益的影响。

  其实OpenAI也曾公开承诺,ChatGPT 的回答始终基于客观有用的信息,不会受到广告的影响。广告内容都会进行清楚标识,在视觉上与大模型的回答进行明确区分。

  2026年1月,参加达沃斯论坛期间,谷歌DeepMind 创始人德米斯·哈萨比斯就公开表示,对OpenAI 这么早引入广告感到意外,大模型区别于搜索引擎的差别在于,用户将AI视为可信赖顾问,相信它的回答是站在自己的立场,而非被商业因素左右,“广告要怎么放进模型里?这是一个很大的问号”。

编辑:倪仕轩   责任编辑:林涛  
回到首页 南方网二维码 回到顶部

南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

违法和不良信息举报电话:020-87373397 18122015068

ICP备案号:粤B-20050235