“请用英文写一段高交会的宣传文案”,在不久前刚结束的深圳高交会现场,不少观众围科大讯飞展台体验“讯飞星火”认知大模型;与此同时,百公里外的广州车展现场,乘客坐进小鹏汽车体验“灵犀大模型”,感受车辆变身大号手机并主动提供服务……
一时之间,科技市场言必称“大模型”。当前,通用人工智能正呼啸而来,特别是ChatGPT推出以来,以大模型、生成式AI为代表的通用人工智能技术在全球掀起浪潮。
看到“风口”的不只是企业。10月,北京发布人工智能算力券实施方案,帮助企业降低算力使用成本;11月,上海推出11条措施推动大规模预训练模型创新发展。此外,包括安徽等地,也纷纷围绕大模型“抢跑”。
广东也迅速行动,于近日出台“通用人工智能发展22条”——《关于加快建设通用人工智能产业创新引领地的实施意见》(下称《实施意见》),提出到2025年,智能算力规模实现全国第一、全球领先,核心产业规模突破3000亿元,将广东打造成为国家通用人工智能产业创新引领地;11月21日,《广东省人民政府办公厅关于印发“数字湾区”建设三年行动方案的通知》发布,其中提及,夯实新型数字基础设施,实现湾区数字化“基座通”。
处于国内人工智能第一梯队的广东,如何向着产业创新制高点攀登?在这场全方位的通用人工智能产业竞逐中,广东面临哪些挑战,如何破局发展?这些,都有待广东解题。
风口
政策“三部曲”助力AI产业翻番增长
作为数字经济产业大省,广东不遗余力发展人工智能产业,并不断增添政策比拼的筹码。
早在2016年,举世瞩目的“人机大战”中,谷歌“阿尔法狗”以4∶1战胜围棋世界冠军李世石。此后,以小马智行、文远知行为代表的新兴人工智能企业先后在美国成立,并漂洋过海落户广州。
广东敏锐察觉到了这一波人工智能的市场机遇,并在2018年8月发布《广东省新一代人工智能发展规划》(下称《发展规划》)。
《发展规划》首次披露广东人工智能产业“家底”:2017年,人工智能核心产业规模约260亿元,约占全国1/3,带动机器人及智能装备等相关产业规模超2000亿元,人工智能核心产业及相关产业规模均居全国前列。
《发展规划》提出,到2025年,培育形成40家技术创新能力处于国内领先水平的核心龙头企业,300家以上人工智能技术、产品制造、应用和服务领域的领军企业,建成15个以上人工智能核心产业园,产业核心规模突破1500亿元,带动相关产业规模达到1.8万亿元。
此后,人工智能以出乎意料的速度发展。2022年,全省人工智能核心产业规模达1500亿元,布局建设了广州南沙国际人工智能价值创新园、深圳湾科技生态园等11个省级人工智能产业园。全省人工智能相关注册企业约17万家,核心企业900多家,居全国首位。
也就是说,广东提前3年就完成了核心产业规模1500亿元的“小目标”。
2022年12月,广东再次发布《广东省新一代人工智能创新发展行动计划(2022—2025年)》(下称《行动计划》),继续为人工智能产业发展“添一把火”。
几乎就在《行动计划》发布的同时,ChatGPT一夜爆红,拉开通用人工智能时代的“百模大战”,这被认为是人工智能技术爆炸的又一个“奇点时刻”。据统计,截至今年10月,国内已经发布238个AI大模型,是6月份(79个)的3倍左右。
广东再次以时不我待的紧迫感,快速推出《实施意见》,目标直指打造“通用人工智能最强省”:在2025年,核心产业规模在原目标上翻番,突破3000亿元。
这背后,是以人工智能、5G、云计算等为代表的数字经济产业“狂飙突进”。
广东是我国数字经济第一大省——数字经济增加值规模连续多年全国第一,电子信息制造业规模连续31年居全国第一。2022年广东省数字经济规模为6.41万亿元,增长8.6%。由此可见,数字经济领跑功能日益凸显。
中山大学软件工程学院实验中心副主任戴欣表示,通用人工智能正逐步走向实体经济,赋能千行百业,《实施意见》的发布,将推动广东加快建设以实体经济为支撑的现代化产业体系,不断塑造发展新动能新优势。
破局
深入底层技术,让AI动能更强
大模型的研发并非一日之功。相比常见的“技术引进”等短平快方式,《实施意见》更深入底层技术,围绕人工智能产业关键支撑的三要素——算力、算法和数据持续发力。
如果把人工智能比作一辆疾驰的汽车,那么数据就是汽油,算力则是发动机,它们共同构成面向数字经济时代的核心能力。
要满足当下大模型对算力的需求,一般有两个途径,一是扩容服务器,在增量上做文章。
广东已提前布局,目前拥有鹏城实验室、韶关数据中心集群、横琴先进智能计算平台、广深超算中心等重大算力设施平台。
国家超级计算机深圳机房。南方+记者 鲁力 摄
通用算力、智能算力、超级计算,构成了算力“三兄弟”。AI进入新发展周期,大模型爆发,让芯片需求结构出现变化。算力大盘虽然在增长,但通用算力占比下降,智能算力占比逐渐增长。
今年10月,工业和信息化部等六部门联合发文提出,争取到2025年,智能算力占比要达到35%。
这也是《实施意见》中,强调“智能算力”的一大原因,其中提出,“构建全国智能算力枢纽中心”,包括打造通用人工智能算力生态、国家算力网络枢纽节点,以及与国际接轨的城市级算力平台。
满足算力需求的另一途径,则是在存量上做文章,提高算力的使用效率。例如,把所有的算力资源连接在一起,形成一张巨大的算力网,让算力能更加智能调度。
继电力、高铁、5G等之后,算力有望实现“全国一张网”。目前,韶关市与鹏城实验室携手,共同推进“中国算力网”建设,并计划建设中国第一个算力调度部门——算力调度中心。“算力将像水和电一样,可以随时调用。”中国工程院院士、鹏城实验室主任高文说。
华韶数据谷。南方+记者 潘俊宇 摄
《实施意见》另一大突破是对数据的利用,广东首次提到“粤港澳大湾区数据特区”。
数据,正逐步取代土地、厂房而成为企业最有价值的要素。早在2020年,深圳市就开始推进数据生产要素统计核算试点,此后,深圳南山、广州海珠和番禺等地也展开相关探索。试点三年以来,深圳市促成国内的数据生产要素统计核算理论方法从“一张白纸”发展到“渐成体系”。
广东在发挥数据价值方面还有一个得天独厚的天然优势。今年11月初,粤港两地签署《粤港政务服务“跨境通办”合作协议》,启动粤港“跨境通办”服务专区,“数字湾区”建设进一步加速。
广东工业大学粤港澳大湾区协同治理与法治保障研究中心副主任冯泽华认为,从区域升级角度而言,可率先建成数据大市场。数据成为生产要素的情境下,加快培育统一的数据要素大市场,全面激活数据资源生产力,将使我国在全球数字竞争中抓住先机、争取主动、抢占未来发展制高点。
广州数据交易所总经理魏东也表示,正积极探索大湾区数据跨境双向流通机制,打造“数据特区”为粤港澳三地提供跨境数据服务。
不过,与港澳数据流通方面,香港与内地的数据规则仍有出入,广州数据交易所已积极与相关部门进行研究和探讨,希望可以求同存异。同时,大湾区内有很多香港的高校,广州数据交易所也在探讨科研数据流通。
在深圳数据交易所副总经理王腾看来,通用大模型非常依赖高质量的语料“喂养”,例如ChatGPT在语音聊天表达上,中文反馈不如英文准确,除了中文更难理解外,一个关键因素是中文数据支撑不足。依托“数据特区”,可以促进数据资源的高效配置和优化利用,为通用人工智能技术突破打下坚实基础。
路径
广东人工智能的“集群打法”
“帮我写一篇工作总结”“帮我写一段广告文案”……在日常生活中,公众逐步体验到大模型带来的便利。
在广东,以华为、vivo为代表的手机厂商,以腾讯、网易为代表的互联网厂商,以及佳都科技、汉王等科技企业,也纷纷加入这场“混战”。
vivo副总裁周围表示,大模型融入手机,能将手机转化为一个“智能体”,扮演个人助理的角色。大模型的加入,一方面会改善用户的使用体验,另一方面也有望提振消费电子市场,同时关系到手机厂商能否啃下“高端化”这块硬骨头。
星火大模型。
云天励飞副总裁郑文先则注意到,《实施意见》提到要持续加快技术创新场景应用,并提到要常态化发布人工智能场景清单。这不仅能够为AI技术提供更多的试验田,从长远而言也能积累更多场景数据,为AI的训练提供更多“养分”。
从场景、应用着手反哺底层技术发展,不断补上短板。《行动方案》专门提到,研发具有通用性、可编程性的高端训练、推理芯片,多模态多精度计算的算力芯片,探索可重构、算存一体的新型体系架构研究。
在发展人工智能的路径选择上,发达国家在原理性研究、理论性研究上有先发优势,而中国则依托广阔市场、海量数据,走出了一条适合本地发展的路径。这也表明,伴随着中国人工智能产业发展不断在“无人区”领跑,“拿来主义”已经行不通,必然要强化原始创新、底层创新,才能在这种高科技的竞逐中持续领先。
与此同时,和其他区域相比,广东错位发展,依托产业集群发展通用人工智能。
西南政法大学人工智能法学院院长陈亮就注意到,北京强调人工智能研发端整体技术框架的创新性突破,上海以“大模型”应用为重点在全链条提供创新支持,广东侧重于激发人工智能产业集群效应来倒逼技术升级,“这由各地资源禀赋决定”。
大规模的人工智能场景实现应用,背后是广东日趋完备的产业链和协同发展的产业集群作为支撑。广东经济总量连续34年居全国首位,是国内经济最活跃、市场化程度最高的地区之一,发展通用人工智能的应用场景丰富、市场空间潜力巨大。
11月15日,在第二十五届高交会上,搭载了人工智能大模型系统的小鹏汇天陆空一体式飞行汽车对公众展出。新华社发
当前全球产业格局正发生深刻改变,企业间的竞争正变为产业链、产业集群间的竞争。广东也重点发布多个产业集群转型的扶持政策以及20大战略性新兴产业集群行动计划。
尽管大模型发展如火如荼,但仍然面临着“可用”到“好用”的差距。11月15日,在2023西丽湖论坛上,百度创始人李彦宏表示,许多行业、企业甚至城市都在买卡、囤芯片,建智算中心,想从头训练自己的专用大模型,“不断地重复开发基础大模型是对社会资源的极大浪费”。
如何让企业减少“无用功”?广东靠技术挑大梁。就在同一天,腾讯云也发布向量数据库,最高支持千亿级向量规模,帮助用户将原本散乱的非结构化数据,整理成可用的数据财富,缩短数据接入AI的时间,以推动大模型相关产业走向大规模应用。
政企联手,产业端的应用,与底层技术上的突破,共同助推广东在人工智能产业发展上行稳致远。
纵深
从数字湾区到数据特区
广东先行先试探索数据跨境流动
为进一步突出粤港澳协同发展特色,《实施意见》充分利用港澳制度和资源优势,率先提出建设“数据特区”,力争在大湾区内建立数据流通规则体系、完善运营机制等方面形成工作探索,提升广东通用人工智能的数据规模和质量。在新一轮数据要素改革中,广东继续扛起“排头兵”的担当,探索数据跨境流动、深挖数据价值。
就在11月21日,省政府办公厅印发“数字湾区”建设三年行动方案,提出打造全球数字化水平最高的湾区。“数字湾区侧重整个湾区的数字化基础设施建设和互联互通,而数据特区更强调数据要素领域,切口更窄、入口更深。”广东数字政府研究院数据发展部主任卢烨对此分析。
港澳成数据国际流通的桥梁
在数据跨境流动上,广东进行了一系列探索。
今年4月,广东省政务服务数据管理局相关负责人介绍,广东数字政府改革建设不断推动粤港澳三地政务服务协力融通、推进数据跨境流通合作。广东还在广州南沙、深圳前海、珠海横琴开展“数据海关”试点,探索建立数据跨境审批与管控机制。
“粤港澳三地有强烈的跨境数据需求。”华南师范大学数字政府与数字经济法治经济研究中心主任马颜昕说,数据资源的流动,比一般的人财物流动更便捷、更跨越地域。
“数据只有在流通与交互中才能进一步产生价值。因此数据既要互通,又要互补,广东毗邻港澳,香港的开放经济环境和便利的贸易政策也可以为广东提供更多的机会和便利,澳门可以成为走向欧洲大陆的通道,香港和澳门本身国际化程度都比较高,可成为数据在国际流通的桥梁和枢纽。”马颜昕说。
中国互联网络信息中心(CNNIC)原主任李晓东也指出,依托内地巨大的数据资源供给和需求优势,积极打造“数据开放交换平台”,有望让香港在未来的数字经济发展中成为全球数据交换的中心,并打造出数据产业的独特优势。
数据跨境制度逐步“破冰”
《数据出境安全评估办法》等数据安全法律法规相继出台,为跨境数据流转提供了法律依据,但在操作层面上仍有不少问题亟待细化。“例如,数据的分类分级,按照什么标准进行,还有许多行业的特性也是要考虑到的;数据跨境审核方面,谁来审核,目前许多工作是网信办在做,但网络安全不等于数据安全,单个政府部门难以全面掌握和了解行业具体数据。”国际数据管理协会中国分会主席汪广盛说。
马颜昕也指出,粤港澳三地有不同的法律制度,数据在跨境交互、跨境融合时,也面对不同的法律法规;此外,数据跨境的过程中,如何保证数据的有用性和安全性之间的平衡,尤其是如何保证国家主权和国家安全,“这都需要进一步完善制度、细化落实相关政策”。
随着大湾区内部交流日益频繁,制度先行先试也在悄然打开局面。今年8月出台的《深圳市优化市场化营商环境工作方案(2023—2025年)》提出加强信用服务跨境合作,2025年建成跨境信用综合服务平台;广州在南沙建设“大湾区跨境数据互信互认平台”,其中提供身份核验服务,包括为香港银行机构核验内地授信客户的身份和电话信息,从而实现跨境数据信息传输,同时推进两地跨境业务发展。
广东数字政府研究院副院长傅建平建议,广东加快扶持数据安全和隐私计算相关的数据流通服务企业,为数据跨境的安全保驾护航。
【采写】南方+记者 郜小平
【统筹】李卓 程鹏