• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

南方网 > 新闻 > 专题推荐 2024上半年 > 聚焦第二十届文博会 > 融媒报道

AI上文博会 | 饱读诗书,它训练的AI更适合中国人体质

2024-05-30 20:34 来源:南方网

code:

vid:

uuid:

requestId:

播放时间:

提示信息

字幕
    倍速
      清晰度
        音轨
          倍速正常
          字幕
          音轨
          清晰度

            AI大模型是人工智能开发、应用的基础设施,语料库则是训练和优化AI大模型的“养料”。今年,“顶流”AI大模型扎堆亮相文博会,其中,就有来自鹏城实验室的“鹏城·脑海”大模型,它是世界上规模最大的中文通用AI大模型基座。

            为什么以中文为核心的AI大模型如此重要?有数据显示,全球通用的50亿大模型数据训练集里,中文语料的占比仅为1.3%。“以ChatGPT为例,它的训练数据中,中文语料比重不足1%。国外的大模型中文语料占比少,它们训练出来的输出难以保证中国正确的价值观。”鹏城实验室大模型创新应用中心主任赵子莹告诉记者。

            赵子莹表示,“鹏城·脑海”大模型以中文为核心,从底座训练开始,它的中文语料非常强大。据悉,作为一个全面国产、自主可控的大模型,“鹏城·脑海”能够保障大模型的数据安全隐私,输出内容符合以中文为核心的价值观,构建了安全保障和内容审核。

            赵子莹称,面向数字政务、智慧金融、智能制造等应用场景,“鹏城·脑海”去年已正式向全社会开放。“中文价值观对很多领域的发展而言是非常重要的。目前,‘鹏城·脑海’正在为国家重大战略和各个地方经济发展进行全面的赋能。”

            统筹:张纯青

            策划:李琳

            记者:尹珏文

            摄像:冯登科

            设计:陈伟红

            校对:梁洁萍

          编辑:陈海敏   责任编辑:李婷  

          扫二维码分享

          回到首页 南方网二维码 回到顶部

          南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

          本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

          违法和不良信息举报电话:020-87373397 18122015068

          ICP备案号:粤B-20050235