与Sora同架构，这款AI大模型不只会“吟诗作画”

2024-05-23 16:00 来源：南方+

　　小说家在创作时，可以向大模型请求建议和灵感，以便更好地构建情节和塑造角色；游戏设计师在设定新游戏的世界观时，可以向大模型了解关于地理、文化和历史背景的内容；即便是没有绘画基础的人，也可以通过大模型进行AI作画……

　　5月23日，第二十届文博会开幕。在广东综合展区的“大模型产业应用厅”，腾讯混元文生图大模型吸引了众多观众前来互动。从“吟诗作画”到赋能千行百业，大模型各种各样的新应用让观众大呼惊艳。

　　首个中文原生类Sora架构开源模型

　　“人工智能是发展新质生产力的重要引擎，而大模型又是人工智能技术的重要发展方向。其中，文生图是大模型应用的重点领域，有着广泛的应用前景。”腾讯集团副总裁蒋杰表示，目前腾讯混元大模型的文生图能力，已经广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。

　　日前，腾讯宣布其旗下混元文生图大模型全面升级，并对外开源。这也是首个中文原生的类Sora架构开源模型，填补了国产大模型在文生图先进架构上的空白。

　　“随着产业信息的载体多元化，模型的需求不仅仅是处理单纯的文字，还需要处理图片、视频等多种信息。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生认为，大模型的能力竞争，正在从单一的文生文，拓展到文生图、文生视频、图生图、图生视频等多模态能力。

　　为此，腾讯推出了“大模型知识引擎”“大模型图像创作引擎”和“大模型视频创作引擎”，打造大模型原生工具链，助力企业在知识服务、图像和视频创作上提质提效。

　　腾讯CEO马化腾认为，AI的发展将带来三个方面的机遇，一是AI将赋能各行各业，提升社会效率和生活品质；二是AI将催生新的业务模式和价值创造，促进经济增长和社会进步；三是AI将激发新的人机交互和内容创作，丰富人类的文化和娱乐。

　　手指一动轻松“走进”敦煌藏经洞

　　手机一秒，史上千年。在展会现场，通过腾讯公司联合敦煌研究院推出的“数字藏经洞”小程序，观众只需要在屏幕轻轻点击，就能穿越历史，亲身“参与”到藏经洞的历史之中。

　　藏经洞被称为20世纪最重要的考古大发现之一和“打开世界中世纪历史的钥匙”，文物保存在中、英、法等多个国家，是4—11世纪中西方多民族交融的历史见证，其包含的文物价值与文化价值非常丰富。

　　然而，因为历史原因，如今无法在真实的物理空间再看到典藏着文物的藏经洞。同时，也因为藏经洞存在文物体量大、文本难理解等客观原因，大众也较难了解背后文物深厚的文化底蕴和价值。

　　为此，在国家文物局指导下，腾讯公司与敦煌研究院联合打造的“数字藏经洞”，在数字世界生动再现敦煌藏经洞及其室藏6万余卷珍贵文物的历史场景。

　　其综合运用高清数字照扫、游戏引擎的物理渲染和全局动态光照、云游戏等游戏技术，数字资产规模超过36G，画面精度达到4K影视级画质。

　　今年4月，“数字藏经洞（国际版）”正式在欧洲地区上线，推出英语、法语版本，延续使用云游戏技术，向世界开启了敦煌莫高窟的沉浸之旅。

　　海外用户只需登录“数字敦煌”网页，就能轻松“走进”远隔万里的敦煌藏经洞，传统文化之美跃然眼前，哪怕相隔千万里也能仿若身临其境地体验文物背后的历史故事，以更便捷、沉浸、生动的方式了解丰富的中华优秀文化。

　　【采写】南方+记者昌道励

　　【摄影】南方+记者张令

编辑：倪仕轩责任编辑：李婷

扫二维码分享

报纸