小说家在创作时,可以向大模型请求建议和灵感,以便更好地构建情节和塑造角色;游戏设计师在设定新游戏的世界观时,可以向大模型了解关于地理、文化和历史背景的内容;即便是没有绘画基础的人,也可以通过大模型进行AI作画……
5月23日,第二十届文博会开幕。在广东综合展区的“大模型产业应用厅”,腾讯混元文生图大模型吸引了众多观众前来互动。从“吟诗作画”到赋能千行百业,大模型各种各样的新应用让观众大呼惊艳。
首个中文原生类Sora架构开源模型
“人工智能是发展新质生产力的重要引擎,而大模型又是人工智能技术的重要发展方向。其中,文生图是大模型应用的重点领域,有着广泛的应用前景。”腾讯集团副总裁蒋杰表示,目前腾讯混元大模型的文生图能力,已经广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。
日前,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。这也是首个中文原生的类Sora架构开源模型,填补了国产大模型在文生图先进架构上的空白。
“随着产业信息的载体多元化,模型的需求不仅仅是处理单纯的文字,还需要处理图片、视频等多种信息。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生认为,大模型的能力竞争,正在从单一的文生文,拓展到文生图、文生视频、图生图、图生视频等多模态能力。
为此,腾讯推出了“大模型知识引擎”“大模型图像创作引擎”和“大模型视频创作引擎”,打造大模型原生工具链,助力企业在知识服务、图像和视频创作上提质提效。
腾讯CEO马化腾认为,AI的发展将带来三个方面的机遇,一是AI将赋能各行各业,提升社会效率和生活品质;二是AI将催生新的业务模式和价值创造,促进经济增长和社会进步;三是AI将激发新的人机交互和内容创作,丰富人类的文化和娱乐。
手指一动轻松“走进”敦煌藏经洞
手机一秒,史上千年。在展会现场,通过腾讯公司联合敦煌研究院推出的“数字藏经洞”小程序,观众只需要在屏幕轻轻点击,就能穿越历史,亲身“参与”到藏经洞的历史之中。
藏经洞被称为20世纪最重要的考古大发现之一和“打开世界中世纪历史的钥匙”,文物保存在中、英、法等多个国家,是4—11世纪中西方多民族交融的历史见证,其包含的文物价值与文化价值非常丰富。
然而,因为历史原因,如今无法在真实的物理空间再看到典藏着文物的藏经洞。同时,也因为藏经洞存在文物体量大、文本难理解等客观原因,大众也较难了解背后文物深厚的文化底蕴和价值。
为此,在国家文物局指导下,腾讯公司与敦煌研究院联合打造的“数字藏经洞”,在数字世界生动再现敦煌藏经洞及其室藏6万余卷珍贵文物的历史场景。
其综合运用高清数字照扫、游戏引擎的物理渲染和全局动态光照、云游戏等游戏技术,数字资产规模超过36G,画面精度达到4K影视级画质。
今年4月,“数字藏经洞(国际版)”正式在欧洲地区上线,推出英语、法语版本,延续使用云游戏技术,向世界开启了敦煌莫高窟的沉浸之旅。
海外用户只需登录“数字敦煌”网页,就能轻松“走进”远隔万里的敦煌藏经洞,传统文化之美跃然眼前,哪怕相隔千万里也能仿若身临其境地体验文物背后的历史故事,以更便捷、沉浸、生动的方式了解丰富的中华优秀文化。
【采写】南方+记者 昌道励
【摄影】南方+记者 张令