• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

京东云:这个春节用“AI”带消防员的声音回家 让陪伴触手可及

2024-01-31 11:21 来源:南方网

  “春节马上到了,我们尤其不能松劲,要让百姓过一个安康祥和的好年!”春节前夕,广州市天河区珠江东消防救援站留守的消防员们,把这里当作自己的“家”,早早的在驻地营房前挂上红彤彤的灯笼,贴上喜气洋洋的窗花。

  春节,是阖家团圆的日子。但有这样一群人,他们把对城市的爱与守候,积淀在平凡却重要的工作岗位上,为年味绘就“担当”底色的同时,也往往会缺席对家庭的陪伴。

  2024年春节,天河消防救援携手京东云开展“让‘AI’的声音回家”公益活动,在京东图书、Luka卢卡的配合下,用有情感、有温度的AI技术,为消防员克隆音色并生成睡前故事,与他们的孩子时刻相伴。

  让技术更有温度,AI语音化身情感陪伴

  “百姓过年,我们过关。”作为天河区珠江东消防救援站站长助理,老裴自2005年入伍以来,已经十多年没有陪伴家人过春节了。

  入伍18年,他参加各类灭火战斗6000余次,营救遇险人员100余人,为维护人民群众生命财产安全时刻冲锋在前。2023年,他牵头站装备革新小组研发“消防员专用降温水枪”、“车底专用灭火枪”等4项革新装备,获得国家实用新型专利。

  但为人父母、子女的他,和很多消防官兵一样,“春节都是在消防车上过的”。他们对家人即挂念又愧疚,只能尽量在有限的陪伴里,与孩子们共同成长。老裴说,他一有空就教两个孩子背古诗、读历史。今年春节,裴忠斌最大愿望是为两个孩子做个表率,讲一口流利的英语。“A lion ones fell in love with a beautiful girl……”如今,由京东云言犀用他的音色生成的英文故事,成为孩子们的英语“启蒙老师”。除了京东云提供的有声故事,卢卡Luka Mini还可伴读15万册中英文绘本,播放百万首早教音频,进行智能聊天百科问答。

  “小宝宝,爱刷牙,左刷刷,右刷刷,干干净净,没蛀牙……”,天河区消防救援大队不少消防员的孩子如今正在换牙期。因长期值守营区24小时待命,想要见证孩子成长的每一刻,几乎都成了无法完成的任务。今年春节,爸爸的“AI声音”唱出的刷牙歌,通过卢卡Luka Mini从孩子们的耳朵传到了心里。“京东云语音克隆,为我们春节坚守免去后顾之忧。为人父母,这是技术创新对我们最好的宽慰!”广州市天河区消防救援大队副大队长唐洁表示。

  其实,这个公益活动背后来自京东云言犀全自研的语音语义技术,现已广泛应用于零售智能外呼、多模态数字人、政务热线等多个场景,释放商业价值的同时,也不忘产生情感连接:

  服务芜湖12345热线,7*24小时不间断服务,智能应用准确率达98.7%;打造全国首个12355青少年综合服务智能平台,上线2个月接待用户量超1800人次,88%以上由机器人独立解决会话,服务满意度100%;搭建智慧养老平台,为天津市河西区5000多位独居老人每天呼出问候电话……

  让技术更有深度,实现1小时语音克隆

  2周前,参与的消防员陆续抽空录制了音频,京东云言犀通过少量样本实现他们的语音克隆,赶在春节前送上了这份特殊的礼物。

  化身连接情感的纽带,背后离不开技术的不断深耕与探索。京东云言犀团队介绍,目前依托言犀TTS(文本转语音)6.0模型,只需录制10句话样本,即可在30分钟内完成模型自动化训练与部署,还原真人音色、音调、语气,更支持中文、英文、泰语及广东话、成都话等600多种外语和方言音色。

  在训练阶段,先给人工智能装上“耳朵”,让机器抓住每个人说话的特色。将真人采集的2-3分钟语音,自动切分为10秒内短句,通过ASR语音识别技术,语音转化为对应文本,同时提取音频的声学特征频谱,以此为目标值对基础模型进行微调,形成每个人专有的语音模型。

  在合成阶段,再给人工智能装上“嘴巴”,让机器能像真人一样说话。将输入的故事文本分段、切句,传入训练好的语音模型,通过TTS语音合成技术,模型会依次反馈和播放语音,同时后端持续合成避免等待。

  不仅惟妙惟肖还原音色,还为人工智能赋予丰富的情感。风格迁移技术,支持文本重读、语调修饰,调整合成音色的风格韵律,实现睡前故事的娓娓道来,带货主播的慷慨激昂,文学朗读者的抑扬顿挫;情感判断模型,支持知识库语义挖掘,在多轮交互的客服场景中精准识别用户的喜怒哀乐,匹配相应情绪的回答话术。

  让数据更有精度,覆盖1000万次智能交互

  技术探索的深度,决定语音克隆和多轮交互能否高效实现,而“滋养”模型的高质量音频数据,则将支撑其在应用落地中的走得更远。

  生长于京东场景的言犀语音模型,训练时融合近6亿用户每日超1000万次的智能服务交互,每月累积超200万小时通话语音,积累了3000万个高质量问答知识点,覆盖超1000万种自营商品的知识图谱。

  据透露,基于这一产业场景的多年锤炼,京东云将于2024年推出言犀语音大模型,届时将极致压缩样本实现“一句话语音克隆”。

  为产业赋能,为生活添彩,以大模型为代表的人工智能技术将带来翻天覆地的变化。龙年春节在即,京东云用有温度的技术带着消防员的声音回家,让AI与爱同在。面向未来,京东云将持续深耕有温度、有情感的技术,不仅在产业中创造更大价值,也让爱通过AI传递,让温暖与陪伴触手可及。

扫二维码分享

回到首页 南方网二维码 回到顶部

南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

违法和不良信息举报电话:020-87373397 18122015068

ICP备案号:粤B-20050235