• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

阿里千问与DeepSeek同日上架魔搭,社区模型总数已超4万个

2025-03-26 13:55 来源:南方网

  326日,中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32BDeepSeek则将此前热门的「基座模型」V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。

  千问Qwen-VL是全球AI开源社区最受欢迎的多模态模型之一,此前,通义千问Qwen2.5-VL已开源3B7B72B3个尺寸,昨日又推出更适合本地部署的32B版本。Qwen2.5-VL-32B模型在MMMUMathVistaMM-MT-Bench等基准测试中的性能表现突出,超越了更大规模的Qwen2-VL-72BGPT-4o-0513,并且优于近期火热的Mistral-Small-3.1-24BGemma-3-27B-IT等模型。在开发者关注的知名Hacker News网站上,Qwen2.5-VL-32B的热度爆表,是当天评论最多的新闻。

  DeepSeek-V3是全球最受关注的基座大模型之一,也于昨夜官宣完成小版本升级。据DeepSeek透露,新版V3-0324模型借鉴R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩,并在前端开发、中文写作、中文搜索等能力上均有提升。V3-0324模型在HuggingFace开源后不久,即斩获趋势榜榜首。同时,在昨日官方推文中,DeepSeek首次官宣在魔搭社区开源,更好服务于中国开发者和企业。

  据了解,阿里云联合CCF开源发展委员会共同牵头组建的魔搭社区(Model Scope),已发展成为中国最大的AI开源社区。秉承“模型即服务”(MaaSModel as a Service)理念,魔搭为AI开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务,“找大模型上魔搭”成为开发者心照不宣的默契。截至目前,阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱AI等知名大模型公司均官方在魔搭开源最新模型,魔搭社区模型总量超过4万个,涵盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,魔搭已经服务超过1000万开发者。

扫二维码分享

回到首页 南方网二维码 回到顶部

南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

违法和不良信息举报电话:020-87373397 18122015068

ICP备案号:粤B-20050235