3月25日晚,DeepSeek官方微信公众号发布了DeepSeek V3模型更新的消息。据称,更新后模型各项能力全面进阶,包括中文写作升级、中文搜索能力优化、推理任务表现提高、前端开发能力增强,以及工具调用、角色扮演、问答闲聊方面的提升。
DeepSeek表示,V3模型已完成小版本升级,目前版本号为DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验,API接口和使用方式保持不变。如非复杂推理任务,建议使用新版本V3模型,可享受速度更加流畅、效果全面提升的对话体验。
数学、代码类相关评测超越OpenAI
DeepSeek介绍,新版V3模型借鉴R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过OpenAI最新模型GPT-4.5的得分成绩。
同时,新版V3模型前端开发能力增强,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。
中长篇文本创作的内容质量明显提升
在中文写作任务方面,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。
同时,新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。此外,在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。
南方网、粤学习记者 朱文婷