查看完整版本: [-- DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户[11P] --]

武当休闲山庄 -> 数码讨论 -> DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户[11P] [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

jjybzxw 2025-03-25 09:01

智东西

作者 | 陈骏达

编辑 | 漠影

智东西3月25日报道,昨日晚间,DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较早期版本的6710亿有小幅增长。不过,DeepSeek尚未放出新版模型的系统卡,我们暂时无法获取关于这款模型的更多信息。

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时,DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。

新版DeepSeek-V3上线后,智东西第一时间进行了代码、数学和通用能力等多方面的测试,并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享,升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称,DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前,Claude Sonnet 3.5在程序员圈内拥有极高的声誉,无论诸多模型在代码上的成绩如何变化,程序员依旧更青睐使用Claude系列模型。

在智东西的测试中,新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步,在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站,据其介绍,网站采用了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画和科技感配色)等设计元素,标题使用打字机动画,按钮具备光波扩散效果。

这一网站还使用了响应式设计,能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时,其解决方案仅有100多行代码,输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称,这次的“小更新”比预期中的更大,改进显著,尤其是在数学方面。

智东西将之前实测中,曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次,DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长,单次输出达到了输出上限,点击继续生成后,DeepSeek-V3继续思考,但这次的答案依旧是错误的。

不过,从错误的答案中,我们也能观察到一些新的变化,如今的DeepSeek-V3在给出最终答案后,会进行一定程度的反思,并修改自己的解题过程。

而在智东西先前测试的文科类问题上,新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为:“布须曼人喝不喝牛奶?”旧版DeepSeek-V3对这一问题的回答仅有三小段话,信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式,分析的内容更为全面,补充了更多的背景信息,同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点:新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

新版DeepSeek-V3的发布,也让诸多网友不禁遐想:新版V3都来了,R2和V4还会远吗?



jjybzxw 2025-03-25 09:01
  根据智东西的报道,DeepSeek最近在开源平台上发布了升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿,相较于早期版本的6710亿有所增加。以下是关于新模型的一些关键信息:

  1. 开源地址:新模型已在Hugging Face平台开源,地址为:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

  2. 开源协议更新:DeepSeek将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给开发者更多自主权。

  3. 性能提升:升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。海外AI博主认为DeepSeek现在能在代码领域与Anthropic的Claude Sonnet 3.5竞争。

  4. 网站开发能力:新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大进步。在设计个人博客网站的测试中,新版DeepSeek-V3在2分钟内交付了一个400多行代码、设计精良的网站,采用粒子背景动画、赛博朋克UI等设计元素。

  5. 响应式设计:该网站还使用了响应式设计,能自动适配手机和桌面设备。

  6. 数学问题解决:新版DeepSeek-V3在解决数学问题时,输出的token量明显更长,虽然答案依旧错误,但会进行一定程度的反思,并修改解题过程。

  7. 文科类问题回答:新版DeepSeek-V3在回答文科类问题时变得更全面,补充了更多背景信息,同时生成速度依旧理想。

  8. 网友评价:新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

  综上所述,新版DeepSeek-V3的发布带来了显著的性能提升和新功能,在代码、数学、UI设计等方面都有明显进步。同时,开源协议的更新也为开发者提供了更多灵活性。新版V3的发布也让人期待未来的R2和V4版本。


姜谷粉丝 2025-03-25 09:14
用户被禁言,该主题自动屏蔽!


查看完整版本: [-- DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户[11P] --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号