
Xinzhiyuan报告编辑:Taozi Dinghui [Xinzhiyuan介绍] DeepSeek v3.1的新版本正式推出,具有128K上下文,编程Claude 4 Opus的力量,成本低于1。昨晚1。昨晚,Deptseek正式启动了V3.1的新版本,该版本已扩展到128 k1 k.1 keption forne v3.1。目前,开放资源v3.1模型具有685B参数,并支持不同的精度格式,从BF16到FP8。结合了公共信息和国内大型射击Karminski3的实际测试,该v3.1更新的亮点包括:编程能力:出色的性能。根据社区AIDER测试数据,v3.1将列表带到开放资源模型。绩效突破:v3.1在AIDER编程基准中得分71.6%,在Claude Opus 4中玫瑰在推理和响应速度的同时。本机搜索:添加了对本机“搜索令牌”的支持,这意味着搜索支持更好。建筑变化:在线模型删除了“ R1”徽标和评论说,DeepSeek有望将来采用“混合架构”。成本成本:每个完整的编程任务仅费用为1.01美元,而成本仅是所有权系统的六个。值得一提的是,官方小组强调了以前由V3版本支持的128K上下文的扩展。每个人对这一更新浪潮的热情相对较高。尽管尚未宣布模型卡,但DeepSeek v3.1是面部列表的四分之一。 DeepSeek粉丝的数量超过80,000。 Naksee这个,网民预计会发布R2!作为推理的混合,编程击败了克劳德4,这是当时Deptseek从官方应用程序和网页中删除“ R1”(R1)的最显着变化。同时,与v3碱基相比,deepseek v3.1添加了四个特殊令牌:|搜索开始|(ID:128796)|搜索|(ID:128797)(ID:128798)(ID:128798)(ID:128799)在这方面,有一些猜测是有一些猜测。Ay表示组合非顺序。根据网民揭示的结果,在编程方面,DeepSeek v3.1在AIDER Polyglot多语言编程测试中得分71.6%,在倒下的swoop中击败了Claude 4 Opus和DeepSeek R1。此外,它的价格仅为1美元,在非参与模型中变成SOTA。对于最敏锐的Kafter来说,V3.1编程性能比克劳德4高1%,少68次。就SVGBench基准测试而言,v3.1的强度仅次于GPT-4.1-Mini,这超出了Deptseek R1的强度。在了解MMLU的多任务方面,DeepSeek V3。 1至少是GPT -5。但是,就编程,研究生级的基准问答和软件工程而言,v3.1具有一定的差距。根据网民的测试,六角形中中小球自由下降的物理试验显着提高了理解DeepSeek v3.1的能力。第一手的实际三尽快进行ALS。我们对v3.1进行了实际测试。首先,更新此模型的重点:上下文长度。在思考中文时,有1个令牌≈1-1.3个汉字,然后是128K这个令牌≈100,000-160,000个汉字。这相当于“红色大厦梦想”的整个文本中的1/6-1/8(大约800-100万个单词),或过多的医生论文/大型学术专着。实际测试非常准确,DeepSeek告诉我们,只能阅读约9%,即大约十分之一。由于摘要的内容太长,我们阻止了前三章。您如何看待此摘要?在128K上下文试验中,与过去相比,DeepSeek-V3.1的输出速度大大提高,并进行了一些工程优化。在此更新中,Deviceek支持功能支持上下文。在一生中,给deepseek-v3.1一些压力,以便它可以根据“梦”一词输出尽可能多的内容,然后尝试to达到上下文限制,但最后,输出约为3,000个字,模型停止了输出。让我们看一下推理能力。经典的9.11和9.9大小问题可以以相同的方式正确回答。此更新的总体感觉使它变得更快。最后,让我们看一下编程能力。以前的DeepSeek模型是R1-0528,该模型侧重于编程功能。让我们看看v3.1目前是否有更大的进步。最终结果只能说80分,并且满足了基本要求,但是图片和颜色更改的样式并没有完美地实现。与R1-0528的结果相比,两者之间仍然存在几个间隔,但其中一个更好地取决于个人喜好。以下是在思考模式之后的结果。您认为哪个Onedo越好?接下来,让我们看看DeepSeek v3.1是否可以在GPT-5大会上复制法国学习迷你程序。让我们绘制自己的SVG自portra它。这两个效果实际上是抽象的。参考:hyxhttps://weibo.com/2169039837/q0fc4lmeohttps://x.com/karminski3/status/1957928641847666314 https://github.com/johnbean393/svgbench/https://huggingface.co/deepseek-ai/deepseek-v3.1-pase
特别声明:上面的“ NetEase”自媒体平台的用户上传和发布了上述内容(包括照片或视频),并且该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。