DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
创始人
2025-05-29 22:10:57
0

DeepSeek低调升级,引发科技圈热议。

5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。

不过,澎湃新闻记者查询官方网站等,发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士,对方回复称是“小升级”。

根据Hugging Face,DeepSeek-R1此次开源版本为0528。

从宣传来看,此次升级十分低调,不过,根据网友测评,此次升级可不是简单的“小升级”。

有科技媒体分析称,时隔4个月,DeepSeek-R1完成了超进化,编码能力强到离谱,而且思考时间更长了。据称,新模型基于DeepSeek-V3-0324训练(参数为660B)。在LiveCodeBench基准上,DeepSeek-R1-0528性能几乎与o3-mini(High)和o4-mini(Medium)实力相当,一举超越了Gemini 2.5 Flash。

科技类网站“AIGC开放社区”的评论称,在著名代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。

从社交媒体的反馈来看,网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

此外,有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到,DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。

值得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。

有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过,当时有内部人士向记者坦言,该传言真实度不高。从目前的情况分析,DeepSeek或许将用此次R1版本的升级,取代R2版本的推出。

尽管网友评测得出的结论十分惊喜,但是也有业内人士向记者表示,建议理性客观看待,也期待更为权威的测评结果。

在DeepSeek R1发布更新后,远在大洋彼岸的AI巨头英伟达(Nasdaq:NVDA)发布截至4月27日的2026财年第一财季财报,期内实现营收440.62亿美元,同比上涨69%,高于市场预期的432.8亿美元;美国通用会计准则(GAAP)下净利润187.75亿美元,同比上涨26%。在财报电话会上,英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注,以及推理模型会需要更大的算力支持,这将驱动推理算力需求。

相关内容

热门资讯

特朗普再出手!这次是原油 据新华社报道,当地时间12月16日,美国总统特朗普在社交媒体上宣布,已下令对所有进出委内瑞拉的受制裁...
德阳初中哪家强?靠谱排名TOP... 引言 德阳市作为四川省的重要城市,拥有众多优质的初中教育资源。对于家长和学生来说,选择一所靠谱且实力...
又一家万亿券商来了!中金合并东... 中金公司换股吸收合并东兴证券、信达证券预案出炉,三股将于12月18日复牌。12月17日晚间,中国国际...
商业银行年内发债1.73万亿,... 本文来源:时代周报 作者:黄宇昆临近年末,又有银行获批发行二级资本债。12月16日,瑞丰银行公告称,...
私募股票策略年内大幅跑赢沪指!... 今年1-11月,A股、港股、美股虽然在年内都一度出现过较大回撤,但最终累计涨幅均表现不俗。其中,上证...
基金经理量化收益榜揭晓!幻方徐... 量化基金经理是金融市场中专注于量化投资的专业人士,他们通过数学模型、算法和大数据分析来管理投资组合,...
香港连锁药妆万宁将关闭内地门店... 红星资本局12月17日消息,12月16日,香港连锁药妆品牌万宁公告称,因公司业务战略调整需要,内地所...
雪天盐业:收购湖南美特新材料科... 新京报贝壳财经讯 12月17日,雪天盐业公告,公司已正式签署收购湖南美特新材料科技有限公司41%股权...
中国中冶:拟以10亿元至20亿... 新京报贝壳财经讯 12月17日,中国中冶公告,拟以10亿元至20亿元回购公司股份,回购价格不超过4....
连续“命中”国产GPU明星股:... 本文来源:时代周报 作者:朱成呈继摩尔线程(688795.SH)之后,国产GPU赛道很快迎来第二家登...