深度求索宣布DeepSeek-V3.1正式发布。经查,目前新版模型已经默认同步上线官网、App,面向C端用户完全免费。
据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。
此外,新版模型拥有更高的思考效率,相比R1能在更短时间内给出答案。
不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。
比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。
另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。
对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。
猜你喜欢
- 2025-09-07 废弃选矿厂变身村级运动中心 湖北“村BA”总决赛热闹登场
- 2025-09-07 国务院办公厅印发《关于释放体育消费潜力进一步推进体育产业高质量发展的意见》
- 2025-09-07 美网综合 | 辛纳晋级男单半决赛 斯维亚特克无缘女单四强
- 2025-09-07 中国足协公开选聘国足主教练 目标参加2030世界杯
- 2025-09-07 未及时提交性别检测结果 法国女子拳击队无缘世锦赛
- 2025-09-07 国际足联裁判委员会主席:VAR非常成功但仍需改进
- 2025-09-07 荣耀Magic V Flip2备件维修价格出炉 主板最高超3000元
- 2025-09-07 美网综合 | 焦科维奇晋级四强约战阿尔卡拉斯
- 2025-09-07 国际奥委会征集2026年达喀尔青奥会奖牌设计
- 2025-09-07 机构预测iPhone 17系列维持原价 Pro变相涨价
- 搜索
-
- 0 次点击 废弃选矿厂变身村级运动中心 湖北“村BA”总决赛热闹登场
- 0 次点击 三星三折叠手机折叠方式曝光:不是Z、G字型
- 0 次点击 2025乒超联赛总决赛阵容出炉 乒超总决赛赛程时间公布
- 0 次点击 小米公布8折换电池机型名单 价格79.2元起
- 0 次点击 意甲综合:国米遭乌迪内斯逆转 拉齐奥大胜维罗纳
- 0 次点击 英超综合:“穿云箭”技惊四座 利物浦一球小胜阿森纳
- 0 次点击 乒超联赛常规赛收官 8队晋级总决赛
- 0 次点击 苹果首款折叠iPhone明年发布 郭明錤:不可能用屏下指纹
- 2025-09-07 废弃选矿厂变身村级运动中心 湖北“村BA”总决赛热闹登场
- 2025-09-07 国务院办公厅印发《关于释放体育消费潜力进一步推进体育产业高质量发展的意见》
- 2025-09-07 美网综合 | 辛纳晋级男单半决赛 斯维亚特克无缘女单四强
- 2025-09-07 中国足协公开选聘国足主教练 目标参加2030世界杯
- 2025-09-07 未及时提交性别检测结果 法国女子拳击队无缘世锦赛
- 2025-09-07 国际足联裁判委员会主席:VAR非常成功但仍需改进
- 2025-09-07 荣耀Magic V Flip2备件维修价格出炉 主板最高超3000元
- 2025-09-07 美网综合 | 焦科维奇晋级四强约战阿尔卡拉斯
- 2025-09-07 宋佳晒了跟好多人的合照 发文:都是鲜活热烈可爱有趣的人儿
- 2025-09-07 REDMI K90 Pro有望10月发布:堆料看齐大哥小米Pro
- 2025-09-07 中国职业围棋锦标赛芈昱廷、丁浩会师决赛
- 2025-09-07 2019年十大流行语具体是什么 2019最火的梗有哪些
- 2025-09-07 废弃选矿厂变身村级运动中心 湖北“村BA”总决赛热闹登场
- 2025-09-07 国务院办公厅印发《关于释放体育消费潜力进一步推进体育产业高质量发展的意见》
- 2025-09-07 美网综合 | 辛纳晋级男单半决赛 斯维亚特克无缘女单四强
- 2025-09-07 中国足协公开选聘国足主教练 目标参加2030世界杯
- 标签列表
-