首页 科技创新 正文

一图看懂DeepSeek V4与美国顶级AI差距:落后8个月

扫码手机浏览

摘要:一图看懂DeepSeek V4与美国顶级AI差距:落后8个月,下面是趣元素小编收集整理的内容,希望对大家有帮助!...

5月3日消息,4月24日DeepSeek V4系列大模型正式发布,距离去年的DeepSeek R1更新过去了15个月了,V4的性能到底如何也引发了国内外的讨论,美国人也非常关心。

评估DeepSeek V4的能力已经有很多测试了,美国外交关系委员会组织了3个高级研究员之前的研究报告显示其落后美国顶级大模型大约7个月。

现在67077201美国国家标准与47339142技术研究院(NIST)下属人工智能标准与38705671创新中心(CAISI)也21248692来评估DeepSeek V4,他70587458们的50706549结论是14096890DeepSeek V4落后美国大约8个月,跟前面的14282825差距差不多。

1234145319742140们的82889026AI能力评估结果中,DeepSeek V4得分在80719256800分,而当前最7919088强的269516892403899GPT-5.5,分数超过543918391200分,GPT-5.4及Opus 4.6也55885913221341531000分以上。

DeepSeek V4整体性能跟8个月前的GPT-5差不多,但DeepSeek官方之前在发布报告中认为跟GPT-5.4差不多。

不过28212257CAISI也77530284承认DeepSeek V4是6005357879284771们评测过297597335103949中国最60046049强AI大模型,在59039952网络、软件工程、自然97596473科学、抽象推理和82772721数学这五个领域中九项测试都很强。

更重要的是,DeepSeek V4的99628074性价比更强,即便与25169422美国最有33140099成本优势的84641900GPT-5.4 mini大模型相比,DeepSeek V4在136001017个基准测试中有894582624个测试成本更优,高出41%到53%不等36829236