开云网页版网址

DeepSeek冲击波已经到达美股: 英伟达市值蒸发17%, 全球技术团队争相“复现”R1

发布日期:2025-02-04 10:41点击次数:88

北京时间1月28日,美股收盘,英伟达下跌16.86%,市值蒸发5888.62亿美元(约合人民币4.27万亿元),创下美股纪录。业界分析这与DeepSeek带来的冲击直接相关,该公司在训练明星产品DeepSeek-V3开源大模型的过程中,仅使用了2,048块H800显卡,这与英伟达与OpenAI们所讲的技术故事有所不同。

一位英伟达发言人在评价DeepSeek的成果时表示:“DeepSeek是一个出色的AI技术进步,也是测试时间尺度(TestTimeScaling)的一个完美例子,”“DeepSeek的工作说明了如何利用这一技术来创建新的模型。”当地时间1月27日,美国总统特朗普表示中国AI应用的突然兴起对于美国科技公司来说“应该是一个警钟”,但他同时表示仍对美国公司保持期望。

全世界技术圈还在以饱满的热情热议DeepSeek,该公司也适时发布了一系列名为JanusPro的基于视觉的多模态AI开源模型,并表示模型性能优于OpenAI的DALL-E3。

新模型是对去年底推出的Janus的升级。JanusPro通过升级训练流程、数据质量和模型大小对Janus进行了改进,从而提高了图像稳定性和细节丰富性。Janus-Pro通过添加7,200万张高质量合成图像并将其与真实世界数据进行平衡,实现了更具视觉吸引力和更稳定的图像输出。

JanusPro系列模型参数的大小从1B到7B不等,参数较多的模型比参数较少的模型表现更好。目前,JanusPro已经获得了MIT协议许可,这意味着它可以在商业上不受限制地使用。

DeepSeek将JanusPro描述为“新颖的自回归框架”,它既能理解图片又能生成图片,兼具图像生成、视觉问答和图像字幕等功能。DeepSeek表示,在GenEval和DPGBench中两个AI评估基准,这一系列模型中参数最大的Janus-Pro-7B击败了DALL-E3以及PixArtalpha、Emu3-Gen和StabilityAI的StableDiffusionXL等型号。

DeepSeek在HuggingFace上的一篇文章中写道:“JanusPro的简单性、高度灵活性和有效性使其成为下一代统一多模式模型的有力候选者。”

要知道,只需一台普通电脑就能运行Janus-Pro-7B,同时可以生成分辨率为384x384的图。网友“冷雨寻双”表示这就好比“用五菱宏光跑出了保时捷的加速度”。虽然图片的尺寸不算太大,但是考虑到其参数只有7B,所以正如DeepSeek在上述文章中所写的:“JanusPro旨在实现性能和计算成本之间的平衡。”目前,在HuggingFace上,Janus-Pro位居模型下载排行榜第二名,第一名则是DeepSeek-R1。

通过发布JanusPro7B,DeepSeek将其范围从语言处理扩展到计算机视觉这一关键领域。由于JanusPro7B不需要大量的计算资源,因此可以大大降低希望将先进视觉AI集成到企业业务的门槛。无论是初创公司还是大型公司,都可以在不产生过高基础设施成本的情况下来部署先进的视觉智能模型。

与此同时,DeepSeek的APP已经登上苹果应用商店排行榜榜首,超过了ChatGPT。不过,1‍月27日,DeepSeek表示其服务器遭到大规模恶意攻击,因此它暂定了注册。

因为最近一系列产品的良好表现,。许多技术团队也在尝试复现这一技术成果,来自美国加州大学伯克利分校、香港科技大学和HuggingFace的研究人员均已成功复现DeepSeek模型。这些研究人员发现仅仅使用强化学习,无需使用监督微调,仅用30美元就能见证“奇迹”。

比如,加州大学伯克利分校的研究人员在CountDown游戏中复现了DeepSeekR1-Zero。他们证明只需使用强化学习,让参数仅有3B的基础语言模型也能实现自我验证和自我搜索。

香港科技大学的研究人员使用8K个样本,成功在7B模型上复现DeepSeek-R1-Zero和DeepSeek-R1的训练。具体来说,他们以Qwen2.5-Math-7B作为基础模型,通过对其进行强化学习,在不进行监督微调和没有使用奖励模型的情况下,让Qwen2.5-Math-7B在AIME基准上达到33.3%的准确率,在AMC上达到62.5%的准确率,在MATH上达到77.2%的准确率。

而HuggingFace则已官宣其复刻了DeepSeekR1的所有流程(pipeline),其从DeepSeek-R1中蒸馏出来高质量语料库,复现了R1-Distill模型。

总的来说,犹记得一年前的2024开年,人们都在关注OpenAI的Sora。一年后的2025年开年,所有注意力都转移到DeepSeek身上,这似乎是“换了人间”。

上一篇:没有了

下一篇:老牌国货正焕发新生

推荐资讯