开云kaiyun.comDeepSeek V3果然称我方是ChatGPT-kaiyun登录官网

栏目分类开云kaiyun.comDeepSeek V3果然称我方是ChatGPT-kaiyun登录官网

你的位置:kaiyun登录官网 > 新闻动态 >

开云kaiyun.comDeepSeek V3果然称我方是ChatGPT-kaiyun登录官网

发布日期:2025-01-15 07:26    点击次数:127

开云kaiyun.comDeepSeek V3果然称我方是ChatGPT-kaiyun登录官网

金磊 发自 凹非寺开云kaiyun.com

量子位 | 公众号 QbitAI

要说这两天大模子圈的顶流话题,那完全吵嘴DeepSeek V3莫属了。

不外在网友们纷纷测试之际,有个bug也成了热议的焦点——

仅仅少了一个问号,DeepSeek V3果然称我方是ChatGPT。

以致让它讲个见笑,生成的甘休亦然跟ChatGPT同样:

加之DeepSeek V3此次爆火的一个亮点,就是老到只花了557.6万好意思元的本钱。

于是乎,有东说念主就驱动怀疑了:它不会是在ChatGPT的输出基础上老到的吧?

张开剩余90%

好巧不巧,Altman也发了一个现象,似乎在暗讽着什么……

不外DeepSeek V3并非是第一个出现“报错家门”的大模子。

举例Gemini就曾说过我方是百度的文心一言……

那么这到底是奈何一趟事?

为什么DeepSeek V3报错家门?

最初需要强调的少许是,从咫尺网友们合座征询的不雅点来看,说DeepSeek V3是在ChatGPT输出上老到的可能性不大。

之是以这样说,正如网友Riley Goodside所记忆的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3挑升用ChatGPT的输出作念了老到,但这并不遑急。悉数在ChatGPT之后出现的大模子,简直皆见过它。

举例ShareGPT,一个并不清新的ChatGPT对话数据集,好多东说念主照旧尝试在它和其它ChatGPT数据源上进行退换。但即便如斯,也没能出现DeepSeek V3级别的大模子。

即便DeepSeek V3挑升用ChatGPT的输出作念了老到,但这并不遑急。悉数在ChatGPT之后出现的大模子,简直皆见过它。

举例ShareGPT,一个并不清新的ChatGPT对话数据集,好多东说念主照旧尝试在它和其它ChatGPT数据源上进行退换。但即便如斯,也没能出现DeepSeek V3级别的大模子。

紧接着,Riley Goodside又拿出了DeepSeek V3叙述中的一些把柄:

何况如果用了ChatGPT数据的话,有些对于DeepSeek V3质地的问题是诠释欠亨的。

举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B止境,这跟它接没构兵ChatGPT数据无关。

何况叙述称95%的GPU-hours用于预老到基础模子,即即是跟ChatGPT数据相关,那这部分也会在post-training阶段发生(后5%)。

何况如果用了ChatGPT数据的话,有些对于DeepSeek V3质地的问题是诠释欠亨的。

举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B止境,这跟它接没构兵ChatGPT数据无关。

何况叙述称95%的GPU-hours用于预老到基础模子,即即是跟ChatGPT数据相关,那这部分也会在post-training阶段发生(后5%)。

而比升引没用ChatGPT数据,或者咱们应当愈加柔软的是为什么大模子会经常出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评:

因为AI公司们得回数据的地点——齐集,正在充斥着AI垃圾。

因为AI公司们得回数据的地点——齐集,正在充斥着AI垃圾。

毕竟欧盟的一份叙述曾瞻望,到2026年,90%的在线实质可能是AI生成的。

这种“AI稠浊”就会让“老到数据透澈过滤AI的输出”变得贫瘠。

AI Now Institute的首席科学家Heidy Khlaaf则示意:

尽管存在风险,建造者依然被从现存AI模子中“蒸馏”常识所带来的本钱精炼所引诱。

不测地在ChatGPT或GPT-4输出上进行老到的模子,也不一定会展示出让东说念主念念起OpenAI定制音信的输出。

尽管存在风险,建造者依然被从现存AI模子中“蒸馏”常识所带来的本钱精炼所引诱。

不测地在ChatGPT或GPT-4输出上进行老到的模子,也不一定会展示出让东说念主念念起OpenAI定制音信的输出。

那么咫尺对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3咫尺还莫得处分这个bug。

依旧是少了个问号,修起甘休会不同样:

DeepSeek V3更多玩法

不外有一说一,绝大部分网友对于DeepSeek V3的才智是给以了大大的详情。

而就在这两天,网友们不时晒出了更多DeepSeek V3加捏的实用玩法。

举例有网友拿DeepSeek V3和Claude Sonnet 3.5一决上下,在Scroll Hub均折柳用它俩创建网站:

博主在测试之后,觉得DeepSeek V3完全胜出!

还有网友共享了用DeepSeek V3在AI视频裁剪器中的体验。

他示意以后无谓再在FFMPEG号召上赔本期间了,DeepSeek V3不仅免费,还能改动你的责任历程:

AI编程神器Cursor也能跟DeepSeek V3联结,来看一个作念贪馋蛇的案例:

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友柔软到了一个非期间性的细节——

孝顺列表中,不仅展示了期间东说念主员,还极度据防护和商务等责任主说念主员:

网友觉得这种作念法相等合乎DeepSeek的调性:

参考联结:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

— 完—开云kaiyun.com

发布于:北京市