peopleevents
梁斌penny 2025-08-25 11:16+08:00Z
原微博

有网友让我谈谈DeepSeek-V3.1 发布后对产业界的影响,以及国产推理芯片比如华为昇腾会不会大卖,代工方会有什么收益。。也有网友让我介绍下UE8M0 FP8。答:网友一般都是老套路了,我要是说了新闻里面都写的,说我没水平;说了新闻里面没有的,基本就是造谣和水平不高;做一点科普解释,那就是水平不够,还瞎科普。但是我也习惯了,毕竟还是有一小部分真诚网友希望听我讲讲。DeepSeek这次为什么非要强调UE8M0 FP8呢?这个和英伟达的FP8是两个东西,两套标准,正式决裂。显存的发展是有限的,而模型的发展是快速的,对每个参数的表达必须通过量化进行压缩,FP36就是36位表达一个参数,FP8就是8位表达一个参数,在可接受的范围内,肯定是越低的表达,在显存里面能装下更多的参数。而就是FP8有英伟达的E4M3 / E5M2方案和DS的这个UE8M0 方案,主要区别就是前者有3-2位的小数表达,后者没有小数表达。前者精度好,后者功耗低,运算快,对芯片要求低。现在DeepSeek这么搞,加上国产芯片都向这个标准靠拢,这是彻底和英伟达决裂了,以后其他推理模型,要么选择DS这套体系,要么选择英伟达体系,国内芯片公司也积极向这套体系靠拢。现在华为他们那边真是为了适配这个标准,真是玩命干,干成了就是名垂千古,多大诱惑,而且我发现DeepSeek还真是有胆量,真是把国产大模型的发展推到了一个牛逼的高度上去,太了不起了。当然了,我水平也不高,大家随便批判,我也习惯了。。

上一页269/995每页 10总共 9943下一页