peopleevents
梁斌penny 2025-08-26 10:17+08:00Z
原微博

昨天那条说UE8M0 FP8的帖子火了,微博官方给做了推广,有一些错误我也没法改了(做过推广的微博都没办法改内容,官方规定)。有一些内容网友热烈讨论,有些网友是猛烈抨击,我考虑再三还是回应一下。槽点1:“FP36就是36位表达一个参数” 二进制没有36,这个纯手误,想改已经来不及了。槽点2:DeepSeek把UE8M0 FP8用在Scale上,Scale是参数吗?Scale就是一个量化因子嘛。见图1,为了压缩表示,原始参数拆分成 FP8参数*Scale。原始参数在计算的时候被还原,实体存在是参数块和Scale,问题是我这个问题是向炒股群众解释UE8M0 FP8,有必要说的这么细吗?讲清楚“FP8压缩了大小(相比F16),UE8M0去掉了小数部分,降低了芯片要求,提高了效率”,对于股民小散足够了,他们需要这么细节的内容吗?没有Scale,FP8参数块能成为参数吗?把Scale看成参数的一部分怎么就不可以呢?槽点3:“现在DeepSeek这么搞,加上国产芯片都向这个标准靠拢”。说的好像UE8M0标准是Ds提出的一样,这个标准2年前就有了,只是Ds拿来用,创新还是洋人的。标准是不是2年前提出的我不知道,但是Ds敢于尝试选择不一样的技术路线,然后国产芯片配合进行适配这个有什么问题,就因为没有提一嘴是洋人发明的,就错了?槽点4:英伟达的CUDA也支持UE8M0,你不会不知道吧,怎么DeepSeek和英伟达彻底决裂了呢?危言耸听了吧。怎么说呢?英伟达强大的开发能力,可以支持各种情况,但是国产芯片在通用性上暂时落后于英伟达,因此需要采取集中优化策略,必须要针对性优化,少走弯路集中火力,如果Ds和国产芯片紧密配合沿着一条路线走下去(而不是英伟达那种多条路线兼容),就有可能形成我们的局部优势,慢慢其他后来者,就可能在选择Ds大模型的同时选择国产芯片,而英伟达因为四面出击,反而不如国产芯片这么集中优化来得好,只有这样才能走出自己的路,否则跟着英伟达走,肯定是不行的。还有一些侮辱性语言,没有实质内容的,我就统一回复,“你是对的”。。

上一页341/995每页 10总共 9943下一页