”梁博,你说的SFT过程,假定用数千万提问回答对给大模型训练,增强能力。那如果有一个问题属于同领域,但不在这个训练过程中出现过,大模型是不是就不能回答了呢?“这个就是大模型的涌现能力了,他见过数千万训练数据,误差都能收敛,说明已经具备了信息压缩和理解能力,那么大概率可以回答你这个从来没出现过的新问题,就是这么神奇。这种感觉就是你参加高考,把1000多道数学题都做得烂熟,那么考试的时候,遇到一个新题目,你自然能产生解题的灵感是一样的。当然了现在大模型发展到,可以把这种答案产生的过程,形成一个链路,最终出答案,而不是”直出“答案,从而获得更好的效果。总之遇到一个完全”新“的问题,是可以大概率优雅解决的。
@陌尘上
传字节跳动2026年从华为采购昇腾芯片 订单总额或超400亿元12月28日晚间消息,据媒体报道,字节2026年从华为采购的昇腾芯片订单总额或将超过400亿元,而在2025年这一数值近乎为零。其中,首批芯片即将开启交付,规模达百亿级,将成为国产算力发展的里程碑时刻。相关报道指出,字节大规模加大国产算力采购,动力来自两方面:一是2025年4月英伟达H20断供后,算力缺口显现;二是其云计算业务火山引擎和AI应用豆包的Tokens调用量爆发式增长。为此,字节开始加速与华为的深度合作。
有网友回测了我的策略,当然并不非常严谨。。其实这个策略还有一些细节的地方,有很多可以调节的微操,当然最后这个微操能提高多少不好说,会把简单的东西复杂化,我会在股东大会上详细讲。有些网友说我这个策略肯定是要大亏的,房价都跌了,策略执行100年,肯定会亏一年的。问题是我这个就执行明年一年,也是根据现在SPY,QQQ收益收紧的前提下,执行的相对保守的策略,为什么一定要执行100年呢?这么保守都亏的话,其他还不更容易亏?还有就是说我今年没跑赢大盘收益率,有什么好吹的,我今年确实都是轻仓跑下来的,虽然没跑赢大盘,但是还算比较稳健,这个策略也需要在实践中打磨,没跑赢大盘不是很正常嘛?跑赢理财就可以了啊。。