peopleevents
梁斌penny 2025-02-28 07:56+08:00Z
原微博

grok3用了几天,我发现这个思维链过程太长了,消耗估计非常大,好在老马有钱,能烧。另外一个问题就是思维链参考的文章,思维链的过程都能瞥见老马在联网搜索中用到知识库的一些设计思路,比如每个问题产生的所有搜索和搜索结果都给出了,这个数据非常非常重要和关键,稍微找个几千万条,就能训练出一个靠谱的COT。。现在大模型这个行业投入太大了,我们也要努力,要不然真是一步赶不上,步步赶不上,还是要加大投入啊。

上一页439/995每页 10总共 9943下一页