peopleevents
梁斌penny 2025-01-30 17:31+08:00Z
原微博

假如,我说假如啊,有公司如果提供这种协助“偷师”业务,比如注册大量OpenAI账号,大量提交问题和回答对,让大模型来评价,用于辅助调优,会不会有什么风险?

@梁斌penny

我认为计算数据方面的工作核心价值,还是要提升数据对模型参数修正的价值。。 也就是需要高水平的“答案”和“评价”。 高水平答案可以通过一些启发式的猜测,比如互动数高,引用数高等来获得。也可以通过人工和机器标注。 前两个是我厂之前的主要工作重心。。现在大量引用了增强学习,需要有对结果评价的能力,从而获得模型输出和最佳评价结果的“误差”,给大模型提供提高的机会。 我想这个阶段我厂目前没有参与,我猜“可能”需要“偷师”现有其他大模型,比如训练过程中,模型同时给出三个结果,让其他大模型来打分,最终选择最好的,从而依靠其他大模型的能力来提高自己。我认为这个阶段“可能”大家都在用,最终大家结果都差不多,正常的。。不过,越是领先的大模型,通过卖血被动挣“同行”的钱就越多,但是不长久,同行水平很快就提高了,又不能完全避免,这就导致一个现实问题:很多大厂提供的API接口的数据和用户在app或者web方式看到的不一样,这几家不一样的,我不点名,大概率他们就偷师别人的,同时又避免自己被偷师。

上一页424/995每页 10总共 9943下一页