peopleevents
梁斌penny 2024-11-17 08:00+08:00Z
原微博

月之暗面牛啊//@蚁工厂://@可视化球:期待

@量子位

#杨植麟发布Kimi新模型# kimi全面开放一周年之际,创始人杨植麟亲自发布新模型——数学模型k0-math,对标OpenAI o1系列,主打深入思考。在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。在demo展示中,k0-math思考过程全面展示,解题过程可能会非常长。它会一边自言自语“我卡壳了”,一边不断尝试用各种思路。以下面这道AIME竞赛题目为例,k0-math通过不断探索和试错,尝试了八九次做法后,最终得出了正确结果。杨植麟现场直言,很简单的问题有时它也会反复思考。比如遇到简单的“1+1等于几”,它要“先可视化一下”,“再检查一遍”、“用数学方式来确认”、“再用另一种方法来验证”,最终才能“信心满满”得出最终答案1+1=2。再比如4046/476等于多少,它其实一开始就得到了答案,但又进行反思经过一系列验证推出等于8.5。在杨植麟看来,这是一个机遇,也是一个局限。预计在下一阶段的模型迭代中,会逐步改善这个问题,让模型能够自己知道何时需要深入思考。发布k0-math也反映出月之暗面现在的着重点——提升模型的深入思考能力、基于强化学习的Scaling Law。杨植麟表示最近Kimi探索版还运用强化学习技术创新搜索体验,提升了意图增强、信源分析和链式思考三大推理能力。k0-math模型和更强的Kimi探索版,未来几周就将分批陆续上线Kimi网页版和Kimi智能助手APP。除新产品外,杨植麟现场还一并回答了大伙儿感兴趣的诸多问题,包括接下来的研发重点、对多模态的看法、预训练情况等。网页链接

上一页103/995每页 10总共 9943下一页