@黄建同学
Kimi K2技术报告来了《Kimi K2: Open Agentic Intelligence》随着大语言模型(LLMs)从静态问答走向主动交互,「Agentic Intelligence」(代理式智能)成为推动 AI 新纪元的核心力量。Moonshot AI 发布的最新开源大模型 —— Kimi K2,正是这一方向上的一次重大突破。一、Kimi K2 是什么?Kimi K2 是一款 Mixture-of-Experts(MoE)架构 的大语言模型,具备:- 1.04 万亿参数(Trillion-scale Total Params)- 激活参数数为 320 亿(Activated Params)- 高效稳定的训练机制(MuonClip)- 多阶段后训练(含 RL 自我对齐)- 在多个领域性能 SOTA,尤其擅长代码、数学、工具使用换句话说,Kimi K2 是一位既懂编程又会推理、还能灵活使用工具的超级 AI 助手。二、为什么说它「强」?从公开评测数据来看,Kimi K2 在众多权威基准上表现优异:任务类型 测试集 得分 对比领先软件工程 SWE-Bench 65.8 超 GPT-4.1、Claude数学竞赛 AIME 2025 49.5 同级模型领先工具使用 Tau2-Bench 66.1 开源模型最高编程实战 LiveCodeBench v6 53.7 所有模型最高通用能力 MMLU-Redux 92.7 超过大多数闭源模型关键词:非思考设置下的 SOTA、全面领先、高效能三、它是怎么训练出来的?Kimi K2 在预训练与后训练阶段均做了大量创新设计。1. 预训练阶段 —— MuonClip 提高稳定性与效率- 使用 Muon 优化器,已在 Kimi K1.5 中证明能极大提升 token 效率;- 提出 QK-Clip 技术,动态裁剪 attention logits,防止训练不稳定;- 使用 15.5 万亿 token 进行训练,全程 无损失突刺(loss spike);- 架构采用 超稀疏 MoE + 多头隐式注意力(MLA),比 DeepSeek V3 更轻更强。2. 数据方面 —— 重写技术增强 token 价值为提升每个 token 的学习效率,Kimi 团队采用两类 智能重写:- 知识重写:通过多视角、多风格的 prompts 重写原文,增强语言多样性;- 数学重写:将数学文档转写为“学习笔记”风格,提高理解与推理能力。此外,还加入跨语种数学翻译数据,让模型更具多语言泛化能力。四、后训练阶段:打造真正的 AgentKimi K2 在后训练中重点强化了「代理式行为」,包括:1. 多阶段指令微调(SFT)构建大规模指令数据集,覆盖知识、代码、推理、对话等多个领域;利用 工具使用数据合成流水线,让模型学会调用复杂工具完成任务;采用人类评审 + LLM 评估,保障生成数据的质量与多样性。2. 强化学习(RL)自我对齐机制Verifiable RL:在数学、逻辑、代码等有明确正确性的任务中进行强化;Self-Critique RL:让模型自我比较多个输出,根据评分标准自行打分学习;自适应训练策略:包括 token budget 控制、探索性 temperature 衰减等;简而言之,Kimi 不再仅仅「模仿人」,而是在不断尝试、思考、优化自己的行为,朝「具备目标感与行动能力的智能体」迈进。五、开放性与社区友好Kimi K2 已在 HuggingFace 完整开源,包括:- base 模型与 instruct 模型 checkpoint;- 完整技术报告;- 官方评测基准对齐,方便社区复现与改进。地址:huggingface.co/moonshotai/Kimi-K2-Instruct六、总结Kimi K2 是当前开源 LLM 中少有的兼具:- 高性能(全面领先多数模型)- 高稳定性(训练过程无损失抖动)- 高代理能力(可作为工具使用者、任务执行者)的“通才型大模型”。它不仅在 benchmark 上发光,更重要的是为构建「能感知、能计划、能行动」的通用智能代理打下了坚实基础。论文:github.com/MoonshotAI/Kimi-K2/blob/main/tech_report.pdf#人工智能##程序员#
2019 年诺贝尔化学奖颁给了三位在锂电池发展过程中做出里程碑级贡献的科学家。所以,手机里的锂电池,汽车里的锂电池,宁德时代也好,比亚迪也好,我国的新能源产业也好,都离不开 2019 年诺贝尔化学奖。“诺贝尔奖帮助不了科技发展”是特供给国有韭菜资源的精准饲料,我的粉丝应该不至于相信这类论调。不过正好借此机会顺便跟大家谈谈诺贝尔奖和我们的生活具体有什么关系。当一个人敲下“诺贝尔奖帮助不了科技发展”这 12 个字,首先会显示在屏幕上。如果屏幕是比较新比较好的,有可能用了量子点背光,这个技术获得了 2023 年诺贝尔化学奖。如果用的是 OLED 屏,其生产过程用了钯催化交叉偶联反应,这是 2010 年诺贝尔化学奖。如果用的是液晶屏,液晶相变理论是 1991 年诺贝尔物理学奖——对了,液晶屏的背光技术依赖于 2014 年物理学奖的成果。当这 12 个字被发到微博上,数据就顺着光纤一路来到了新浪的服务器。光纤通信离不开 2009 年诺贝尔物理学奖。首先保存这 12 个字的硬盘大概是固态硬盘,不过最后数据会被归档存储,这时候用的很可能是机械硬盘。现代机械硬盘全都是基于巨磁阻效应制造的,这是 2007 年诺贝尔物理学奖。就算不发微博,用铅笔把字写在纸上,然而头顶上照明用的 LED 灯也是基于 2014 年物理学奖的成果。
回复@焚稿祭鬼://@焚稿祭鬼:媒体还是需要多传播这种故事,就是说我们要实事求是的秀恩爱~~~我和冉冉结婚时,冉冉给我买了整整一套电脑、游戏机、衣服,还把家里展示柜很大一部分放了喜欢的模型玩具。现在芽芽3岁了,两个人还是很恩爱温馨~~虽然结婚了,现在还不时约会谈恋爱。
@tombkeeper
这几天那个“接亲时新郎算出堵门游戏的答案是5090结果新娘就拿出了一个5090”(图一),有人甜有人酸,还有人说是 AI 图。我找到了新郎和新娘自己发的相关内容。首先,实际上不止一个 5090,新娘送了一整套硬件作为给新郎的惊喜(图二);其次,这些东西根本不算啥,5090 就是个屁。新郎新娘都是南京人。两人是高中同学,属于“早恋”,高二时候晚上在操场手拉手散步,被校长和教导主任拿手电筒照着抓了个现行。今年是他们恋爱的第 13 年。高中毕业后,两人经历了 5 年的异国恋、6 年的异地恋,最后还是终成眷属。这是婚礼上新娘读的誓言://====亲爱的王子丰同学,你好,这是一封来自2015年的来信,9月的这一天,我们刚刚从高中毕业,即将迎来人生的新阶段,听说这封信会寄给10年以后的你,19岁的我对29岁的我们充满了好奇。10年之后的我们有变成自由的大人吗,有做自己喜欢的事吗,我会拥有一只小狗吗,我们还在一起吗。你就要出国了,听说异国恋的成功率只有百分之20,我们会成为那其中之一吗。你是一个极具责任心,阳光善良的男孩,和你在一起,总是很快乐,你说过会带我看遍世界上各种地方晚霞,会尝遍每一个角落的美食,会在傍晚的海边向我求婚,会在亲朋好友的见证下,迎来最美好的婚礼。我们实现了嘛?未来太遥远了,10年变化太多了。但我相信我们的目标自始至终都不会改变,我们的信仰无论何时都不会动摇,我们能做到吗,我们能做到吧。你是我信任且忠诚的伙伴,是我宇宙中最闪亮的星星,是唯一贯穿我所有诗篇的韵脚,是我浪漫且永恒的春天。我们会有很多个10年吧,2025年的时候,我们一定实现曾经的愿望了,你也一定收到这封信了,我们也一定会幸福的,对吧。====//他们的小狗叫 uu。婚礼上是 uu 担任戒童,把戒指给新郎新娘送过去的。现在你们还觉得在他们的故事里 5090 是多大的事儿吗?世界就是这样,愿意生活那就生活,愿意生气那就生气。祝福这对年轻人。
这几天那个“接亲时新郎算出堵门游戏的答案是5090结果新娘就拿出了一个5090”(图一),有人甜有人酸,还有人说是 AI 图。我找到了新郎和新娘自己发的相关内容。首先,实际上不止一个 5090,新娘送了一整套硬件作为给新郎的惊喜(图二);其次,这些东西根本不算啥,5090 就是个屁。新郎叫王子丰,新娘叫孟子筠,都是南京人。两人是高中同学,属于“早恋”,高二时候晚上在操场手拉手散步,被校长和教导主任拿手电筒照着抓了个现行。今年是他们恋爱的第 13 年。高中毕业后,两人经历了 5 年的异国恋、6 年的异地恋,最后还是终成眷属。这是婚礼上新娘读的誓言://====亲爱的王子丰同学,你好,这是一封来自2015年的来信,9月的这一天,我们刚刚从高中毕业,即将迎来人生的新阶段,听说这封信会寄给10年以后的你,19岁的我对29岁的我们充满了好奇。10年之后的我们有变成自由的大人吗,有做自己喜欢的事吗,我会拥有一只小狗吗,我们还在一起吗。你就要出国了,听说异国恋的成功率只有百分之20,我们会成为那其中之一吗。你是一个极具责任心,阳光善良的男孩,和你在一起,总是很快乐,你说过会带我看遍世界上各种地方晚霞,会尝遍每一个角落的美食,会在傍晚的海边向我求婚,会在亲朋好友的见证下,迎来最美好的婚礼。我们实现了嘛?未来太遥远了,10年变化太多了。但我相信我们的目标自始至终都不会改变,我们的信仰无论何时都不会动摇,我们能做到吗,我们能做到吧。你是我信任且忠诚的伙伴,是我宇宙中最闪亮的星星,是唯一贯穿我所有诗篇的韵脚,是我浪漫且永恒的春天。我们会有很多个10年吧,2025年的时候,我们一定实现曾经的愿望了,你也一定收到这封信了,我们也一定会幸福的,对吧。====//他们的小狗叫 uu。婚礼上是 uu 担任戒童,把戒指给新郎新娘送过去的。现在你们还觉得在他们的故事里 5090 是多大的事儿吗?世界就是这样,愿意生活那就生活,愿意生气那就生气。祝福这对年轻人。Translate content00:3400:4302:43
汇丰私人银行发布了 2025 年的《汇丰环球企业家财富报告》。“香港绝大部分(93%)的企业家都看好业务前景,且84%对个人财富有乐观的展望,当中他们认为业务前景(51%)及投资组合的表现(46%)是最主要的两项推动因素”“全球超过五分之三(62%)的企业家指科技进步或人工智能是推动业务正面发展的首要因素,而投资于人工智能项目则是最普遍的扩展策略”
这套话语体系非常贴合韭基的思维。2020 年 2 月,韭基群体里就有一种类似的论调,批评科研人员“不投入抗疫却跑去发论文”。//@卤煮疫苗:我一直很好奇他是干啥的……//@岛猫大脸猫:针对文科生、尤其是文科背景有当官梦的那些人,用他们爱听的方式,让他们觉得自己能指点科技的江山、霸凌科技人员//@科技INF:各位不得反思一下,他怎么那么多粉丝//@北京DLL:博主搭理这样的物种干什么?
@马延明
项立刚老师是真厉害,诺贝尔评审委员会应该反思:1、发现电磁感应现象的法拉第,为什么没有直接发明出便宜好用的家用电器?2、 发现DNA双螺旋结构的沃森和克里克,为什么没有直接开办基因治疗医院?3、提出深度学习理论的科学家,为什么没有直接造出物美价廉的自动驾驶汽车?4、量子力学奖项获得者,为什么就不造半导体器件、激光、量子密码学和量子计算机?为什么不造磁共振成像(MRI)、量子点靶向治疗、量子传感器等产品?5、……太多的为什么只有理论,没有直接产品?项立刚老师肯定能在不使用基础科学的基础上,造出造福全人类的新型技术性产品。
回复@Life无法Debug:糯米鸡是不是粽子?筋膜枪是不是震楼器?//@Life无法Debug:震楼器我记得会被处罚,但是在家敲鼓…
@tombkeeper
做了吊顶,是没办法用震楼器的。所以,装修的时候就要考虑预埋震楼器适配口。不过目前震楼器还没有相关国家标准。从弘扬传统文化的角度考虑,可以在吊顶里预埋一面法鼓。
清华 1996 年招了 2321 人,2025 年也不过招了 4000 人。但同期全国大学扩招了 10 倍以上。扩招可以把更多人送进大学,但并不能改变人类劦值的钟形曲线。参考:微博正文 //@出版人周筠:戒,定//@程序员邹欣:自律//@李微敖:是的,至少在2000年之前,北大清华远远没有现在这样被神话,我们班同学里,全省前20乃至前10的,就有好多个。如今真正在各自事业上比较有成就的,基本上一开始成绩就是顶儿尖儿地好,而且,工作这些年,依然持续在努力……
@青光楚辞
我老妈年轻时带过不同大学的徒弟,对清北评价极高,那里的学生,只要交给工作任务,关起门能自己完成,不需要太多指导,所以她相信学历等于能力。这里需要插一句,其实同一专业在不同学校的课程设置差不太多,但名校学生往往表现出强大的自律和学习能力。家族聚会,她的一个侄子,也就是我表弟,同样感慨:“我现在招的大学生,都是从我没听说过的学校毕业的,一个个像二傻子。”名校毕业生很难留在本地,这是深层问题,还有一个问题是,其实很多人不适合上大学。我补充一下,偏偏又是这些人目高于顶,连家长都觉得,我家孩子上大学了,还能随便找工作吗?#生活手记#
做了吊顶,是没办法用震楼器的。所以,装修的时候就要考虑预埋震楼器适配口。不过目前震楼器还没有相关国家标准。从弘扬传统文化的角度考虑,可以在吊顶里预埋一面法鼓。