@黄建同学
Kimi K2技术报告来了《Kimi K2: Open Agentic Intelligence》随着大语言模型(LLMs)从静态问答走向主动交互,「Agentic Intelligence」(代理式智能)成为推动 AI 新纪元的核心力量。Moonshot AI 发布的最新开源大模型 —— Kimi K2,正是这一方向上的一次重大突破。一、Kimi K2 是什么?Kimi K2 是一款 Mixture-of-Experts(MoE)架构 的大语言模型,具备:- 1.04 万亿参数(Trillion-scale Total Params)- 激活参数数为 320 亿(Activated Params)- 高效稳定的训练机制(MuonClip)- 多阶段后训练(含 RL 自我对齐)- 在多个领域性能 SOTA,尤其擅长代码、数学、工具使用换句话说,Kimi K2 是一位既懂编程又会推理、还能灵活使用工具的超级 AI 助手。二、为什么说它「强」?从公开评测数据来看,Kimi K2 在众多权威基准上表现优异:任务类型 测试集 得分 对比领先软件工程 SWE-Bench 65.8 超 GPT-4.1、Claude数学竞赛 AIME 2025 49.5 同级模型领先工具使用 Tau2-Bench 66.1 开源模型最高编程实战 LiveCodeBench v6 53.7 所有模型最高通用能力 MMLU-Redux 92.7 超过大多数闭源模型关键词:非思考设置下的 SOTA、全面领先、高效能三、它是怎么训练出来的?Kimi K2 在预训练与后训练阶段均做了大量创新设计。1. 预训练阶段 —— MuonClip 提高稳定性与效率- 使用 Muon 优化器,已在 Kimi K1.5 中证明能极大提升 token 效率;- 提出 QK-Clip 技术,动态裁剪 attention logits,防止训练不稳定;- 使用 15.5 万亿 token 进行训练,全程 无损失突刺(loss spike);- 架构采用 超稀疏 MoE + 多头隐式注意力(MLA),比 DeepSeek V3 更轻更强。2. 数据方面 —— 重写技术增强 token 价值为提升每个 token 的学习效率,Kimi 团队采用两类 智能重写:- 知识重写:通过多视角、多风格的 prompts 重写原文,增强语言多样性;- 数学重写:将数学文档转写为“学习笔记”风格,提高理解与推理能力。此外,还加入跨语种数学翻译数据,让模型更具多语言泛化能力。四、后训练阶段:打造真正的 AgentKimi K2 在后训练中重点强化了「代理式行为」,包括:1. 多阶段指令微调(SFT)构建大规模指令数据集,覆盖知识、代码、推理、对话等多个领域;利用 工具使用数据合成流水线,让模型学会调用复杂工具完成任务;采用人类评审 + LLM 评估,保障生成数据的质量与多样性。2. 强化学习(RL)自我对齐机制Verifiable RL:在数学、逻辑、代码等有明确正确性的任务中进行强化;Self-Critique RL:让模型自我比较多个输出,根据评分标准自行打分学习;自适应训练策略:包括 token budget 控制、探索性 temperature 衰减等;简而言之,Kimi 不再仅仅「模仿人」,而是在不断尝试、思考、优化自己的行为,朝「具备目标感与行动能力的智能体」迈进。五、开放性与社区友好Kimi K2 已在 HuggingFace 完整开源,包括:- base 模型与 instruct 模型 checkpoint;- 完整技术报告;- 官方评测基准对齐,方便社区复现与改进。地址:huggingface.co/moonshotai/Kimi-K2-Instruct六、总结Kimi K2 是当前开源 LLM 中少有的兼具:- 高性能(全面领先多数模型)- 高稳定性(训练过程无损失抖动)- 高代理能力(可作为工具使用者、任务执行者)的“通才型大模型”。它不仅在 benchmark 上发光,更重要的是为构建「能感知、能计划、能行动」的通用智能代理打下了坚实基础。论文:github.com/MoonshotAI/Kimi-K2/blob/main/tech_report.pdf#人工智能##程序员#
范马孔多
@开心鸭
一哥们喜提二胎,姓范,妈妈姓孔。男孩,大家给起个霸气点的名字。
#张雪峰多个账号被禁止关注#天意从来高难问,况人情老易悲难诉!更南浦,送君去。
@阑夕
性资源的不平等全球都在加剧,The Information的一篇报道说Tinder、Bumble这类约会社交应用的复费率开始暴跌,这届年轻人连每个月十几美金的订阅费都不想交了,与此同时在旧金山、纽约等一线城市新成立的高端私人婚介所却数量大增,这些公司没有App,只做30岁左右高净值客户的生意,服务费在5万美金左右,订单多到接不过来,不得不限制同时处理的客户人数,而且明显发现这一代脱单者的需求改变:对一对一的伴侣模式兴趣减弱,希望能够得到一对多的解决方案。哦对了,在替这些有钱但忙的新贵「物色」对象时,瑜伽教室是一个被明确提及的考察场所,所以上瑜伽课是真的有助于钓大鱼啊⋯⋯
1、一带一路国家还得除去不喝酒的那些。2、接受一种酒就是接受一种文化,想卖白酒给俄国,得先让俄国人认为喝白酒比喝伏特加更洋气更上档次,就像上世纪中国人看待“人头马”一样。
@楚团长聊聊天
白酒目前看来,只有卖给俄罗斯和一带一路国家,才有希望了,传统的消费场景,至少有30%永远也回不来了。
@混沌与概率1997
阿里真的是个好公司,他现在什么概念都有。芯片,算力,云,外卖,总之是紧跟热点,整个公司的战略方向都很对,马云战略确实厉害。而且估值才19倍,腾讯26倍,纳指43倍,显然阿里性价比凸显。热点追踪 | 阿里巴巴发布AI战略升级:推出Qwen3-Max大模型与"造点"创作平台在2025云栖大会上,阿里巴巴集团宣布多项AI领域重大突破。集团CEO吴泳铭表示,公司正在积极推进3800亿元人民币的AI基础设施建设,并计划追加更多投入。他指出,大模型将成为下一代操作系统,而全球最终可能仅存5-6个超级云计算平台。技术突破方面,阿里云正式推出迄今规模最大的Qwen3-Max模型。该模型在LMArena文本排行榜测试版中位列第三,超越GPT-5-Chat。正式版本在编程和智能体能力方面进一步提升,在知识覆盖、推理、多语言理解等综合基准测试中达到行业领先水平。据悉,仍在研发中的Qwen3-Max-Thinking版本已在多项高难度推理测试中取得100%准确率。同时,阿里巴巴旗下夸克应用发布全新AI创作平台"造点"。该平台整合了AI生图与AI生视频两大核心功能,成为国内首个支持音画同步视频生成的平台。"造点"集成了Midjourney V7图像生成模型和通义万相Wan2.5视频生成技术,可生成1080P高清视频,支持24帧/秒的流畅度,并实现音频视频同步输出。平台在亚洲人像生成、中文文字处理及国风元素创作方面表现突出。吴泳铭在演讲中阐述了AI发展的四阶段演进路径:从智能涌现、自主行动到自我迭代,最终实现超级人工智能(ASI)。他表示,为迎接ASI时代,到2032年阿里云全球数据中心的能耗规模将提升10倍,意味着算力投入将呈指数级增长。此外,阿里巴巴还推出了面向个人用户的终端AI智能体iFlow CLI,该工具支持通过自然语言指令完成从文件整理到复杂工作流程的自动化处理。#a股#
回复@互立叶变饭:1、切成两半;2、分别从两半上切下三分之一;3、把两小片作为一份。 查看图片 //@互立叶变饭:三分之一片很难切//@tombkeeper:回复@OBSERVER叁世:关于切药的问题: 查看2张图片 //@OBSERVER叁世:切片还挺麻烦的买了个便宜切片器每次损耗半片//@tombkeeper:回复@马洛伊正在等待戈多:推荐阅读: 查看图片 //@马洛伊正在等待戈多:可惜磺胺过敏,吃不了,有没有其他推荐//
@tombkeeper
前阵子我妈去一个海拔有点高的地方旅游。我给她准备了抗高原反应的药。她年轻时有过高原反应的历史,如果不吃药,再次发生高原反应的可能性很大。乙酰唑胺预防高原反应的常规用法是每次 125mg,每天两次。但现在国内卖的乙酰唑胺都是每片 250mg,所以得先切成两个半片。另外乙酰唑胺可能导致低血钾,所以最好配合氯化钾缓释剂。进入高海拔地区前一天晚上开始吃,吃到离开高海拔地区为止。所以这还是有些复杂的。我怕我妈搞不清楚。所以把药准备好后,没用瓶子装,而是用了 4cm*3cm 的小塑料袋,每次的药装一个小塑料袋。然后打印一张日程表,表上的每个方格对应旅途中某一天的早、晚。我查了她旅途中各个城市的海拔,然后把那些小塑料袋粘到需要吃药的方格上,这样就不会搞错了。更重要的是,这个表格能让我妈拿着跟别的老太太显摆。药瓶子只能装药,不能提供情绪价值。后来我妈对我说:“你给我的那个药特别好,我一点反应都没有,能吃能喝能睡,发的氧气我都没有用。一起来的有两个老太太夜里都到医院去了。”有了这个对比,情绪价值就更足了。