回复@Nadve3:当你灰心丧气的时候,想到发出这种xx的xx都还xx地xx在这个xx的xx上,就会觉得自己好像也没那么糟糕。//@Nadve3:啥意思没看明白
@t0mbkeeper
亲爱的朋友,如果你遭遇了一点逆境,开始怀疑自己是否值得是否配,请搜索“李飞飞 安检”。
@黄建同学
Kimi K2技术报告来了《Kimi K2: Open Agentic Intelligence》随着大语言模型(LLMs)从静态问答走向主动交互,「Agentic Intelligence」(代理式智能)成为推动 AI 新纪元的核心力量。Moonshot AI 发布的最新开源大模型 —— Kimi K2,正是这一方向上的一次重大突破。一、Kimi K2 是什么?Kimi K2 是一款 Mixture-of-Experts(MoE)架构 的大语言模型,具备:- 1.04 万亿参数(Trillion-scale Total Params)- 激活参数数为 320 亿(Activated Params)- 高效稳定的训练机制(MuonClip)- 多阶段后训练(含 RL 自我对齐)- 在多个领域性能 SOTA,尤其擅长代码、数学、工具使用换句话说,Kimi K2 是一位既懂编程又会推理、还能灵活使用工具的超级 AI 助手。二、为什么说它「强」?从公开评测数据来看,Kimi K2 在众多权威基准上表现优异:任务类型 测试集 得分 对比领先软件工程 SWE-Bench 65.8 超 GPT-4.1、Claude数学竞赛 AIME 2025 49.5 同级模型领先工具使用 Tau2-Bench 66.1 开源模型最高编程实战 LiveCodeBench v6 53.7 所有模型最高通用能力 MMLU-Redux 92.7 超过大多数闭源模型关键词:非思考设置下的 SOTA、全面领先、高效能三、它是怎么训练出来的?Kimi K2 在预训练与后训练阶段均做了大量创新设计。1. 预训练阶段 —— MuonClip 提高稳定性与效率- 使用 Muon 优化器,已在 Kimi K1.5 中证明能极大提升 token 效率;- 提出 QK-Clip 技术,动态裁剪 attention logits,防止训练不稳定;- 使用 15.5 万亿 token 进行训练,全程 无损失突刺(loss spike);- 架构采用 超稀疏 MoE + 多头隐式注意力(MLA),比 DeepSeek V3 更轻更强。2. 数据方面 —— 重写技术增强 token 价值为提升每个 token 的学习效率,Kimi 团队采用两类 智能重写:- 知识重写:通过多视角、多风格的 prompts 重写原文,增强语言多样性;- 数学重写:将数学文档转写为“学习笔记”风格,提高理解与推理能力。此外,还加入跨语种数学翻译数据,让模型更具多语言泛化能力。四、后训练阶段:打造真正的 AgentKimi K2 在后训练中重点强化了「代理式行为」,包括:1. 多阶段指令微调(SFT)构建大规模指令数据集,覆盖知识、代码、推理、对话等多个领域;利用 工具使用数据合成流水线,让模型学会调用复杂工具完成任务;采用人类评审 + LLM 评估,保障生成数据的质量与多样性。2. 强化学习(RL)自我对齐机制Verifiable RL:在数学、逻辑、代码等有明确正确性的任务中进行强化;Self-Critique RL:让模型自我比较多个输出,根据评分标准自行打分学习;自适应训练策略:包括 token budget 控制、探索性 temperature 衰减等;简而言之,Kimi 不再仅仅「模仿人」,而是在不断尝试、思考、优化自己的行为,朝「具备目标感与行动能力的智能体」迈进。五、开放性与社区友好Kimi K2 已在 HuggingFace 完整开源,包括:- base 模型与 instruct 模型 checkpoint;- 完整技术报告;- 官方评测基准对齐,方便社区复现与改进。地址:huggingface.co/moonshotai/Kimi-K2-Instruct六、总结Kimi K2 是当前开源 LLM 中少有的兼具:- 高性能(全面领先多数模型)- 高稳定性(训练过程无损失抖动)- 高代理能力(可作为工具使用者、任务执行者)的“通才型大模型”。它不仅在 benchmark 上发光,更重要的是为构建「能感知、能计划、能行动」的通用智能代理打下了坚实基础。论文:github.com/MoonshotAI/Kimi-K2/blob/main/tech_report.pdf#人工智能##程序员#
@FATIII
【韩媒:错关发动机导致济州航空空难】韩国媒体报道,韩国航空和铁路事故调查委员会(ARAIB)在其中期报告中得出结论,去年 12 月29日发生在韩国务安机场、造成179人死亡的济州航空2216航班坠机事件,是由于飞行员错误地关闭了正常运转的左侧发动机造成的。调查组原本认为鸟击损坏了两台发动机,导致电气和液压故障,从而使起落架无法展开,飞行员被迫进行紧急机腹着陆。然而,最新的调查结果确认左发动机本身没有缺陷,ARAIB发现发动机的电子控制系统运行正常,因此得出结论,发动机停止运转是手动操作造成的,而非系统故障。根据与家属分享的报告,飞行员本应关闭因鸟击严重受损的右侧发动机,但却关闭了仍在运转的左侧发动机。结果飞机双发失去动力,起落架未能正常展开。驾驶舱录音捕捉到飞行员说「关闭二号发动机」,即右侧发动机,但飞行数据显示,左侧一号发动机已经关闭。这表明飞行员可能在压力之下混淆了两个发动机。除此之外,飞行员还启动了左发灭火装置,导致该发动机在飞行中无法重新启动。媒体报道,该委员会原计划在家属简报会后立即向媒体公布调查结果,但由于家属强烈反对,最终取消了发布。一位家属告诉《朝鲜日报》:“委员会无视跑道尽头的混凝土斜坡和可能存在的机械故障等问题,只是简单地将责任推卸给飞行员,这让我们无法接受。”类似的事情虽然罕见,但并非没有发生过,2015年2月4日,我国台湾省复兴航空235航班从台北松山机场起飞时因右发发生顺桨需关闭,然而机长却将正常工作的左发关闭,导致飞机以偏转90度姿态擦过高速公路坠入基隆河,机上58人中43人遇难。#航空创作计划##济州航空空难#
AI 圈目前这种拿钱砸人的搞法我觉得最终结果也还是要取决于组织本身的基因,而不是到底挖来多少人。也就是说,对大部分组织来说,这个搞法的性价比可能极低。若是论高级 AI 人才的密度,十年前的百度不光在国内一时无两,就算放到硅谷也能排在前面。
#中国能否造出自己的ASML# 我掐指一算,2027 年底之前也许就能看到 EUV 光刻机的实验样机,然后再用 5 年左右实现商业化供货。
有人看到某校的 MBA 学费五十多万,觉得学校想钱想疯了。他算了一下,招生一千多人,学费就六个亿。其实 MBA 就是这个价。这还不是最贵的,国内最贵的 MBA 是七十多万。如果 EMBA 那七八十万就很寻常。MBA 不是义务教育,本来就是高净值人群的圈子,所以也免不了兼顾资产重组平台的角色。我去某 MBA 讲课时曾听招生的老师说,他们某期一个班里就成了八对。往好处想想——如果你觉得学习是痛苦的事,那么让有钱人花钱买罪受不好吗?
黄仁勋这次来华,唐装也穿了,央视也上了。无论是在链博会的发言还是在《面对面》的访谈,都谦和得体不卑不亢。这里面当然有老黄个人的工程师魅力在里面,但我更多还是感叹英伟达在中国大陆的公关团队真厉害。