latter

penny

梁斌penny 2025-04-17 22:23+08:00Z

原微博

胆子大是核心竞争力

@朱亚东-数元灵

刚看到一个新闻，某套壳解决方案公司，年营收2.43 亿，亏损12.55 亿，然后准备赴港股上市，这真的是亏的连亲妈都不认识了，更重要的是，一堆顶级 vc 都在里面，太牛逼了，感觉是梁博说的，我们胆子还是太小了。。

梁斌penny 2025-03-01 11:35+08:00Z
原微博
期待出版。
@马少平THU
《艾博士：深入浅出大语言模型》终于交稿了，比预期晚约3个多月，主要原因去年从9月开始被连续安排了两个多月的科普讲座，虽然不是每天都讲，但是写书这件事需要连贯性，一旦中断就不好接上，严重影响进度。除夕下午完成了第一稿，接下来一直做校对，又根据一些建议增加了一些如何使用LLM的内容，昨晚终于交稿了。从名称就可以看出，这本书继承了上本书《艾博士：深入浅出人工智能》的风格，内容从深度学习开始讲起，然后是transformer模型，接下来是GPT1、GPT2、GPT3和ChatGPT，以及BERT的介绍。然后是强化学习和基于人类反馈的强化学习RLHB，最后是提示工程。有关深度学习的内容与前书《艾博士：深入浅出人工智能》有很大的重叠内容，这部分是否要在本书写？还是作为阅读本书的基础？这让我纠结了很长时间，后来根据朋友们和出版社编辑的建议，还是在本书中添加了这部分内容，这样的好处是，读者可以读一本书就可以实现入门大语言模型，因为如果不懂神经网络很难读懂大语言模型。不足就是对于已经懂神经网络的读者来说有些冗余。但从书的系统性来说还是添加了这些内容。并在前面增加了一些书中涉及到的有关向量、矩阵、数学期望等数学知识的介绍，完全做到了“一书在手，入门大模型”的目的。当然本书主要是入门，讲解大语言模型的基本原理，没有涉及最新进展。还不清楚什么时候能正式出版，“我书由(出版)社不由我”了后面有时间的话，我也会将本书全部内容录制成视频。
梁斌penny 2025-03-01 10:00+08:00Z
原微博
这么严重啊，好在我们没有倒卖芯片。。//@只为更深的蓝:@梁斌penny 厂长小心别去新加坡了
@斌叔OKmath
9人被捕！涉嫌转卖芯片给DeepSeek
梁斌penny 2025-03-01 09:04+08:00Z
原微博
“梁博，你发的内容挺好，就是太能吹牛了，这个会丢失很多粉丝的，我就没看到那个清华的人像你这么吹牛，真的不好。”答：可能这位同学是新粉丝，我的身世比较惨，早年学习一般，缺乏目标，没有动力，也没有人带，原本打算一生就混日子了。。命运的齿轮竟然从一次吹牛开始了。高考发挥正常，考上了一所普通学校，虽然是计算机专业，但是学历不高。。进校的第一天，也不知道怎么搞的，就当着众人（包括本班同学和部分高年级同学）吹牛自己要过英语4/6级和软件中级。。于是未来的3年，备受同学老师嘲讽，学习动力非常足，因为要face，后来这些牛都做到了，成为那个学校，那个专业建校建专业以来，第一个完成此壮举的人。。在学校我又吹了很多牛，比如骑车从连云港回南京，做了很多准备工作，但是出发前拉肚子了，发烧（可能食堂的饭菜问题），有个一起的同学考虑再三放弃了，然后大家都看我的笑话，认为我也会放弃，结果我一个人骑回南京，捍卫了face。毕业后，其他同学找工作都是能找到就行，我非要找个好的，牛先吹出去，再努力，必能获得免费嘲讽，随后果然找到了当时在南京非常好的单位。后来的考研，也是吹牛要考南大，后来也考上了。。后面的牛越吹越大，越吹越离谱，有时候自己都忘记了，两次吹的都不一致，后来发现微博上吹牛效果，比现实生活中还好，越吹越上头。我儿子英语不好，我就怂恿他开学在班上吹牛，自己英语要考第一名，最终他胆怯了，没有敢吹牛。至今发展缓慢。说了这么多我就想说一句，无数大佬说过，清华北大不如胆子大，胆子要大一点，步子要大一点，胆量真的很重要，是核心竞争力，吹牛就是非常需要胆量，现在的这些互联网大佬，当年是多么能吹。吹牛真是能给自己目标，增加愉悦感，抵消疲劳，关键是还能拉来大量免费嘲讽，然后为了face，就真能玩命干了。当然也不是什么都适合吹牛，对员工的承诺，对粉丝抽奖的承诺都是每一件兑现的，最近接的广告不少，今天就抽了吧。转发本条微博的铁粉，今天中午12点抽奖100人，每人50元（看个电影），总金额5000元，谢谢。抽奖详情
梁斌penny 2025-03-01 07:52+08:00Z
原微博
司机有cards，乌克兰人民，再打下去要打光了//@来去之间
@寰亚SYHP
#特朗普和万斯与泽连斯基发生争执#这种情况举世罕见；两个总统和一个副总统，三人发生争执。#特朗普和万斯批评泽连斯基# 寰亚SYHP的微博视频
梁斌penny 2025-03-01 01:34+08:00Z
原微博
训练芯片的需求要降低，我之前做这个判断还有人嘲讽//@庆丰:“巨型模型、巨额成本，但性能未如预期”，话说如果不是大模型圈最近太卷，这一版估计OpenAI也不着急发了
@宝玉xp
2025 年 2 月 27 日，OpenAI 正式发布了其迄今为止规模最大的 AI 模型——GPT-4.5（代号 Orion）。尽管 OpenAI 表示 GPT-4.5 是该公司有史以来算力和数据规模最大的模型，但这次的性能提升并未像此前 GPT 系列一样带来革命性的飞跃。不仅如此，GPT-4.5 高昂的运行成本和在一些关键基准测试上的表现差强人意，甚至让外界开始怀疑——AI 长期依赖的Scaling Law（规模定律），正在走向终点了吗？巨型模型、巨额成本，但性能未如预期此次 GPT-4.5 发布最引人注目的，莫过于其惊人的成本——每 100 万输入 token 收费 75 美元，输出 token 更高达 150 美元。这意味着 GPT-4.5 的成本是 OpenAI 自己广泛使用的主力模型 GPT-4o 的30 倍，更是竞争对手 Claude 3.7 Sonnet 的25 倍。OpenAI 发言人承认，GPT-4.5 的运行成本之高，使得公司必须重新评估它未来是否适合长期开放 API。如此巨额成本背后，GPT-4.5 的性能究竟如何呢？性能迷雾：优势与劣势并存尽管 OpenAI 将 GPT-4.5 定位为非推理模型（Non-Reasoning Model），但它的表现却出现了明显的两极分化。✅ 明确的性能提升领域：• 事实性问答 (SimpleQA) 基准测试中，GPT-4.5 优于 GPT-4o 和 OpenAI 的推理模型 o1 和 o3-mini，幻觉（hallucination）的频率也明显降低。• 软件开发（SWE-Lancer）测试中，GPT-4.5 表现优于 GPT-4o 和 o3-mini，在开发完整软件功能时具有更高的可靠性。❌ 性能不及预期的领域：• 在高难度的学术推理类测试（如 AIME 和 GPQA）中，GPT-4.5 表现低于竞争对手 Claude 3.7 Sonnet、DeepSeek R1 和 OpenAI 自家的推理模型 o3-mini。SimpleQA benchmarks.SimpleQA benchmarks.SimpleQA benchmarks.（图片来源：OpenAI）OpenAI’s Swe-Bench verified benchmark.OpenAI’s Swe-Bench verified benchmark.OpenAI’s Swe-Bench Verified benchmark.（图片来源：OpenAI）OpenAI’s SWe-Lancer Diamond benchmark.OpenAI’s SWe-Lancer Diamond benchmark.OpenAI’s Swe-Lancer Diamond benchmark.（图片来源：OpenAI）性能对比之谜：成本 vs 性能提升GPT-4.5 虽然在一些特定任务上确实表现出色，但考虑到成本的激增，性能并未出现对应比例的显著提升。特别是在需要深度推理的任务上，GPT-4.5 远不如更便宜的推理型模型 Claude 3.7 Sonnet 和 OpenAI 的深度推理模型 Deep Research。Devin 公司 CEO Scott Wu 在推特上也指出，GPT-4.5 在涉及架构设计和跨系统交互的任务上表现突出，但在纯粹的代码编写和编辑任务上却逊色于 Claude 3.7 Sonnet。这种性能的细微差别进一步证明，单纯的扩大模型规模，可能已不能带来跨领域全面的性能跃升。从性能到情感智能：“微妙的提升”OpenAI CEO Sam Altman 提到了 GPT-4.5 独特的魅力——它带来了以往模型所缺乏的“人性化”的感觉，虽然在数学、代码等硬核推理领域并不出彩，但在理解人类意图和情感回应方面达到了新的高度。OpenAI 展示了一个情感交流的案例，当用户表示考试失败而难过时，GPT-4.5 给出的安慰更为贴心且符合社交情境：正如 Andrej Karpathy 所言：“每代 GPT 都是微妙的提升，一切都变得更好一点，但无法具体指出哪一项是绝对的突破。”Scaling Law 失效了吗？此次 GPT-4.5 发布最令人关注的一点，在于它似乎验证了 AI 界早有预言的“规模定律的终结”。OpenAI 联合创始人 Ilya Sutskever 曾直言：“我们已经达到了数据的巅峰，传统的预训练方式即将终结。”GPT-4.5 的性能曲线证实了他的预测——随着模型规模继续扩大，其性能的提升不再显著，甚至出现了严重的成本与收益不成比例的现象。市场也开始感受到这一趋势：“DeepSeek R1：我们不再需要大量 GPU 进行预训练；OpenAI GPT-4.5：我们已到 GPU 预训练的尽头。”GPU 算力瓶颈已成新常态，甚至引发了 GPU 供不应求的现象，这背后反映的是产业链面对 AI 规模困境的真实反应。GPT-4.5：AI 发展的分水岭？OpenAI 已明确表示 GPT-4.5 不会成为 GPT-4o 的替代品。相反，它更可能是 OpenAI 向 GPT-5 和未来结合推理模型路线的转折点，象征着公司逐渐告别单纯依赖大规模预训练的时代。总结而言：• GPT-4.5 展示了 AI 在预训练模式下的规模极限。• 性价比问题凸显，纯规模化扩张已无法带来突破性进步。• 情感智能提升明显，可能开启 AI 交互方式新趋势。此次 GPT-4.5 的发布，或许正是 AI 发展道路上的重要里程碑——它提醒着我们，未来的 AI 模型，也许需要的不再只是更多的 GPU 和数据，而是对智能本质的更深入理解。GPT-4.5 的登场，最终是否宣告 AI Scaling Law 的终结，仍有待时间检验。但毋庸置疑的是，AI 产业已站在变革的路口，传统的规模化预训练模式即将迎来一次深刻的反思与变革。GPT-4.5 系统卡片中文版：网页链接注：为了让大家直观感受 GPT-4.5 的能力，所以这篇文章是 GPT-4.5 帮我写的，素材是官方博客、网络新闻、几条推文（Sam 的和 AK 的），你感觉到 GPT-4.5 写作能力提升了吗？AI 味浓吗？更好排版：网页链接
梁斌penny 2025-02-28 23:18+08:00Z
原微博
美国那个500万美金绿卡是不是专门诓富人去的//@陈达楚:中国是全世界中高产移民最严重的国家
@李成东
为什么我们海外赚了越来越多的钱，国内就业和消费并没有想象的那么好？海外赚的钱，一部分是再投资了，一部分是把利润留在海外了，一部分是赚回来也没有消费，国内不提倡奢侈消费，想花没条件。如何让中产富人愿意留在国内消费，且愿意在国内大胆多消费？第一个需要政治改革，保护私有财产，中国是全世界中产外流最严重的国家。第二个是创造条件，让富人多消费。#东哥笔记# 2024.12.06
梁斌penny 2025-02-28 22:33+08:00Z
原微博
今年首只翻倍期权。。思路很简单，俄乌战争打不下去了，美俄关系缓和，战争需求变小了，pltr这种军工股想象力就不足了。
梁斌penny 2025-02-28 22:09+08:00Z
原微博
给领导写的材料写好了，有其他领导身边的同志需要给领导吹牛的可以参考，快速掌握DeepSeek的发展历程和对本地区可能产生的影响，免费奉献给大家，需要这份PPT的联系。@梁博第二助理或者 @梁博助理小姐姐获取，谢谢。
t0mbkeeper 2025-02-28 20:24+08:00Z
原微博
今天的盲猜关注列表活动开始啦！//@纸上工程师:有多少证据说多少话。可能没有明确证据证明艾灸能治具体某种病，但目前有证据证明吸入艾灸的烟雾会导致肺结节吗？只能说可能会提高风险。既然循证，就正反两面都要循证。//@t0mbkeeper:因为怕肺结节而不敢艾灸是缺乏顶层思考的结果。虽然艾灸可以导致肺结节，但肺结节也可以用艾灸调理。这样就实现了以艾灸赋能结节，以结节拉通艾灸，从而打通艾灸-结节的全链路，实现了生态闭环。查看图片
@Fenng
艾灸这事儿，约等于「自愿掏钱吸入高浓度雾霾」。可以最快时间产生肺结节。😂
t0mbkeeper 2025-02-28 19:36+08:00Z
原微博
有些手术是比较野蛮粗暴。实习时候参加过一台大隐静脉剥脱术。主任一声令下，我和另一个壮汉两人合力跟驴一样拽连着剥离器的钢丝绳，然后主任还在那喊劳动号子。//@一个动态类型的幽灵:那，他最后招了吗？（对不起//@安安以迁迁:人体4S店//@superview://@爱上火炉的雪人2011://@沉鱼夫人:“怕溅到脸上” 查看图片 //@不知道叫啥就瞎起个名:骨科医生来解释一下，这是取PFNA髓内钉，旁边医生转头是怕溅到脸上，顺带一提这种徒手取很累的。
@这是在干什么bot
旁边的医生都不敢看了

上一页第549/995页每页 10 条总共 9943 条下一页