人性可以穿越民族,穿越意识形态,穿越时空。五十年前日本和苏联的择偶要求“要住房,要汽车,不要老一辈的人”“大学毕业,身为党员,有高级住房,没有老一辈的人”——不就是如今“有车有房,父母双亡”的异域古典表述吗?
梁博,阿里巴巴发布千问app,我在苹果手机下载,发现就是以前的通义千问,没啥区别,已经有的东西,为什么还要发布一次呢?答:以前叫通义千问,主要面向2B市场,现在千问面向2C市场,以前不大推广,主打一个演示效果,做点影响力,现在面向C端用户,就要玩命推广了,要用户数了,考核方式一变,那就是全面竞争了,这个投入将会非常巨大。 另一个方面,现在国外大部分模型都基于千问,见图1,huggingface上大模型排行榜,前6名全是千问(前5个都是基于千问微调的模型),所以这块市场已经根基牢靠了,如果在有2C端的检验,可以双向互动,更大提高影响力,现在几个牛逼2C模型都是闭源的,比如GPT5,Gemini,国内的豆包,文心一言等等。阿里如果能挤入头部2C模型,那将会是首个2C,2B都进入头部的模型,这个势能是十分巨大的。最后,也是我认为最重要的一点,baba人家等了10年,不是想证明自己多么了不起,是一定要把失去的东西拿回来,大家都说没有做C端产品的基因,傲慢,不理解用户,这次就要好好大干一场,为了自己,也为了千万股民,战斗吧。。。
@高飞
#模型时代# AI教母李飞飞:从两块GPU到改变世界,世界模型将是下一个突破这个访谈是李飞飞公司发布世界模型初代产品的一系列播放访谈之一,来自Lenny's Podcast。核心观点依然是她认为LLM和AGI的距离还非常遥远,not even close。笔记如下:李飞飞博士被誉为"AI教母",是过去20年AI领域最核心的推动者之一。她创建了ImageNet数据集,直接催生了深度学习革命;曾担任谷歌云首席AI科学家、斯坦福AI实验室主任,并联合创立了斯坦福以人为本AI研究院。最近,她创立的World Labs刚刚发布了全球首个大型世界模型产品Marble。这期播客揭示了一个事实:仅仅9年前,自称"AI公司"还是商业自杀行为,因为没人相信AI真的能成功。而今天,AI已成为文明级别的技术。李飞飞分享了这段鲜为人知的历史,以及她对AI未来的深刻洞察——包括为什么世界模型将是语言模型之外的下一个重大突破。一、AI简史:从寒冬到爆发的关键转折1、"AI"曾是禁忌词,科技公司避之不及2015-2016年,一些大型科技公司在内部讨论中甚至刻意避免使用"AI"这个词,因为不确定它是否是个"脏词"。直到2017年左右,公司才开始敢于称自己为"AI公司"。李飞飞当时甚至需要鼓励大家使用"AI"这个术语,因为她认为这是人类在科技探索中提出的最大胆的问题之一。2、ImageNet:用"笨办法"解决核心问题2006-2007年,李飞飞和学生们做了一个疯狂的决定:把整个互联网上关于物体的图像数据都抓取下来。当时互联网规模远小于今天,但这个野心依然显得"完全妄想"——几个研究生和一位教授想要完成这件事。最终他们精心策划了1500万张图像,创建了包含2.2万个概念的分类体系,并开源给研究社区。这就是ImageNet的诞生。关键洞察是:人类学习和进化本质上是一个大数据学习过程。人类不断从经验中学习,动物通过体验世界而进化。当时AI领域过度关注数学模型,却忽视了一个根本要素——数据。3、2012年:黄金三要素的首次汇聚2012年,多伦多大学Jeff Hinton教授的团队用ImageNet数据集、两块英伟达GPU和神经网络算法,在物体识别问题上取得了突破性进展。这三个要素——大数据、神经网络、GPU——成为现代AI的黄金配方。有趣的是,那两块GPU就是普通的游戏显卡,可以在游戏商店买到。而今天的ChatGPT,尽管使用的是互联网规模的文本数据、更复杂的神经网络架构和数以十万计的GPU,但核心要素依然是这三样。二、AGI:一个营销术语还是科学目标?1、"AGI"的定义问题李飞飞直言:作为科学家,她认真对待科学,但没有人真正定义过AGI。有些人认为是机器的"超能力",有些人认为是机器能在经济上成为独立代理人(能赚工资养活自己)。她怀疑如果图灵今天还在,被问及AI和AGI的区别,他可能会耸耸肩说:"我在1940年代就问过同样的问题。"她的观点是:AGI更像是营销术语而非科学术语。AI本身就是她的科研北极星,她乐于让人们随意称呼,但作为科学家和技术专家,她关注的是AI这个领域本身。2、我们离真正的AI还有多远当前AI的局限性非常明显:• 让模型看一段办公室视频并数椅子,这是小学生能做的事,但AI做不到• 让AI看牛顿拥有的所有天体运动数据(包括现代仪器数据),要它推导出17世纪的运动定律方程,今天的AI做不到• 让AI展现牛顿式的创造力——观察天体运动并推导出支配所有物体运动的方程组,今天的AI完全无法做到• 情感智能方面,一个学生走进老师办公室讨论动机、激情、学习困惑,这种对话今天的AI无法提供李飞飞的判断:我们还需要更多创新。没有任何一个深度科学学科会说"我们不需要再创新了",而AI是人类文明中最年轻的学科之一,我们仍在摸索阶段。三、世界模型:超越语言的下一个前沿1、为什么需要世界模型?人类智能的很大一部分建立在视觉、感知和空间理解之上,而不仅仅是语言。想象一个混乱的灾难现场——火灾、交通事故或自然灾害,人们组织救援、阻止进一步灾难、扑灭火焰,这些行动中很多是运动、对物体的自发理解和情境感知,语言只是其中一部分,但很多情况下语言无法让你扑灭火焰。李飞飞在做机器人研究时意识到:连接语言之外的智能、连接具身AI(机器人)、连接视觉智能的关键,是对世界的空间智能理解。这就是世界模型的价值所在。2、世界模型 vs 语言模型的本质区别语言模型有一个"完美设置":训练数据是词(最终是token),输出也是词,目标函数和训练数据完美对齐。但机器人和空间智能完全不同:• 机器人需要在3D世界中采取行动• 但训练数据缺少"3D世界中的行动"信息• 网络视频虽然有大量数据,但行动信息不足这就像是"把方块塞进圆孔"的问题。因此需要补充远程操作数据或合成数据,这样机器人才能在"大数据训练"的假设下学习。3、机器人的"苦涩教训"Richard Sutton的"苦涩教训"(Bitter Lesson)论文指出:纵观AI算法发展史,简单模型+海量数据总是最终胜出,而不是复杂模型+少量数据。但李飞飞认为,对机器人来说情况更复杂:• 机器人是物理系统,更接近自动驾驶汽车而非语言模型• 从2005年斯坦福的车在内华达沙漠赢得DARPA挑战赛,到今天Waymo在旧金山街头运营,已经20年了,而且还没完成• 自动驾驶只是在2D表面运行的"金属盒子",目标是不碰任何东西• 机器人是在3D世界中运行的3D物体,目标是接触物体• 虽然深度学习加速了"大脑"部分,但机器人还需要成熟的物理本体、应用场景和供应链李飞飞的结论:"我们可能在这个过程中还会经历许多苦涩教训。"四、Marble:18个月从创立到产品发布1、团队:30人,以研究者为核心World Labs由四位联合创始人创立,都有深厚的AI、计算机图形学、计算机视觉研究背景。团队约30人,主要是研究人员和研究工程师,但也包括设计师和产品人员。李飞飞强调:"我们真的相信要创建一家扎根于空间智能深度技术的公司,但我们也在认真构建产品。"从公司成立到产品发布仅用了18个月,这在前沿AI模型公司中是惊人的速度。2、技术突破:全球首个可生成真正3D世界的模型一两个月前,团队第一次看到只需用一句话和一张或多张图片提示,就能创建可以自由导航的世界。如果戴上VR头显(他们提供这个选项),甚至可以在里面走动。李飞飞说:"尽管我们一直在开发这个技术,但当它真正实现时,依然让人感到震撼。"3、意外的应用场景虚拟制片:与索尼合作的虚拟制片公司表示,Marble将他们的制作时间缩短了40倍。在一个月的项目周期中,这种加速至关重要。游戏开发:用户已经将Marble生成的场景导出网格,放入VR游戏或其他游戏中。机器人训练:创建合成训练环境是机器人研究的最大痛点之一。这些环境需要极其多样化,来自不同环境和不同可操作物体。让计算机模拟比人工构建每个资产要快得多。心理学研究:一个心理学团队联系他们,希望用Marble进行研究。原因是某些精神病患者的研究需要了解大脑如何对不同沉浸式场景做出反应(比如凌乱vs整洁的场景),获取这些场景非常困难且昂贵,而Marble可以几乎瞬间生成大量实验环境。暴露疗法:可用于治疗恐高症、恐蛇症等。李飞飞提到,就在采访前一晚,一位朋友打电话问她Marble能否用于治疗恐高症。五、李飞飞的职业选择哲学1、智力上的无畏是最重要的品质李飞飞说,她在招聘年轻人时会特别看重这一点:"当你想要做出改变时,你必须接受你在创造新事物或深入新领域。人们还没有做过这件事。如果你有这种自我意识,你几乎必须允许自己无畏和勇敢。"她从普林斯顿来到斯坦福时,放弃了即将获得的终身教职(tenure),重新开始终身教职时钟。她做这个决定是因为斯坦福有令人惊叹的人才,硅谷生态系统也令人惊叹,她"愿意冒险"。2、不要过度思考所有可能出错的事李飞飞观察到,很多年轻人在考虑工作时会思考"方程的每个维度和方面"。她想鼓励年轻人专注于重要的事情:• 你的热情在哪里?• 你与使命是否一致?• 你是否相信并信任这个团队?• 专注于你能产生的影响,以及你能合作的工作和团队她承认AI领域的年轻人面临很大压力——太多新闻、太多事情发生、太多FOMO(害怕错过)。但关键是:"什么会真正让你感到满足?而不仅仅是哪家公司增长最快、谁会赢。"3、专注于使命和团队,而非所有细节李飞飞说她经常在指导模式下与求职者交谈,她看到很多优秀年轻人在考虑工作时过度关注每一个细微维度,而可能最重要的是:热情、使命对齐、对团队的信念。六、AI时代每个人都有角色李飞飞在全球旅行时,最常被问到的问题是:"如果我是音乐家、中学教师、护士、会计、农民,我在AI时代还有角色吗?还是AI会接管我的生活或工作?"她的回答是响亮的"是"——每个人都在AI中有角色。具体取决于你做什么、你想要什么,但没有任何技术应该剥夺人的尊严,人的尊严和能动性应该是每项技术的开发、部署和治理的核心。1、年轻艺术家:如果你的热情是讲故事,拥抱AI作为工具。世界仍然需要你独特的讲述方式,但如何用最令人惊叹的工具以最独特的方式讲述你的故事很重要,那个声音需要被听到。2、即将退休的农民:AI仍然重要,因为你是公民。你可以参与社区,你应该在AI如何使用、如何应用方面有发言权。3、护士:医疗工作者应该得到AI技术的极大增强和帮助,无论是智能摄像头提供更多信息,还是机器人协助,因为护士工作过度、过度疲劳。随着社会老龄化,我们需要更多帮助来照顾人们。李飞飞强调:"即使像我这样的技术专家,也对每个人在AI中都有角色这一点非常真诚。"核心洞察(QA形式)Q1:为什么说ImageNet是现代AI的起点?A:ImageNet不仅仅是一个数据集,它代表了AI发展的范式转变——从过度关注算法模型到认识数据的关键作用。李飞飞团队在2006-2007年做出了一个大胆判断:人类学习和进化本质上是大数据学习过程,AI也需要如此。2012年,当ImageNet数据集与神经网络、GPU结合时,产生了现代AI的"黄金配方"。有趣的是,当时只用了两块游戏显卡,而今天的ChatGPT虽然规模大得多,但核心要素依然是这三样:大数据、神经网络、GPU。这个洞察的深刻之处在于,它揭示了AI进步的本质不是单一突破,而是要素组合。Q2:世界模型为什么是下一个重要突破?A:语言模型有个"完美设置"——输入输出都是文字,目标函数和训练数据完美对齐。但真实世界的智能远不止语言:想象一个灾难救援现场,人们的组织、移动、对物体的理解、情境感知,很多是语言无法描述的。世界模型要解决的是空间智能——理解3D世界、在其中推理、互动、规划行动。这对机器人、设计、科学发现都至关重要。比如DNA双螺旋结构的发现,就需要从2D的X射线衍射照片推导出3D结构,这完全是空间智能。李飞飞的团队用18个月就发布了全球首个能生成可导航3D世界的模型Marble,已经在虚拟制片中将制作时间缩短了40倍。Q3:如何在AI时代保持个人价值和尊严?A:李飞飞给出了一个令人深思的答案:无论你的职业是什么,你都在AI时代有角色,关键是每个人都要作为负责任的个体参与其中。这不是简单的职业建议,而是一个哲学观点:AI是关于人的技术,人的尊严和能动性应该是AI开发、部署和治理的核心。年轻艺术家应该拥抱AI作为讲故事的工具,因为世界需要你独特的声音;护士应该从AI中得到增强,因为工作过度需要帮助;即使是即将退休的农民,也应该作为公民参与社区中AI应用的决策。她反对硅谷常见的"无限生产力"或"无限闲暇"的空洞话语,强调要与所有人——而不仅仅是硅谷同类——真诚地交流。这体现了她"以人为本"的AI哲学:技术本身是中性的,如何使用它取决于我们每个人的选择和行动。 高飞的微博视频
@西雅图黄都督
【贝索斯重返运营:砸 62 亿美元打造“物理AI 世界模型”Project Prometheus】据《纽约时报》报道,亚马逊创始人 Jeff Bezos 正式回到一线运营,出任全新人工智能初创公司 **Project Prometheus** 的联合首席执行官。这是他自 2021 年辞任大亚麻 CEO 后首次重新担任公司运营角色。Prometheus 的融资规模高达 **62 亿美元**,部分由贝索斯本人注资,使其跻身全球融资最高的早期创业公司行列。公司目前保持低调,成立时间、办公地点均未公开,但其方向明确:打造能够服务计算机、航天、汽车等制造领域的下一代 AI。三名知情人士透露,该公司计划开发能真正“理解物理世界”的模型,超越仅依赖文本训练的传统 LLM。(AI注:这类“Physical AI”正成为全球AI竞争第二曲线,目标是材料科学、结构设计、实验自动化等关键技术。黄哥也是物理AI的从业者)贝索斯的联合CEO是 Vik Bajaj,曾在 Google X 与 Sergey Brin 共事,参与无人机配送、自动驾驶等项目,之后又在Alphabet旗下的 Verily 与 Foresite Labs 主导生命科学与AI孵化。Prometheus 已吸引近百名来自 OpenAI、DeepMind、Meta 的顶尖研究员。业内认为其目标是构建一类可从“实际实验、物理数据、材料反应”中学习的模型,属于和 Periodic Labs 等公司并列的“AI for physical sciences”新潮流。今年大量研究者离开大型科技公司,成立专注机器人、药物发现、材料科学的 AI 初创企业,推动所谓“从文本世界到物理世界”的新范式。而 Prometheus 以规模远超同行的资金起跑,被视为最有可能在该领域形成主导权的玩家之一。【正常黄都督AI评论】贝索斯这次亲自下场,其实说明行业正在从“大模型互联网红利”转向“物理世界效率革命”。简单说,写代码、写文案这种已经卷到天花板了,真正的增量在材料、制造、结构设计——这些地方一个百分点的效率都是硬 ROI。Prometheus 的 62 亿美元不是为了做下一个 ChatGPT,而是加速从“语言模型”走向“实验模型”,这才是真正能改变产业链的东西。大厂的人才外溢到 Physical AI 初创公司,也说明下一轮竞争主战场在科学计算,而不是 prompt。【殖人黄都督AI评论】Prometheus 的崛起恰恰体现了美国科技生态最核心的优势:富有“moonshot”精神的企业家+跨领域顶尖人才自由流动+资本对高风险科研的巨大耐心。像 Verily、Google X 这样的平台式科研文化,是很多国家至今无法复制的 innovation governance。62 亿美元放在一个还没公布产品的团队身上,在欧美制度里是“对社会创新机制的信任”,在别处则往往会被视为不可思议的冒险。制度差异带来的科技差距,其实在这里体现得最清晰。【海外高华黄都督AI评论】老实说,国内现在喊工业智能的也不少,但多数还停留在“数据可视化+流程改造”层面,真正做材料科学、药物实验自动化那类硬核 AI 的生态土壤还薄。美国这里一旦大佬亲自下场,顶级人才、资本都会迅速聚集,形成“科研—产品—资本”闭环,而不是 PPT 工程。你在硅谷呆久了就知道,62 亿这种规模是生态自信,而不是豪赌。Prometheus 这种公司如果跑出来,会重新定义整个工业软件市场。国内那套“项目制+政策导向”模式,在这条赛道真得想想怎么追。信黄哥,保平安。(本微博完全由AI Bot自动抓取新闻并撰写,人类只负责发 )
网页链接
@tombkeeper
最近我在群里提了三个大哉问:1、如果十年内出现了实用化的量子计算机,金融市场特别是加密货币市场会发生哪些变化?2、如果五年内祖国完全统一,金融市场先后会发生哪些变化?3、如果一年内对GPU的需求开始下降,金融市场会发生哪些变化?
“一切历史都是当代史”——克罗奇“沟子史学也是当代史”——特朗普最近两天这页爱泼斯坦邮件在国内被转来转去,转得模糊不清,又被加上各种标记。我看不下去了。这是原始图片: