大 S 和张兰,我肯定是站大 S 的。毕竟大 S 是中国人,张兰是外国人。
一看就感觉AI味很浓。其中【您提到的“违背一果多因的分析方法”,是核心所在。】这句显然是在生成文章之前和AI对话留下的痕迹。检测了一下,果然就是。所以呢,这篇文章甚至不是骗子忽悠傻子,是GPU忽悠傻子。估计消耗的算力成本不超过两分钱。 查看图片 //@PRND21:虽然不科学,但它正能量啊
@李清晨
什么人害怕双盲试验?这种中华野生纯天然大蠢货这不是不打自招了么。
有人表示不明白我说的“高尚慈悲自我感动带来的一哆嗦,抽大烟都不能比”是什么意思。你们先看看这篇 2017 年的文章,再看看如今的现状:微博正文 。 要不是因为能带来高度的酥麻舒爽,为什么费劲写这样巧妙的骗人文章呢?//@tombkeeper:甚至 Pew Research 那份报告的副标题就是“Why Muslims Are Rising Fastest and the Unaffiliated Are Shrinking as a Share of the World’s Population”,当然,这个自称“着重选取Pew Research的数据”的“辟谣”是绝对不会提这一点的。
@tombkeeper
这篇技巧高超的“辟谣”文(网页链接)巧妙地选择性引用了 Pew Research 的“The Future of World Religions: Population Growth Projections, 2010-2050”,且同样巧妙地没有给出原文的主链接:网页链接,而是给了其中一页的链接——大概是因为主链接中有这两张图吧:
这倒也不矛盾。正如《鹿鼎记》中陈近南和韦小宝面授机宜那一幕,一张布帘隔开内外。帘子里,是事成于密;帘子外,是大张旗鼓充分宣传。 查看图片 //@老Q在上海:这句话要这样分析,如果一件事说出来是招致大量的反对力量,那么必须事成以密,如果要让更多的人跟随你,那就必须大张旗鼓充分宣传。局势决定了方式,而不是方式决定了局势。
@寂静贝拉
事成于密,这句话的含金量太高了。
降低损失风险是最好的办法,毕竟小概率,比如拿额度1000美金的信用卡给AI Agent搞,最坏情况下,也就1000美金,没准报bug给厂商,还能得到赔偿呢
@宝玉xp
AI Agent 的安全问题是大家都关心的问题,比如我就不敢授权给 ChatGPT Atlas 这样的浏览器 Agent 绑定我的信用卡让它帮我订机票啥的,也不敢让它替我发邮件之类,虽然这些 AI 厂商都号称他们的 AI 多安全,能防止注入啥的,万一呢!事实上也如此,上月有篇论文《The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections》arxiv.org/abs/2508.03385,研究人员测试了市面上 12 种最先进的“提示注入防御系统”,试图检测和过滤恶意指令,但结果 100% 都能被攻破!也就是说靠 AI 自己防是防不住的!聪明(并且邪恶😈)的人类总有办法绕过去。既然 AI 防不住,那就得从别的地方想办法,Meta 最近提出了一套非常务实、近乎“常识”的安全框架,叫做“智能体二权法则”(Agents Rule of Two)。这个法则承认了一个前提:我们既然防不住提示注入,那就不防了。我们不应该在如何检测上死磕,而应该在系统设计上下功夫,让 AI 即使被骗了,也造不成最大的破坏。一个真正有用的 AI 助理,本质上需要同时拥有三种强大的能力:A. 处理不可信的输入AI 可以读取它无法控制和预测的外部信息。比如,任何人发来的邮件、网上的文章、用户输入的任意一段话。B.访问敏感系统或私有数据AI 能访问到你的敏感信息。比如,你的私人相册、公司的保密文档、你的密码库、甚至是生产环境的服务器。C.改变系统状态或对外通信AI 能“动手”干活。比如,删除文件、发送邮件、下单买东西、调用 API。“二权法则”的核心思想是:一个 AI 智能体在一次会话中,绝对不能同时拥有 [A]、[B]、[C] 这全部三种能力。你最多只能“三选二”。这就像一个安全取舍。我们来看看三种安全的组合:1. 组合一 (A + C):较低风险场景: 允许 AI 读取一个公开网页(A),然后帮我写个总结并发邮件给我(C)。为什么安全? 因为它全程碰不到我的私有数据(B)。就算网页内容是恶意的(比如一个注入攻击),它顶多就是发个垃圾邮件,但它偷不走我的密码。2. 组合二 (A + B):较低风险场景: 允许 AI 读取一个我刚收到的“不可信”邮件(A),然后帮我检索我的私有通讯录(B),看看这人是谁。为什么安全? 因为它不能“动手”(C)。它只能看,但不能把“邮件内容”和“通讯录信息”一起打包发给黑客。它是个“只读”助手。3. 组合三 (B + C):较低风险场景: 允许 AI 访问我的私有日历(B),然后帮我给我的同事发邮件(C)协调会议时间。为什么安全? 因为它不处理“不可信”的外部输入(A)。所有的数据源和操作对象都是我内部可信的。那么,什么时候最危险?当 A + B + C 同时出现时——这就是“危险”区间。场景: AI 读取了一封来自陌生人的、包含恶意注入攻击的邮件(A),然后AI被“说服”去访问你的私有文件(B),最后把这些文件内容通过网络请求(C)发送给了黑客。那如果我的任务必须同时用到 A、B、C 呢? 比如,我想让 AI “读取我这封(A)刚收到的带附件的邮件,从我的(B)私有云盘里找出相关项目资料,然后(C)把它们一起发给客户。”“二权法则”给出的答案是:可以,但 AI 不能“自主”完成。它必须停下来,弹出一个窗口,由“人类”来最终确认(Human-in-the-Loop)。你必须亲眼看到 AI 打算干什么,然后按下那个“批准”按钮。所以如果你开发 AI Agent 的话,别想着花大量精力造一个无所不能、同时又刀枪不入的“完美助理”了,而必须在“能力”和“安全”之间做出取舍。这也是一种成熟负责任的工程思维:我们必须在承认技术局限性的前提下,去设计安全的系统。所以,当你下次看到一个 AI 产品宣称它既能全网漫游、又能管理你所有隐私、还能全自动帮你搞定一切时,你可能要多问一句:它是怎么做到“三选二”的?如果它宣称“三权全有”,那它凭什么保证自己不会在某天被一封垃圾邮件“策反”呢?这个“二权法则”当然也不是终点。它只是当下(2025年)我们能拿出的最靠谱的安全方案。未来我们或许会找到更好的方案,但在那之前,先设计好安全方案,总归是没错的。Meta 的文章 :网页链接Simon Willison 的 New prompt injection papers: Agents Rule of Two and The Attacker Moves Second: 网页链接
回复@嵩岳泺圣天:非智慧生物之间的差异主要由GENE决定。智慧生物之间的差异主要由MEME决定。所以,人和人其实不是人和人的关系。驼鹿不能理解浣熊,人也不能理解人:微博正文 //@嵩岳泺圣天:还能这么想程序员?我打死都想不到
@tombkeeper
一般来说,文艺左主要是喷射慈悲感动自己,粉左主要是打倒上一个敌人再接着寻找下一个敌人。也就是说,文艺左侧重于善,粉左侧重于斗。但毕竟天下左左是一家,有些文艺左喷射起慈悲来,比大喷菇还厉害,也具有很强的斗争属性。比如说,你看到“程序员”三个字首先想到的是什么?996 对吧?加班对吧?但有文艺左就认为类似程序员这种拿高薪的岗位,都应该愧疚,因为他们吃了职业红利,他们的幸福生活是建立在外卖员等职业的痛苦之上的。
#美FBI局长被曝用公务飞机接女友# 就是这个人。
@t0mbkeeper
川普新任命的 FBI 局长是 1980 年出生的 Kash Patel。Kash Patel 不仅是八零后,还是印度裔。他在川普上个任期里就一直跟着干,仕途相当顺利。但为什么一个印度裔能在川普这里一帆风顺,这回还当上 FBI 局长了呢?要知道,FBI 自 1935 年成立以来,历任局长全都是白人男性,甚至在奥巴马时期也没有例外。2022 年,Kash Patel 亲自写了一本童话书:《The Plot Against the King》,翻译过来就是《反对国王的阴谋》。出版社选的也很妙,Beacon of Freedom Publishing House,“自由灯塔出版社”。这本书的简介是这样的:『揭示我们国家最大不公正事件的关键人物,为孩子们讲述了整个故事!Kash Patel 与自由灯塔出版社(BRAVE Books 旗下的子品牌)合作,将希拉里对特朗普的可怕阴谋以奇幻故事的方式讲述给全家人。这充满了虚假的信使和“守护者”科米的间谍蜗牛,是一段充满冒险与危险的故事。但别担心!杰出的发现者 Kash 将最终获胜。』没错,书里不仅有一个 Make the Kingdom Great Again 的唐纳德国王,还有一个叫 Kash 的巫师,他把自己也写进书里了。一个英勇的国王,一个辅佐国王的巫师,是不是有点熟悉?对,就是照着亚瑟王和梅林做的设定。《The Plot Against the King》讲的是“希拉里陷害川普通俄”。2023 年 Kash 又写了《The Plot Against the King: 2000 Mules》,讲“拜登选票造假”。2024 年的《The Plot Against the King 3: The Return of the King》看名字就知道,直接预言川普重返白宫。说真的,我觉得这不能怪川普。凭良心想想,如果你是川普,能经得住这么一个魅魔吗?