//@小鸡吃米在环游地球:这个是上海人工智能实验室做的,今天AI大会他们主任介绍的时候我就在想真厉害。因为它把之前国际主流常规预报时间提前了三天,精度提高到了10公里级别,提升了一个数量级 @梁斌penny
@中国气象局
【#全民早期预警中国方案妈祖发布#】7月26日,在上海举行的2025年世界人工智能大会开幕式上,中国气象局发布全民早期预警中国方案“妈祖(MAZU)”,构建包含多灾种预警的全球早期预警服务网络,分享中国早期预警实践经验和技术成果。在世界气象组织秘书长席列斯特·绍罗和与会嘉宾的见证下,中国气象局局长陈振林将象征城市多灾种早期预警智能体的“AI气象预警钥匙”交给吉布提、蒙古两国代表,城市多灾种早期预警智能体(MAZU-Urban)开启跨国气象防灾减灾使命。极端天气气候事件正成为全球挑战。妈祖是中国沿海地区广受敬仰的海洋守护者、气象守护者,被联合国教科文组织列入《人类非物质文化遗产代表作名录》。妈祖精神与早期预警的核心价值高度契合,体现了救助、亲民、智慧的内涵。因此,中国气象局将全民早期预警中国方案命名为“妈祖(MAZU)”,四个字母分别代表多灾种(Multi-hazard)、预警(Alert)、零差距(Zero-gap)和普惠(Universal)。为携手缩小早期预警能力差距、共同应对全球气候挑战,中国气象局发布“妈祖(MAZU)”,与全球特别是发展中国家分享中国经验和技术成果,提供早期预警技术、联合开展能力建设、共建风险识别与评估体系、创新合作机制与模式等。在经验方面,我国分享递进式气象服务、高级别预警“叫应”等早期预警实践;在技术方面,与各国共建城市工具箱、风云地球工具箱、海外设备等气象早期预警业务平台。人工智能技术以其高效的计算和多源数据融合能力,正成为连接气象预报、灾害预警和应急响应的关键纽带,成为突破传统预报局限的“金钥匙”。“妈祖(MAZU)”以云端早期预警系统为核心,根据不同国家需求提供可定制、易部署、可持续的技术解决方案。中国气象局与埃塞俄比亚、巴基斯坦、所罗门群岛等国气象部门联合开发云端早期预警系统,上海“城市多灾种早期预警工具箱”已在蒙古实践应用。今年7月,巴基斯坦气象专家齐码利用云端早期预警系统,提升了近期季风降雨的预报水平。埃塞俄比亚气象局副局长贝椰内表示,通过埃中两国开展的早期预警合作,有助于埃塞俄比亚适应和应对气候变化。此外,“妈祖(MAZU)”通过国际培训课程、奖学金计划和访问学者项目,培养发展中国家早期预警专业人才,促进经验交流。
renew
@tombkeeper
怎么做网络小作文的阅读理解?新闻五要素是:时间、地点、人物、事件、原因。看小作文的时候,五要素略有不同:时间、地点、主语、谓语、宾语。因为不能强求别人知道原因是什么。但是,但是,但是,主谓宾总应该有,时间地点总应该有。看小作文的第一步,是删除仅表达情绪而不包含有效信息的句子。第二步,对剩下来的句子删除其中仅仅表达情绪而不包含有效信息的形容词、感叹词、惊叹号等。第三步,根据剩下来的内容,对每一个描述梳理五要素。要素缺乏的地方,打个问号。第四步,根据以上过程梳理出来内容,对每一个指控,分析一下利害关系和动机。看看受益者是谁,受损者是谁。看看被指控人是不是受益了,指控者是不是受损了。看看被指控的行为是不是存在动机。第五步,把第三步中的问号改成各种不同的内容,比如把时间要素分别改为“今天”、“去年”、“大前年”,看看是否会影响你对事情的看法。如果会,就要考虑这些缺失的要素可能是被故意省略的。需要追问一下小作文的作者,这些要素到底是什么。
@宝玉xp
WSJ: 谢你十亿美元的工作邀约,马克·扎克伯格。但我选择拒绝。在当今的硅谷,忠诚和传奇人物正促使一些人拒绝那些高得离谱的优厚待遇。为了在生成式 AI 的竞赛中迎头赶上,马克·扎克伯格在几个月前联系了 OpenAI 的前首席技术官米拉·穆拉蒂 (Mira Murati),提出收购她刚刚起步的初创公司——Thinking Machines Lab。当她拒绝后,这位 Meta 的首席执行官发起了一场全面的“挖人大战”。在接下来的几周里,他接触了穆拉蒂公司约 50 名员工中的十几位,试探他们跳槽的意愿。他的主要目标是:安德鲁·图洛克 (Andrew Tulloch),一位顶尖研究员,也是该公司的联合创始人。据知情人士透露,为了挖走他,扎克伯格开出了一个十亿美元级别的薪酬包,如果在至少六年的时间里,加上顶格的奖金和非凡的股票表现,其总价值可能高达 15 亿美元。图洛克拒绝了。他的同事也无一离开。Meta 的发言人安迪·斯通 (Andy Stone) 称这份报价的描述“不准确且荒谬”,并表示任何薪酬包都取决于股价的上涨。他还补充说,Meta 对收购 Thinking Machines 不感兴趣。即使在硅谷这个明星工程师长期以来拥有巨大经济影响力的地方,拒绝上亿美元的薪酬包也实属罕见。但随着 AI 人才争夺战 的愈演愈烈,那些拥有最雄厚资金储备的公司发现,“钞能力”并非万能。虽然一些 AI 研究员如同自由人一样,为了更高的薪酬和权力在各个实验室之间跳槽,但也有相当一部分人对自己选择的领导者表现出坚定不移的忠诚。这些领导者是科技界的传奇人物,他们的名字本身就如同摇滚巨星一般具有号召力。不同初创公司独特的文化将员工紧密地联系在一起。与此同时,经过多年的轮番挖角,各家公司在人才防守方面也变得越来越精明。OpenAI 及其前员工(如穆拉蒂)创办的公司,是扎克伯格招聘闪电战的常客。从 AI 竞赛的早期开始,先驱们就以参与创造通用人工智能(AGI,即在大多数任务上比人类更聪明的系统)这一历史性使命来吸引研究人员。正是由萨姆·奥特曼 (Sam Altman)、埃隆·马斯克 (Elon Musk) 和伊利亚·苏茨克维 (Ilya Sutskever) 等人联合创立的 OpenAI,将这一使命变成了一种准宗教般的追求,其非营利宪章旨在确保这项工作能够造福全人类。OpenAI 首席执行官萨姆·奥特曼和曾任 OpenAI 首席技术官、后创立 Thinking Machines Lab 的米拉·穆拉蒂,都偏爱扁平化的汇报层级。Meta 已经接触了超过 100 名 OpenAI 的员工,并成功雇佣了至少 10 名。7 月 25 日,扎克伯格任命曾在 OpenAI 工作三年的中国研究员赵晟嘉 (Shengjia Zhao) 领导 Meta 新成立的超级智能团队。据知情人士透露,那些迄今为止拒绝了 Meta 橄榄枝的 OpenAI 研究员之所以选择留下,是因为他们相信 OpenAI 最接近实现通用人工智能,他们希望在一家规模较小的公司工作,并且不希望自己的劳动成果主要被用于以广告为驱动的产品。扎克伯格从 Anthropic 挖到的人才就更少了。这家市值 1700 亿美元的初创公司由达里奥·阿莫迪 (Dario Amodei) 领导,五年前他离开 OpenAI 创办该公司时,带走了一批顶尖人才。Anthropic 的七位联合创始人至今仍在公司。他们中的许多人是在十多年前通过“有效利他主义”这个紧密的圈子认识阿莫迪的。这是一场在研究人员中广受欢迎的社会运动,因为它早期就关注到 AI 可能失控并毁灭人类的风险。他们中的一些人曾住在旧金山的一栋集体公寓里,辩论如何最有效地捐出自己的财富,以及 AI 所带来的风险。扎克伯格从这家初创公司至少挖走了两名员工——乔尔·波巴 (Joel Pobar) 和安东·巴赫金 (Anton Bakhtin)——他们两人都曾在 Meta 工作多年。伊利亚·苏茨克维已采取措施,保护其公司的人才免受潜在的挖角。苏茨克维在去年联合创办的初创公司 Safe Superintelligence (SSI) 的构建方式,使其相对难以被挖角。与阿莫迪不同,苏茨克维没有从 OpenAI 挖走一大批研究员加入他。苏茨克维的大多数员工在硅谷并不出名,部分原因在于该公司正在寻找那些有新想法、有前途的技术专家,以便苏茨克维亲自指导。公司不鼓励他们在领英资料上提及 SSI,部分原因是为了防止其他公司试图挖走他们。今年早些时候,苏茨克维 拒绝了 扎克伯格收购 SSI 的提议。穆拉蒂在 OpenAI 工作了六年,于去年九月离职,她也拥有自己的一群追随者。她来自阿尔巴尼亚,在 OpenAI 还是一个小研究实验室时就加入了,帮助推出了公司的第一款产品,并作为首席技术官管理着公司几乎所有方面的事务。在 OpenAI,她以高情商和毫无架子而闻名,这为她赢得了研究和工程人员的忠诚。在 Thinking Machines,她也采用了与 OpenAI 和 SSI 类似的无差别汇报层级,即使是高级研究员,其头衔也只是“技术团队成员”,这是向贝尔实验室那种扁平、共事的文化致敬,而贝尔实验室也是 OpenAI 的灵感来源之一。当她今年二月创办 Thinking Machines 时,超过 20 名 OpenAI 的同事追随她而来,其中包括联合创始人约翰·舒尔曼 (John Schulman),他是 ChatGPT 背后关键人物之一,几个月前才刚刚跳槽到 Anthropic。穆拉蒂的许多研究员来自 OpenAI 的后训练团队,这个研究部门打造了 ChatGPT,并负责教 AI 模型如何与人类交流。Meta 一直在为其位于加州门洛帕克的办公室招募 AI 人才。穆拉蒂究竟在打造什么,即使对她的一些投资者来说,也是一个严守的秘密。这些投资者最近向该公司注资了 20 亿美元。公司公开的使命是让“AI 系统更容易被理解、可定制且更强大。” 穆拉蒂最近表示,公司正在“构建能与你自然与世界互动方式相契合的多模态 AI”,并将在“未来几个月内”分享其首款产品。这家初创公司在旧金山教会区 (Mission District) 一个较为安静的地方租下了一间办公室,距离 OpenAI 仅有几个街区。《连线》杂志此前曾报道过 Meta 接触 Thinking Machines 人才的一些细节。图洛克是 Thinking Machines 的联合创始人之一,他是扎克伯格和 Meta 超级智能实验室新任负责人亚历山大·王 (Alexandr Wang) 激烈招聘攻势的目标,两人都给他发了大量信息,邀请他加入。图洛克来自澳大利亚,毕业于悉尼大学,在校期间拥有理科生中最高的平均绩点 (GPA)。在剑桥大学读研究生之前,他在 Facebook 的机器学习部门工作了 18 个月。之后,他搬到加州,在 Facebook 的 AI 研究小组工作,并最终成为一名杰出工程师,这是该公司最高的技术职位之一。“他绝对是公认的天才中的天才,”曾与图洛克共事的前 Facebook 高管迈克·维纳尔 (Mike Vernal) 说。2016 年,在图洛克加入 Facebook 几年后,OpenAI 的总裁格雷格·布罗克曼 (Greg Brockman) 曾试图聘请他成为该组织的首批员工之一。布罗克曼在给埃隆·马斯克的一封邮件中写道,图洛克在 Facebook 的年薪是 80 万美元,他很可能会试图以此为基础进行谈判。当时,OpenAI 给新员工的待遇是 17.5 万美元年薪外加 12.5 万美元的年度奖金。“安德鲁非常接近同意了。但他担心薪水降幅太大,” 布罗克曼在 2 月 21 日的邮件中写道。他当时没有加入 OpenAI。七年后,当 ChatGPT 已经成为病毒式轰动、公司估值飙升时,图洛克最终还是加入了。
回复@k卡西亚斯:这说明什么?说明虎扑老哥也是 DEI 的,多元审美。而你这话就包逮诶筛姆了。//@k卡西亚斯:战鹰,贾玲都能上榜,乱弹琴这是
@tombkeeper
在虎扑的九届女神大赛里,刘亦菲五次进入四强,并且是唯一两度夺冠的选手。奇妙的是,网上对“刘亦菲到底好不好看”的争议一直持续至今,但高圆圆、佟丽娅之类的相关争议就不多。想明白这是为什么,就会对人类这个物种有更深刻的认识。
出租车司机合辑2025-08-01 “谁挣钱都不容易”:微博正文2025-04-12 爱国主义教育:微博正文2025-02-22 分灯笼:微博正文2024-07-13 又一位情圣:微博正文2024-03-21 “BBQ了”和BBQ没关系:微博正文2023-06-11 “黑砖块”:微博正文2021-07-25 成为宅男,永远不晚:微博正文2019-07-21 一位情圣:微博正文2013-04-18 外国语是人生斗争的一种武器:微博正文2012-07-19 众生皆苦:微博正文2012-05-15 用老年证坐出租车:微博正文Translate contenttombkeeper 的微博上车的时候司机正在打电话。电话那头是个气鼓鼓的女同志,声音很大,司机没开免提我都听见了。这位女同志丢了个东西在车上,她想让司机给送过去。司机认为如果专门送过去,对方应该出车费。但这个女同志说“谁挣钱都不容易”,她认为既然坐了这辆车,丢的东西司机就有义务免费送过去。司机说那等哪天凑
回复@橡胶树林小飞侠:确实是主观的,但是:微博正文 //@橡胶树林小飞侠:不懂,不过美这个东西本身就是很主观的
@tombkeeper
在虎扑的九届女神大赛里,刘亦菲五次进入四强,并且是唯一两度夺冠的选手。奇妙的是,网上对“刘亦菲到底好不好看”的争议一直持续至今,但高圆圆、佟丽娅之类的相关争议就不多。想明白这是为什么,就会对人类这个物种有更深刻的认识。
在虎扑的九届女神大赛里,刘亦菲五次进入四强,并且是唯一两度夺冠的选手。奇妙的是,网上对“刘亦菲到底好不好看”的争议一直持续至今,但高圆圆、佟丽娅之类的相关争议就不多。想明白这是为什么,就会对人类这个物种有更深刻的认识。 Translate content00:25
我内科学老师讲过,早年有个师兄在北京给人搞“纯中药”治糖尿病,90 年代就月入二十万,而且无数老头老太太赞其为神医。当时同学听说我要去北京,还开玩笑问是不是也打算用师兄那个二甲双胍泡草药的秘方发财去了。
@凯喜博士DrCash
“如果我在中药里面掺西药卖能成为名中医吗”?某乎上有人问
#民警上门要求删视频的监控曝光##两车交会没退让遭疑似公职人员威胁##民警要求网友删帖并向奔驰女司机道歉# 国土面积大的一个好处就是还能异地监督,温州媒体可以报道 1400 公里之外的事情。为了新闻理想也好,为了 KPI 也好,总归媒体监督还有。
@极目新闻
#奔驰女司机用亮证威胁他人必须彻查#【极目锐评|男子称遭奔驰“亮证姐”逼迫让路,关键信息警方不能“视情况公布”】#奔驰亮证姐真实身份不能视情况公布#近日,广西防城港一网友反映,他在7月22日下午,因为会车纠纷被一名开奔驰车的女子威胁。#奔驰亮证姐是不是公职人员应查清公布#该网友称,会车时他已经提前避让,但该女子要求其倒车让路,他拒绝后,该女子拿出一本证件称:“要不然,我就拿证了哦!” 该网友表示,该女子疑似公职人员,仅凭车牌就报出了他的家庭住址和姓氏。随后,他向当地警方及12345热线投诉此事。据浪潮新闻报道,7月31日晚10时许,防城港市公安局江山边境派出所民警来到该男子父母家中,打电话要求他删除视频,向奔驰女司机道歉。8月1日下午,极目新闻记者就此事咨询江山派出所,工作人员表示,派出所接到有人报警后处理,执法过程中全程录音录像。此事正在调查,有结果将对外通报,至于该女子是否公职人员,正在调查,会视情况公布。当事网友所发的视频在网络上迅速引发关注,如果其描述属实,会车时他已提前靠边避让,按理说已经是展现出了礼让的态度,奔驰车女司机为何执意要求其退后?究竟是当时通行空间的确不足,还是平时在路上霸道惯了?更令人震惊的是,争执中女子竟以“拿证”来威胁,其同行的男子还准确报出网友的家庭住址和姓氏,这究竟是如何做到的?是对方本来就认识他,还是通过了什么手段进行查询?这本能够对他人形成威慑、让人“退让”的证件,究竟是什么性质的证件?这一系列“霸气侧漏”的行为背后,是否隐藏着滥用职权,炫耀特权的问题?在双方发生矛盾的情况下,一方突然报出另一方的个人信息,其意味不言而喻。涉事网友称,他看到该女子所说的证件,封面上有“行政”“执法”字样,所以怀疑对方是公职人员。如果说,真的是公职人员利用职务之便或人情关系,获取了他人的个人信息,那无疑是对权力的滥用;如果是通过其他非法途径获取,则涉嫌违法。无论何种情况,都侵犯了他人的个人信息安全,触碰了公众的敏感神经。随着事件的发酵,派出所民警要求网友删除视频、向女司机道歉的行为,更是将争议推向了高潮。网友们的猜测和质疑声此起彼伏,纷纷质疑该女子是否“有身份”,民警执法是否公平公正。为什么只处理当事网友发视频的问题,却对女司机威胁他人的行为不予处理?如果涉事女司机具有特殊身份,这样处理是否存在偏袒?这些质疑并非空穴来风,而是基于事件中诸多雾里看花,令人困惑的情节。如果事实不能得到澄清,无疑会影响公众对执法公信力的认知。由此可见,警方及时介入调查并通报结果,尤为重要。而调查的关键,就在于查明该女子是否是公职人员,以及她的同伴是否真的查询了当事网友的个人信息,用以作为威慑的筹码。公职人员作为公权力的执行者,其言行举止都应符合相应的行为规范,严格在法律和职权范围内行事。查明该女子的身份,以及她获取公民个人信息的途径,是判断其行为性质的关键,也是评估警方处理是否得当的重要依据。然而,当地警方表示对于该女子是否是公职人员“会视情况公布”,这种说法显然难以满足公众的期待。若该女子确系公职人员,那么她的行为是否涉及滥用职权、违法违纪,应该有一个明确的说法;如果她不是公职人员,她所说的“拿证”到底是什么意思,其同行者又为何突然报出他人的个人信息,同样需要一个真相。所谓“视情况公布”的模糊承诺,只会让公众更为焦虑,让争议更加喧嚣。所以,针对涉事女子是否为公职人员,不应“视情况公布”,而应依据事实及时、准确地向社会公布。只有这样,才能消除公众的疑虑,维护执法的公正性和公信力。(极目新闻评论员 纪平) 极目新闻的微博视频
@黄建同学
从上下文工程到嵌入生成(embeddings),chunking(文本切块) 可能是整个流程中最被低估的部分。它对性能的影响比大多数人想象的还要大Chunking 是一种预处理步骤,用于将长文本拆分为更小的片段 —— 这些“chunk”就是你存储进向量数据库的实际单元。每个 chunk 会被向量化(embedding),决定了你搜索时能检索到哪些信息。以下是你应该了解的几种主流 chunking 策略:📏 固定大小 chunking(Fixed-size chunking)将文本平均分割成大小一致的片段(例如,每 100 个单词、200 个字符)。实现简单,但可能会打断句子、破坏语义。🔄 递归 chunking(Recursive chunking)采用层级化方式对文档进行切分,在保留原始结构的同时创建易于处理的 chunk。适用于在不同层级上维持上下文结构。📄 基于文档结构的 chunking(Document-based chunking)根据段落、章节等自然的文档边界进行划分。可以很好地将相关信息保持在一起,但每个 chunk 的大小可能差异很大。🧠 语义 chunking(Semantic chunking)根据文本含义而非固定长度或格式进行划分。能更好地保持上下文和语义完整性,但计算成本较高。⏰ 后处理 chunking(Late chunking)先将完整文本进行 embedding,再按需切分 chunk,能够保留更丰富的上下文信息在向量中。没有一种策略是万能的 —— 正如大多数工程问题一样,chunking 策略应根据数据而定。你选择的 chunking 方法将直接影响信息的检索效果,以及最终提供给大语言模型的上下文质量。推荐做法:先从固定大小的 chunk(200~500 tokens)+ 一定重叠开始,根据你的具体应用场景再逐步优化。举例:- 技术文档:可以使用章节、段落等结构化切分;- 叙述性文本(如新闻、博客):可能更适合语义切分方式。想深入了解如何设置 chunking,可以查看这个教程页面:🔗 Weaviate 官方 chunking 教程:docs.weaviate.io/academy/py/standalone/chunking#人工智能##程序员#