恭喜//@专业猥琐三十年:投票时看到就感觉很心酸,努力工作很多年工资都没特别上涨停留在选项四,心想自己有朝一日怎么也会去到选项五,昨天就收到好消息,公司人才盘点,进行第二梯队建设,我工资水平一下子就调到市场平均价了,达到选项四。PMP昨天也过了,双喜临门特此来还愿,有幸与这么多优秀的人同行,大家共勉
@t0mbkeeper
2022 年 5 月和 2023 年 3 月我曾在 @tombkeeper 这个号做过两次粗略的月收入调查。这两次都没有限制参与投票的人。也就是说被调查对象包括粉丝,以及粉丝的粉丝等更多级关系链。2022 年 5 月是两个选项:>>大于2万:35%;>>小于2万:65%。2023 年 3 月是三个选项:>>大于2万:34%;>>小于2万:50%;>>学生无收入:16%。把 2023 年 3 月的后两项合并后,可以看出时隔近一年的两次调差结果几乎是一样的。这也多少可以证明调查的有效性。“学生无收入”这个选项有稀释作用。如果没这个选项,一些学生可能会觉得收入调查和学生没关系,也不会去选“0-5千”那一项。所以,当存在“学生无收入”这个选项的时候,不仅会从“0-5千”中分走一部分,也会由于总人数增加而稀释该选项以外其它项的数字。2023 年 6 月我在 @tombkeeper 这个号做了更细一些的调查。这次是仅限粉丝投票。>>0-5千:14%>>5千-1万:16%>>1万-2万:26%>>2万-5万:31%>>5万-10万:8%>>大于10万:5%从调查结果看,月收入 1 万元以上的占了 70%,2 万元以上 44%,5 万元以上的是 13%。这次仅限粉丝参与的投票中 2 万元以上的比例明显高于前两次。2024 年 4 月我在 @t0mbkeeper 这个账号又做了一次月收入调查,想看看跟着来这个账号的粉丝是不是收入水平还会更高些。选项和前一次基本相同,只是增加了”学生无收入“一项。也是仅限粉丝投票。>>学生无收入:9%>>0-5千:8%>>5千-1万:13%>>1万-2万:25%>>2万-5万:29%>>5万-10万:9%>>大于10万:7%从这次调查看,在加了“学生无收入”这个稀释选项后,月收入 1 万元以上的仍是 70%,2 万元以上 45%,而月收入 5 万元以上的增加到了 16%。看了这个结果我挺开心的。还是那句话,我认为关注我的人相互之间在 MEME 意义上有更近的亲缘关系,所以我希望大家生活得更好,多挣点钱。
值得学习,4chan这个语料不少大模型公司有需求,不过话题内容实在是出格,特别是很多对祖国不利的内容,这个数据非常非常危险。。//@warmchang:@梁斌penny
@爱可可-爱生活
谷歌DeepMind团队通过Generative Data Refinement(GDR)技术,成功将极端有毒的4chan讨论数据转化为安全且语义丰富的训练素材,推动了LLM训练数据净化的新范式:• GDR利用预训练大模型对原始数据进行“重写”,而非简单丢弃敏感或有害内容,极大保留了数据的语义结构与多样性。 • 在超过100种个人身份信息(PII)检测任务中,GDR实现了0.99召回率和0.80精准率,优于行业顶级PII检测工具,且用通用占位符替换敏感信息。 • 针对120万+行多语言代码,GDR不仅准确识别并去除PII,还发现了人类标注遗漏的敏感信息,保障训练数据安全与完整。 • GDR对4chan /pol/板块10万条信息进行净化后,整体毒性评分显著下降,甚至与Gemini模型生成的合成讨论内容相当。 • 使用净化后的“安全4chan”数据微调Gemini模型,既提升了模型准确性,也让对话更自然且难以被识别为AI生成。 • 生成的合成数据不仅保留真实数据的多样性,甚至在多样性指标上超越直接生成的合成样本,解决了训练数据因风险过滤而流失多样性的问题。 • 该方法为日益庞大的潜在训练数据池解锁了安全利用路径,推动了更广泛、更真实的语料资源整合。 这背后的核心突破在于“保留语义精华而非粗暴过滤”,为LLM训练提供了兼顾安全与多样性的理想数据基础。未来模型的安全性和表现力有望因此获得质的飞跃。 详情阅读论文🔗arxiv.org/abs/2509.08653 原文分享🔗x.com/MinqiJiang/status/1967563165455265905 #大语言模型# #数据净化# #生成式AI# #机器学习# #人工智能#
在程序员圈子里就是:“尤雨溪懂个锤子 Vue” //@南郭刘勃:我见过对《论语》这样的评论:孔子对儒家理解浮于表面,要看王阳明。
@唐不闻
#笑林窄记# “章太炎太肤浅,空有其名,不如南怀瑾”
看到有人说幸亏自己出生的早,认为如果现在毕业可能就找不到工作了。这种可能性当然存在。就业受很多外部因素影响,不过最核心的还是就业者本人。如果刘备去茅庐的路上吃坏了肚子无功而返,那诸葛亮大概就当不上蜀汉丞相。但诸葛亮还是诸葛亮,也许会跟他哥哥一起去孙权那里,或者跟他弟弟一起去曹操那里。我参加高考那年,全国 18 岁的人口约 1900 万,专科和本科加在一起录取了 100 万人。也就是说我的同龄人每 19 个有 1 个能上大学。而 2020 年全国 18 岁人口约 1400 万,高考录取了其中的 1000 万人。所以,生的早上二本,如果生的晚也许就能上一本,再晚一点没准就双一流了。能找到工作的,晚生些年大概率还是可以找到工作。
我认识一些在2022年底清空700-HK和9988-HK的人。//@KpaxQ1n:9.4的时候有个买了创业板etf的朋友没拿住清仓了,我本来也有点动摇,后来审视了一下自己的情绪,决定不要卖在恐慌的时候……现在离9.4那天10个点了
@tombkeeper
9 月 4 日,粉丝群一片哀嚎。我对大家说这么哀嚎就和韭菜们没两样了。9 月 5 日,群里接着哀嚎,而且嚎得更厉害。我只能更严肃地制止。我告诉大家这种哀嚎是毫无信息量的情绪宣泄,每一条哀嚎都会让其他人更不冷静,从而激起更多哀嚎,然后共振,把所有人的情绪放大,最终害人害己,没有任何好处。投资最大的敌人就是情绪,管理不好自己的情绪,也就管理不好自己的钱。人类的自由意志非常脆弱,甚至空气质量都会影响人的投资决策(微博正文)。9 月 12 日,我让大家回顾前几天群里的哀嚎,重温当时的气氛,审视自己的内心。只要我们别轻易放过自己,糟糕的情绪也可以成为教材,帮我们增强情绪管理能力,避免成为一惊一乍的韭菜——在投资以及很多比投资更重要的事情上。另外,大家也可以回顾一下自己关注的财经博主们在 9 月 4 日和 9 月 5 日的观点。
做生意的老板都想降息(无论借债的,还是没借债的),通胀能帮助债主稀释贷款,释放消费,代价是老百姓存款被稀释。现在社会整体是劫贫济富,只是群众不理解,偷偷拿了觉悟,但如果不这样,老板躺平,群众的就业也无从谈起,两害取其轻,还是要降息。
@新浪财经
#特朗普再度要求美联储立即降息#【特朗普:美联储主席鲍威尔必须立即降息】#美联储降息预期攀升# 当地时间9月15日,美国总统特朗普在其社交平台“真实社交”上发文表示,“太迟先生”美联储主席鲍威尔必须立即降息,而且幅度必须比他预想的更大。此前,特朗普已多次要求鲍威尔降息。美国8月失业率上升至4.3%,创近4年来新高,就业数据恶化强化了市场对美联储降息的预期,分析人士预计美联储或于9月开启新一轮降息。4日,特朗普对记者表示,他预计美联储将在本周的会议上宣布“大幅降息”。若成真,这将是美联储自去年12月以来首次降息。美联储将于9月16日和17日召开货币政策会议,市场普遍预计美联储届时将开启新一轮降息。