回复@少亏是福:不用投,我们自己做应用//@少亏是福:梁博应该去投几个应用去碰碰运气,万一成了可以成吹牛的资本//@梁斌penny:回复@图奥曼tm:深度接入大模型数据供应商bayou tech表示,数据的需求还非常旺盛,努力吧同志们。//@图奥曼tm:@梁斌penny 机会来了梁博
@阑夕
来自The Information的猛料:ChatGPT的训练好像卡住了⋯⋯- 先说乐观的,OpenAI的下一代模型GPT-Orion虽然只完成了20%的训练,但它的能力已经和GPT-4持平了;- 但是——没错,但是来了——和GPT-3到GPT-4之间的飞跃进步相比,GPT-Orion的提升要小很多,所以它配不上GPT-5这个命名;- 更坏的消息是,GPT-Orion的成本更高,它对语言的理解更好,但在编码上可能还不如老模型那样可靠;- GPT-Orion的困境可能破坏了AI行业的一个核心假设,即只要有更多的数据和算力,大模型就能以不衰减的速度变聪明;- OpenAI和Meta都开始以底层技术没有突破的前提下开发产品,比如接管个人电脑和浏览器去模拟用户执行真实操作的功能;- 最大的问题在于互联网上的数据早就被用得精光了,GPT-Orion大量依赖合成数据——也就是AI自己生成的内容——来做训练,结果导致了内卷;- 内卷的表现就是烧钱训练出来的新模型越来越像旧模型,原因不难猜到,因为它的数据都是由旧模型提供的,一切学习都在原地踏步;- ChatGPT新尝试的推理链在科研行业表现很不错,很多科学家和数学家都在使用,但因为成本是通用模型的6倍以上,很难被大众市场接受;- OpenAI的股东Ben Horowitz已经开始抱怨,说公司采购GPU的数量持续增长,但根本上的AI智商没有同步提高;- 深度接入主流大模型的数据商Databricks表示,AI在多步骤任务上还有改进空间,但是日常类型的任务,比如情感对话这种,已经没有进展了;- 总结是,大模型进入了平台期,需要想办法获取更多的真实数据,合成数据起不到作用了。* 这篇报道在行业内争议很大,很多从业者都跳出来表示不信谣不传谣,反对AGI虚无主义传播,so⋯⋯兼听则明。
@量子位
#字节Seed首次开源代码模型##字节Seed开源代码模型夺SOTA#字节跳动的Seed团队,首次开源了他们的代码大模型——Seed-Coder,参数规模8B,在多个权威基准上击败了Qwen3、DeepSeek-R1,夺得SOTA成绩。Seed-Coder共发布了三个版本:- Base:基础模型- Instruct:强化指令理解,通过监督微调+偏好优化,提升模型“听懂人话”的能力- Reasoning:面向复杂推理任务,采用强化学习的方式,锻炼多步推理能力,在IOI 2024超过QwQ-32B这个模型的特别之处在于,团队提出了“用小模型自管数据”的新范式,也就是模型自己策划训练数据,连生成和筛选都由模型完成,人工干预极少,具体方式包括:1. 四类高质量数据源: - 文件级代码:从GitHub提取单个文件内容 - 仓库级代码:保留项目结构关系 - Git Commit:覆盖7400万次提交,格式化为代码变更预测任务 - 网络代码相关内容:从网页提取结构化和非结构化代码信息 2. 数据去重与筛选: - SHA256+MinHash双重去重 - 使用语法解析器排除错误代码 - 通过LLM评分模型评估代码可读性、模块性等质量维度 3. 定制化评分机制: - 针对不同网站内容风格(博客/论坛)制定不同评分标准,避免误判有价值内容 目前完整代码和模型均已开源:网页链接
鞭刑是一回事,打黑工就鞭刑是另一回事。如果打黑工就鞭刑,那么相比较起来,特朗普对非法移民的态度就显得无比仁慈,完全有资格当教皇。//@出版人周筠: 查看图片 //@洛兵:开花馒头都见过吧,屁股挨了鞭刑,就是那个样子。//@鲁南老刘先生://@鲁南刘先生2:赞成👉,专治顽疾难控的犯罪或违法行为//@出版人周筠:建议引进//@程序员邹欣:人性几千年还有很多不变的成分//@大红矛:“被要求向鞭刑官道谢”
@JoannaBlue
小🍠上有博主写了自己在新加坡遭受鞭刑的全过程,通篇读完,明白为什么在21世纪仍保留这一刑罚,对犯罪人员的震慑力度不是一般得大,包括生理和心理层面…
回复@铭铭比比:图片中的两个链接:微博正文 微博正文 //@铭铭比比:请问是哪几条微博?
@tombkeeper
前阵子群里一位粉丝说用我微博的内容应对了面试。其实重点并不是我的微博,而是他的行动力。人类文明发展至今,在任何方面都能找到包含前人经验的资料,他只是有缘恰好看到了我写的那些。但多数人无论看了什么都不会付诸行动,毕竟责怪一切凑巧落在他们视野里的东西要容易得多。
白左里有很大比例是文艺左,就是言必称齐泽克、桑德尔那种。国内对应白左的群体里,文艺左的比例好像还更大一些。国内文艺左倒也未必都谈齐泽克、桑德尔,但有个比较普遍的特点,就是容易感动,森替门头,议谋身闹。不感动的时候还好,一感动起来,说的话也难看懂。大概就是这样: Translate content 长图
前阵子群里一位粉丝说用我微博的内容应对了面试。其实重点并不是我的微博,而是他的行动力。人类文明发展至今,在任何方面都能找到包含前人经验的资料,他只是有缘恰好看到了我写的那些。但多数人无论看了什么都不会付诸行动,毕竟责怪一切凑巧落在他们视野里的东西要容易得多。
做个粉丝平均月收入调查。这里所说的收入,不只是薪酬,也包括被动收入,例如各种租金、利息等。也就是用 2024 年全年的税前总收入除以 12。 Translate content2024 年你的全年总收入除以 12 是:498还在上学,没有收入554大于 0 元,小于等于 5 千元895大于 5 千元,小于等于 1 万元1753大于 1 万元,小于等于 2 万元1922大于 2 万元,小于等于 5 万元展开全部选项6751人参与 还有6天结束 仅粉丝可参与@tombkeeper创建