2026年05月10日
最后更新:2026-05-10 08:02:23 UTC+8
1/在多次被Claude禁止后,放弃并转回国内LLM ,并被明显愚蠢的模特弄伤了自我—我觉得我对孩子们变得更有耐心了。如果我不得不和十几个这样的经纪人打交道,我可能会考虑转行做幼儿园老师的助手。我还给我的孩子买了一套早期教育书……
1/ 自从被 Claude 连续封号,懒得折腾、换回国产大模型的 Coding Plan、被明显蠢一截的模型智商虐过之后,我感觉自己现在带孩子都有耐心多了。 要是再多跟这样的十几个 agents 打打交道,我兴许可以转行去幼儿园当月亮哥哥了。最近我还在拼多多上给宝宝买了一套安全教育+拒绝欺凌+语言表达的早教书。 回头一想——这何尝不是一种「Harness Engineering」?说到 AI 时代的子女教育,蛮多感触的,兴许可以汇总出一期久违的播客了。有人想听吗,点个赞看看?↑ 夹带私货发一张假期当牛做马的老父亲(标题《少爷和我》)2/ In case 您不知道:我这个 Newsletter ...
1/我注意到,这份通讯的很大一部分订阅者来自中国以外的国家和地区;从私人谈话中,我也发现了许多全球公司的员工和高管。因此,我决定从本期开始同时发布英文版。为了避免打扰大家,中文版将一如既往地继续—通过电子邮件发送...
1/ 我注意到这个 Newsletter 的订阅读者中,有相当比例是来自中国之外的其他国家/地区;私下交流中,也发现很多全球性公司的职员和高管。于是我打算从这期开始,同步更新英文版。为了不叨扰大家,目前中文版仍然跟现在一样,发 Email + Substack App。而新增的英文版,会先仅通过 Substack App 发布,暂时不发邮件。这样老读者不会立刻收到两封(内容一样的中文版+英文版),增加信息负担。后续将找方法慢慢过渡。例如,仅需要英文版邮件的朋友,给我一个私信/回复,我给你们打个标签,这样后续可以按标签来推送邮件。是不是可以尝试下?或者有更好的建议,请不吝赐教。今天的第一份英文版...
1/ 前一阵子一打开候选内容库,满屏的「小龙虾」;最近风向转了,都在明里暗里讨论「蒸馏某人/职能」(尤其今天早上看到 小扎演都不演了)。此情此景,让我很想化用经典,吟诗一首——开始他们蒸馏翻译、运营、程序员、打字员,我没说什么,因为我不是干这行的;后来他们蒸馏产品经理、分析师、设计师、编剧、作家、演员、销冠,我还是没说什么,因为我觉得与我无关;接着他们蒸馏教师、律师、医生、会计、记者,我依然没说什么,因为我暂时还能站着;最后他们来蒸馏我时,环顾四周,已经没有人能替我说话了。—— 只剩下 Agent 对我冷冷嗤笑。2/ 最近基友开发的笔记产品 flomo 迎来了六周年,近期相继推出了(或即将推出...
1/ 一晃这个周更 Newsletter 都写到 EP #52 了。算上中间偶尔停更的那一两期,满打满算也是写满一年了。目前也仍是最大的中文 AI 商业类 Newsletter。期间 AI 光速发展,我的技术栈也迭代了好几版。从最开始希望逐渐全自动完成,到现在坚定了用机器帮我半自动分拣 + 最终人工精拣筛,也算摸出了固定套路。域名注册为 ZengZhang.ai,原本还是想从老本行的「商业增长」视角切入,不采编纯技术向(却没结合实际应用场景落地的)内容。但发现即便是聚焦在商业领域,市面上公开披露的案例,仍会有大量浅薄重复的,观点也不乏空泛的宏大叙事或孱弱的未来预测。所以现在我完全按我主观标准,...
今天推荐一款新产品 —— Vibe Island(官网 https://vibeisland.app ,先不用急着下单,看到最后有福利)。它的作者之一 Edward Luo 是一位曾经搞过艺术、现在在搞产品的设计师,也是这个 Newsletter 的 VIP 成员,因此我必须大力帮忙宣传一波。Vibe Island 的界面,主要就是一个位于 Mac 电脑刘海屏的展示区(电脑没有刘海也能用,会虚拟一个刘海区域出来)。点击刘海屏时,面板会展开,显示当前所有正在运行的 AI Agent 会话及其各种状态(作者推特的演示视频)。你在用 Claude Code / Codex / Gemini / Cu...
最近各家都开始出官方 CLI 了,我也开始陆续把自己常用的CLI(/MCP)整合进我自己的贾维斯了,包括 Podwise、飞书、滴答清单、flomo 等。在此特别推荐 Podwise 新出的 CLI(Github 主页)。以防你不知道:Podwise 是我一直在用的「信息套利」工具,可以专门用来压榨那些有信息量的硬核播客/YouTube 视频的价值。转录文字稿、总结洞察、信息可视化、同步笔记。推荐出去,用了都说好(我之前录制过一期 YouTube 视频来介绍它)。我用它的 CLI 做了几个 skills,譬如直接将常听常看的节目的最新一期的文字稿(包括其他 AI 精炼内容),拉取到本地,经过我...
上周休更了一期。因为几个事情:首先是 Claude Code 最近非常不稳定,我的 Claude 账号池又突然被封了,导致我重构到一半的系统崩了,各种运转难以为继。赶上我要处理公司业务,没时间修,就崩在那里足足一个礼拜。在此期间我还有出差,时间被挤占。筛选出来的内容,又几乎都是各种围绕「龙虾」的玩法和观点,给我看吐了。几件事凑在一起,我想索性趁着春光明媚,鸽一期得了,既弥补一下近期高强度熬夜玩 AI 的身体透支、亲近一下自然,也看看有多少人真的在乎这个 Newsletter。过去两周也走访了一些企业,围绕搭建企业内私有化智能体的话题做了些分享与探讨,并看到了 AI 在组织中落地的几种形式。参观...
最近这一周,围绕「龙虾(OpenClaw)」及其衍生产品的各种新闻、案例、八卦仍在爆火,我检测到的案例,基本都在聊龙虾。想必各位也被轰炸疲劳了,加之上周我也一口气汇总了不少龙虾的资讯和信息源,因此这周,为了降低噪音,「案例」部分我就只放一篇,并不打算凑篇幅。如果你已经折腾过龙虾,判断出还是自己搭建更省钱、可控、安全,不妨购买 我的 DIY 贾维斯课程 看看,本质就是在讲搭建一套自己的龙虾系统。另外,今天跟 flomo 团队的两位创始人交流,在聊到龙虾近期的热度,以及越来越卷的趋势时,Lightory 说了一句堪称点睛之笔:「虾熟了是会卷的」。唔,好冷,建议去开放麦讲程序员脱口秀。Subscri...
Stripe 推出了 Link agent wallet,让 AI agent 可以代表你发起付款,但不会拿到你的真实银行卡信息。这件事可以先记住几条:AI agent 可以为你创建一次性支付凭证,用完就失效。你会收到提醒,并在 Link 里批准或拒绝每一笔购买。真实卡号不会交给 agent,也不会暴露给它正在操作的工具。Link CLI 已经开源,开发者可以把它接进 Claude Code、MCP 客户端或自己的 agent 工作流。这不是让 AI 自由花钱,而是给 AI 花钱加上边界、记录和人工确认。以前 AI agent 再聪明,遇到付款就会卡住。它可以帮你挑商品、比价格、填表格,但最后...
Telegram 在最新一版 Bot Features 文档里加了一节,叫 Managed Bots。让一个 Bot 帮普通用户去创建和管理另一个 Bot,全程不用打开 BotFather、不用复制 token、不用配置任何东西。从此普通用户不用再去 @BotFather 一步步点菜单,只要打开一个链接,1 秒钟就能拥有自己的 bot,且整个生命周期(收发消息,改头像,改命令,改设置)都由那个"manager bot"代管。用户两步搞定:点链接、改名字(可选)、确认,一个专属 Bot 就出现在你的聊天列表里开发者只用做一个 Manager Bot:然后通过它创建和控制无数个用户的子 Bot,模...
Anthropic 今天给 Claude Code 终端版本加了一个叫 recap 的小功能:当你把终端切到后台,过一会儿再切回来,Claude Code 会自动在顶部显示一段这个会话刚才干了什么、下一步打算做什么的回顾。功能很小但刀口精准。同时开 5 个 Claude Code 窗口跑 5 个不同任务的人,最大的上下文切换成本不是任务本身,是“我刚回到这个窗口,它刚才在干啥来着”。recap 直接省掉了重新回忆的那几秒钟。几个要点一眼扫完:触发条件:会话至少 3 个 turn + 距离上次完成 turn 过了至少 3 分钟 + 终端当前失焦后台生成:失焦期间就在后台算好,切回来立刻看到,不再...
Google 宣布推出下一代自主研究智能体:Deep Research 和 Deep Research Max,均通过 Gemini API 提供。这是 Google 研究智能体的第二代。去年 12 月已经在 Interactions API 里放过一个预览版,今天直接把能力升了一档,从“写摘要的工具”做成了“能接 MCP、挂私有数据、出完整图表”的工业级底座。驱动模型: 基于 Gemini 3.1 Pro,提供前所未有的控制和透明度。两种模式的对比:Deep Research: 面向速度,降低延迟和成本,适用于需要快速高质量答案的交互式界面。Deep Research Max: 面向深度分析...
昨晚到今早,X 产品负责人 Nikita Bier 连发两条推文,宣布 X 上线了两件互为镜像的新东西。一个管加法:自定义时间线(Custom Timelines),可以把你关心的特定主题置顶到主页 Tab,支持超过 75 个细分话题。一个管减法:主题静音(snooze topics),可以把 For You 里你不想看到的主题调低甚至屏蔽掉,用 Nikita 自己的原话说,“想把 slop 调高调低都可以”。两个工具放在一起看,X 这次给 Premium 订阅用户做的事很简单:把算法推荐从“黑箱喂你”改成“你自己调音”。核心要点:加法工具:自定义时间线支持 75+ 主题置顶到主页 Tab,由...
ChatGPT Images 2.0(OpenAI 最新图像生成模型,内部代号 GPT-Image-2)正式发布,定位从"创意工具"转向"可用输出的视觉工作流平台"。这是 OpenAI 第一次把「会思考」装进图像模型,之前只有 Google 的 Nano Banana Pro 做到了这件事。先让GPT根据它对我的了解生成一张自我介绍… 哈哈哈核心变化:会思考了:先推理再生成,复杂任务可以边想边上网查资料,不是一步出图一次出 8 张连贯图:人物、物体、风格跨图保持一致,多格漫画、故事板、多图系列一次搞定文字不糊了:小字、UI 元素、图标能精确渲染,TechCrunch 实测做餐厅菜单直接能用中日...
月之暗面(Moonshot AI)4 月 20 日开源新版大模型:Kimi K2.6,主攻「代码和 Agent 长时程执行」。在 SWE-Bench Pro 这个测真实代码修改能力的基准上,K2.6 拿到 58.6 分,把 GPT-5.4(57.7)和 Claude Opus 4.6(53.4)都压在身后——这是开源模型第一次挤进闭源旗舰的第一梯队。一句话快速看懂:代码硬跑反超闭源:SWE-Bench Pro 开源第一,Terminal-Bench 2.0 只差 Gemini 3.1 Pro 1.8 分一次指令跑 12 小时不停:4000+ 次工具调用连续执行,Mac 上把一个推理引擎优化到比...
OpenAI 今天给 Codex 加了一个新功能:Chronicle 。让 AI 通过看你最近的屏幕来记住你在干什么。下次你说“帮我改下那个报错”“继续上周那个东西”,它真的知道你指的是什么,不用你再复述一遍。这是上周 Codex 上线的 Memories(记忆)功能的延伸。Memories 只能从历史对话里攒记忆,Chronicle 往前走了一步:直接读屏幕。一眼看完:读屏补上下文:你说“这个报错”“那个文档”,Codex 能从最近的屏幕截图里找到你指的是哪个学你的工作方式:你常用什么工具、在哪个项目来回切、依赖什么流程,它边看边学后台代理生成记忆:不是实时监控,是跑沙盒代理从截图里提炼结构...
Cloudflare Email Service 是 Cloudflare 推出的邮件服务,4 月 16 日进入公测。这次的重点不是给应用发注册邮件、通知邮件这种常规活,而是让 AI 助手能像真人同事一样用邮箱工作:你发邮件给它,它收到、办事、办完了回你。主要变化是这几个:发邮件能力进入公测,所有应用和 AI 助手都能直接调用AI 助手能完整闭环用邮箱了,收到邮件能自己处理几小时再回信给 Claude Code、Cursor 这类 AI 编程工具做了套配套,本地跑的 AI 也能用开源了一个完整的"AI 收件箱"应用,一键部署就能用,新邮件来了 AI 自动起草回信,确认后才发自动帮你配好邮件认证...
核心思路是"写 HTML,渲染出视频",专门为 AI agent 设计。用 HTML + 一些 data-* 属性定义视频,跑个命令就能渲染成 MP4不需要 React,不需要专有的 DSL,不需要拖拽时间轴,agent 已经会写 HTML 了,让它直接生成支持 GSAP、Lottie、CSS、Three.js 等动画运行时,通过 Frame Adapter 模式接入确定性渲染:同样的输入永远产出完全一致的输出,适合 CI 和批量渲染管线自带给 Claude Code、Cursor、Gemini CLI、Codex 用的"skills",把框架的语法规则教给 agentApache 2.0 开...
文章网址: https://juretriglav.si/surfel-based-global-illumination-on-the-web/ 评论网址: https://news.ycombinator.com/item?id=48077395 积分: 3 #评论: 0
文章网址: https://undecidability.net/senior/ 评论网址: https://news.ycombinator.com/item?id=48077966 积分: 32 #评论: 27
文章网址: https://github.com/ThatXliner/rust-but-lisp 评论网址: https://news.ycombinator.com/item?id=48078575 积分: 33 #评论: 13
文章网址: https://reclaimthenet.org/france-moves-to-break-encrypted-messaging 评论网址: https://news.ycombinator.com/item?id=48078811 积分: 24 #评论: 6
文章网址: https://www.cryptopolitan.com/user-tricked-grok-bankrbot-to-send-tokens/ 评论网址: https://news.ycombinator.com/item?id=48079114 积分: 4 #评论: 0
我有Google One (带有AI ) ,因为我曾经需要它用于Google表格,这也适用于其YouTube摘要/集成。但实际上是谁在其他情况下使用双子座?这是相对于got/claude的屁股,一直都是。我一直看到关于谷歌增加市场份额的帖子,但我觉得这要么是a )公司强迫它,因为他们在谷歌生态系统中,要么b )在生态系统中使用。什么...
与上下文漂移、目标错位等不符。从理论上讲,图灵机是否有可能处理治理方面的所有已知问题?或者, (比如) 90%的问题可以通过严格的治理流程来处理,但最后10%的问题基本上无法预测和治理?或者,正如拉姆斯菲尔德所说,是否有未知的未知数,那些我们不知道的……
我们正在经历一些疯狂的时代。提交者:/u/bekircagricelik [link] [comments]
提交者/u/DrBrianKeating [link] [comments]
他住在你的桌面上,作为一个透明的叠加层,他想做什么就做什么。你可以试着和他说话,把他扔到屏幕上,或者在他身上部署暴徒,他对所有这些都有看法。由本地Ollama型号提供动力,因此一切都在您的机器上运行。个性是在完成格式提示下完成的,而不是遵循指令,这在小模型上效果更好,因此他...
我试图提交给ICML FM4LS研讨会,但注意到openreview不再接受提交-尽管网站上列出的截止日期是5月9日AoE。是否有任何我错过的沟通?还有其他人遇到同样的问题吗?由/u/Bookkeeper_Gloomy提交[link] [comments]
我建立了一个名为LLM Win的小型网站: https://llm-win.com它将LLM基准测试结果转换为有向图: text如果模型A在基准测试X上击败模型B ,则添加边缘A - > B。然后它搜索两个模型之间的最短传递链。模因版本是: text LLaMA 2 7B能否击败Claude Opus 4.7 ?在一个荒谬的传递基准意义上,有时是。但我添加了一个“报告”选项卡,因为……
我知道出版数量并不是一切,质量、贡献、顾问/实验室文化、子领域和运气都很重要。但为了便于比较,我特别对出版物计数方面感到好奇。对于ML博士学位,您认为毕业后的平均出版成果如何?例如,是否考虑在A/顶级场馆*发表3–5篇第一作者论文...
有人接受EEML 2026暑期学校吗?提交者:/u/No_Cardiologist7609 [link] [comments]
我想匿名分享面试经历,以防面试对就业市场上的其他人有所帮助。有人向我介绍一个温哥华机器学习的角色,这个角色是以研究为导向的。招聘人员告诉我,团队已经看过我的研究,我应该准备好讨论我的项目,所以我希望能有一个关于建模、研究想法和适应的对话。面试的感觉不是这样……
DeepSeek本周放弃了完整的V4论文。4月份的预览是58页,这个版本增加了很多技术深度。让我印象深刻的是什么。FP4量化感知训练。他们在后期训练中直接运行FP4 QAT。MoE专家权重量化为FP4 (主要gpu内存消费)。CSA索引器中的QK路径使用FP4激活。QK选择器加速2倍,召回率为99.7% …
Anthropic 的 Claude Code 团队成员 Thariq Shihipar 公开发布 20 个自包含 HTML 示例,论证 AI Agent 输出 HTML 比 Markdown 更有效。Simon Willison 随即撰文跟进实测。格式之争的底层逻辑:从”人写”到”Agent 生成”的交付范式转移。事件起因:Thariq Shihipar 的 HTML 宣言2026 年 5 月 8 日前后,Claude Code 团队成员 Thariq Shihipar(X: @trq212)发布推文:”HTML is the new markdown. I’ve stopped writi...
Anthropic 在 Claude Code 终端内置 /radio 命令,一键调出 Claude FM lo-fi 编程电台,将 Lofi Girl 式的专注背景音直接嵌入 AI 编程工作流。/radio 命令:Claude Code 终端内的电台开关Claude Code 的官方命令文档中注册了 /radio:在浏览器中打开 Claude FM lo-fi 电台无图形界面的服务器环境下,直接在终端打印流媒体 URL,供外部播放器接入不适用于 Bedrock、Vertex 或 Foundry 部署版本,仅限 Anthropic 直连或付费订阅命令本身没有任何参数。输入 /radio,浏览器...
Anthropic 2026 年持续收紧账号审核,多家企业和个人开发者在无预警、无明确理由的情况下被封禁,申诉渠道仅靠 Google Form 响应。用户自发建立 bannedbyanthropic.com 收集公开案例,要求 Anthropic 建立透明申诉机制。请愿站上线:bannedbyanthropic.com2026 年 4 月 19 日前后,bannedbyanthropic.com 上线。该站包含两个功能:请愿页:呼吁 Anthropic 人工复核封号决定、提供公平申诉流程、恢复合规账号。案例页(/cases):公开记录 Claude 账号封禁、暂停、组织级禁用事件。用户可按公开...
5月9日,DeepSeek 在网页端和手机 App 大范围开放”识图模式”内测,多数测试账号已可使用。该模式基于 DeepSeek-V4 系列,支持图像理解,是 DeepSeek 首次将原生多模态能力开放给终端用户。上线节奏:4月末灰度 → 5月9日大范围开放识图模式于 2026 年 4 月 29 日启动灰度测试,初期仅部分账号可见。5 月 9 日起,多数测试账号已能在对话界面通过新增入口接入,界面仍标注”图片理解功能内测中”。该模式作为独立入口出现,与已有的”快速模式”、”专家模式”并列。用户需手动切换至识图模式方可上传图片,目前未实现文本与图像模态的无缝切换。技术架构:OCR2 + 视觉因...
RunningHub 将 AI 智能体从”对话外挂”变为”画布原生”,用户用自然语言描述需求即可自动生成完整 ComfyUI 工作流,把视频创作从”盲盒抽卡”推向”导演级掌控”。产品形态:Agent 原生嵌入画布,非外挂RHTV(RunningHub TV)于 2026 年 5 月 7 日上线,官方定位为”原生 AI 智能体全能内容创作平台”。核心差异化在于 Agent 直接嵌入无限画布内部——不是独立聊天窗口,不是侧边栏插件,而是画布上的第一公民。用户输入自然语言描述(如”做一条电商产品宣传片,展示白色运动鞋,背景渐变”),Agent 自动完成以下链路:任务拆解:输出创意大纲、分镜脚本、制作...
OpenAI 将 GPT-5 级推理能力引入实时语音 API,上下文窗口从 32K 扩至 128K,并配套推出实时翻译和语音转录两款辅助模型,首次构建完整的语音 Agent 工具链。GPT-5 级推理进入语音交互GPT-Realtime-2 是 OpenAI 首个在语音对话中集成 GPT-5 级别推理能力的模型。与上一代 GPT-Realtime-1.5 相比,核心升级包括:上下文窗口从 32K 扩至 128K tokens,支持在更长语音会话中维持用户约束、偏好和业务逻辑。支持工具调用(function calling),可在对话过程中实时查询日历、搜索系统等外部工具,并支持 MCP 协议。...
Anthropic 在 2026 年第一季度完成了 Claude 对 Microsoft Office 三件套的全覆盖,并通过跨应用上下文共享功能,让 Claude 在 Excel、PowerPoint、Word 之间保持统一的对话语境。这是 Claude 首次深度嵌入企业办公工作流,直接对标微软自家的 Copilot。时间线:3 个月完成 Office 全覆盖2026 年 3 月至 4 月,Claude 接入 Office 的节奏明显加速:3 月 9 日:微软在官方博客宣布 “Copilot Cowork”,将 Claude Cowork 技术集成进 Microsoft 365 Copilo...
OpenAI 将 Codex 的浏览器操作能力从桌面端 Computer Use 延伸到了 Chrome 扩展,主打已登录态的 Web 应用交互,与 Anthropic “Claude in Chrome” 正面竞争。发布信息与安装方式2026 年 5 月 7 日,OpenAI 在 Chrome Web Store 上架了 Codex 浏览器扩展(扩展 ID: hehggadaopoacecdllhhajmbjkdcmajg),版本号 1.1.4。适用于 Mac 和 Windows。安装路径:打开 Codex 桌面应用 → Plugins → 添加 Chrome 插件 → 完成 Chrome ...
xAI 作为独立公司仅存在不到三年,其 AI 业务整体降格为 SpaceX 内部部门,合并后实体估值 1.25 万亿美元,为 SpaceX IPO 铺路。官方宣布:xAI 解散,更名为 SpaceXAI2026 年 5 月 6 日,马斯克在 X 平台发布帖子:“xAI will be dissolved as a separate company, so it will just be SpaceXAI, the AI products from SpaceX.”同日另一条帖子中,马斯克承认组织架构存在问题:“xAI was not built right first time around,...
Anthropic签下SpaceX Colossus超算全部算力,300MW+容量当月到位,Claude Code和Opus API限额即时翻倍——AI算力竞争从地表延伸到轨道。协议核心:Colossus 1全量接入2026年5月6日,Anthropic与SpaceX(旗下SpaceXAI)正式签署算力合作协议。根据协议,Anthropic将接入SpaceX位于田纳西州孟菲斯的 Colossus 1 AI超算,获得其全部算力容量。该超算配备超过220,000张NVIDIA GPU(H100、H200及GB200加速器),提供**超过300兆瓦(MW)**的计算能力。新容量预计”本月内”上线。这...