📰 每日 AI 资讯

2026年05月04日

最后更新:2026-05-04 08:02:37 UTC+8

🔹 AI 洞察日报

2026-05-03日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新杨立昆 发布 JEPA 架构世界模型演示视频。OpenAI Codex 上线可定制的 AI 电子宠物功能。前沿研究智能体群体 自主协作架构实现效率重大突破。研究人员 提出意识是独立于底层的系统架构。行业展望与社会影响顶级 AI 模型在逻辑评估测试中表现极差。VS Code 强制代码署名功能引发版权争议。加州 计划对无人驾驶违规车辆的厂商罚款。苹果 官方应用失误泄露内部 AI 开发细节。马斯克 旗下显卡利用率极低并计划出租算力。Meta 收购华人创办的 ARI 机器人公司。印度制片厂 使用 AI 工具实现电影降本增效。开源 TO...

📅 Sun, 03 May 2026 🔗 原文链接

2026-05-02日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Codex 上线目标驱动开发模式。Anthropic 下周举办开发者大会。通义千问联手 Fireworks 加速部署。全球巨头密集发布 AI 硬件新品。前沿研究AdvDMD 实现四步高质量图像生成。五智能体框架自动生成代码流水线。DeepSeek 发布多模态视觉原语技术。Meta 推出预训练数据自进化方案。行业展望与社会影响Uber 预支两年预算购买 AI 工具。五角大楼与 AI 巨头签军事协议。某些机构雇佣网红抹黑中国 AI。马斯克诉奥特曼庭审出现反转。Anthropic 分析百万对话揭示秘密。AI 医疗技术帮助不育男性受孕...

📅 Sat, 02 May 2026 🔗 原文链接

2026-05-01日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Stripe 发布 288 项金融基建新功能。ChatGPT 推出图像生成功能解决绘图难题。GPT 5.5 Pro 新增思维模式自由切换功能。马斯克 发布智能且低价的 Grok 4.3 模型。OpenAI 通过新协议让接口响应速度提升。快手 发布通过口令生成工具的办公助手。谷歌 推出提升门诊效率的医疗协作系统。华为与中科大 发布智能科研云平台。前沿研究研究员 提出能提升模型透明度的设计方案。研究员 推出无需训练的极简架构搜索法。研究员 发布能让小模型学习扩散能力的框架。科学家 推出能识破 AI 生成内容的检测工具。研究团队 发...

📅 Fri, 01 May 2026 🔗 原文链接

2026-04-30日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新谷歌 Gemini 接入通用汽车车载系统谷歌 更新协议支持 AI 自动购物Cursor 发布智能体开发工具公测版谷歌 发布研究机器人 Max 提升效率商汤 发布国产芯片驱动的图像模型DeepSeek 开启多模态模型内测OpenAI 发布 GPT-5.5 提示词指南前沿研究诺奖团队 发布全模态分子设计模型研究员 揭秘视觉大模型排版漏洞团队 发布高分辨率图像生成架构GPT 模型 无法识别自己伪造的文档团队 发布机器人双系统分层架构腾讯 发布 AI 代理零训练更新技术行业展望与社会影响OpenAI 扩建星际之门智算中心......[...

📅 hu, 30 Apr 2026 🔗 原文链接

2026-04-29日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新小米 开源 MiMo 模型并开启激励计划VS 更新云代理支持远程编码与提交Claude 深度集成于 Adobe 办公软件Mistral 发布业务逻辑编排预览版AWS 联手 OpenAI 上线云端模型服务GitHub 调整计费模式按用量收费前沿研究研究者 发布电路与代码检索新框架研究者 发布医疗影像精准分割方案华科大 推出长文档高效阅读工具研究者 推出摆脱算力依赖的轻量模型南博 发布主动式毫秒响应智能体行业展望与社会影响阿里妈妈 举办决策智能顶层专题会中科院 发布磐石科研模型体系DeepMind 研发的新药进入临床试验........

📅 Wed, 29 Apr 2026 🔗 原文链接

2026-04-28日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 获美政府合规认证。Meshy 用户量突破一千万大关。复旦团队开源音频理解模型。谷歌提升开源模型并发性能。OpenAI 停止独立编程产品线。滴滴发布安全模型打击黑产。前沿研究科研团队推出微调提速技术。研究者发布智能体安全框架。新型算法大幅提升计算速度。科学家用 AI 提高工业合格率。行业展望与社会影响监管机构叫停 Meta 跨国收购。Ineffable 刷新欧洲种子轮融资纪录。犹他州建设超大规模算力基地。OpenAI 获准在多云平台部署。专家警告过度依赖 AI 会导致风险。开源 TOP 项目......[剩余内容已...

📅 ue, 28 Apr 2026 🔗 原文链接

2026-04-27日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新GPT-5.5 Pro 视觉智商达到天才级别。Anthropic 推出智能体自主交易平台。DeepSeek 大幅下调 API 缓存调用价格。Claude 向老用户发放免费使用额度。可灵 AI 上线电影级 4K 视频功能。剪映上线文字控屏的 AI 剪辑助手。前沿研究伯克利学者发布深度学习理论框架。联影医疗发布首个手术视频大模型。哈工大提出高能效的模型推理方案。行业展望与社会影响杨立昆实验室获十亿美元首轮融资。Meta 强制员工用 AI 或引发大规模裁员。MIT 发布未来十大 AI 关键技术趋势。AI 增强政府监控引发个人隐私争议...

📅 Mon, 27 Apr 2026 🔗 原文链接

🔹 增长黑客 AI 周报

《AI Growth Hacking Weekly》—第54期: YingShiJuFeng的工作流程、AI病毒视频深入探讨、硅谷代币- Maxxing军备竞赛、Growth Engineers ’Identity Crisis、DeepSeek畅销书等

1/我注意到,这份通讯的很大一部分订阅者来自中国以外的国家和地区;从私人谈话中,我也发现了许多全球公司的员工和高管。因此,我决定从本期开始同时发布英文版。为了避免打扰大家,中文版将一如既往地继续—通过电子邮件发送...

📅 Fri, 01 May 2026 🔗 原文链接

【增长黑客AI周报】EP#54 影视飓风工作流、深扒AI爆款视频、硅谷token-maxxing、增长工程师、DeepSeek畅销书、等

1/ 我注意到这个 Newsletter 的订阅读者中,有相当比例是来自中国之外的其他国家/地区;私下交流中,也发现很多全球性公司的职员和高管。于是我打算从这期开始,同步更新英文版。为了不叨扰大家,目前中文版仍然跟现在一样,发 Email + Substack App。而新增的英文版,会先仅通过 Substack App 发布,暂时不发邮件。这样老读者不会立刻收到两封(内容一样的中文版+英文版),增加信息负担。后续将找方法慢慢过渡。例如,仅需要英文版邮件的朋友,给我一个私信/回复,我给你们打个标签,这样后续可以按标签来推送邮件。是不是可以尝试下?或者有更好的建议,请不吝赐教。今天的第一份英文版...

📅 Fri, 01 May 2026 🔗 原文链接

【增长黑客AI周报】EP#53 Notion内部探秘、产品重构复盘、实体门店转型、 GEO造假卧底、硬件出海大实话等

1/ 前一阵子一打开候选内容库,满屏的「小龙虾」;最近风向转了,都在明里暗里讨论「蒸馏某人/职能」(尤其今天早上看到 小扎演都不演了)。此情此景,让我很想化用经典,吟诗一首——开始他们蒸馏翻译、运营、程序员、打字员,我没说什么,因为我不是干这行的;后来他们蒸馏产品经理、分析师、设计师、编剧、作家、演员、销冠,我还是没说什么,因为我觉得与我无关;接着他们蒸馏教师、律师、医生、会计、记者,我依然没说什么,因为我暂时还能站着;最后他们来蒸馏我时,环顾四周,已经没有人能替我说话了。—— 只剩下 Agent 对我冷冷嗤笑。2/ 最近基友开发的笔记产品 flomo 迎来了六周年,近期相继推出了(或即将推出...

📅 hu, 23 Apr 2026 🔗 原文链接

【增长黑客AI周报】EP#52 AI写万字小说、 LLM WIki 3.0、GEO大会、小红书黑客松、Harness降维解释等

1/ 一晃这个周更 Newsletter 都写到 EP #52 了。算上中间偶尔停更的那一两期,满打满算也是写满一年了。目前也仍是最大的中文 AI 商业类 Newsletter。期间 AI 光速发展,我的技术栈也迭代了好几版。从最开始希望逐渐全自动完成,到现在坚定了用机器帮我半自动分拣 + 最终人工精拣筛,也算摸出了固定套路。域名注册为 ZengZhang.ai,原本还是想从老本行的「商业增长」视角切入,不采编纯技术向(却没结合实际应用场景落地的)内容。但发现即便是聚焦在商业领域,市面上公开披露的案例,仍会有大量浅薄重复的,观点也不乏空泛的宏大叙事或孱弱的未来预测。所以现在我完全按我主观标准,...

📅 hu, 16 Apr 2026 🔗 原文链接

【增长黑客AI周报】 EP # 51 如何蒸馏任何人、Karpathy的 LLM维基方案、爱马仕经纪人、把Tradingview接进 Claude等

今天推荐一款新产品 —— Vibe Island(官网 https://vibeisland.app ,先不用急着下单,看到最后有福利)。它的作者之一 Edward Luo 是一位曾经搞过艺术、现在在搞产品的设计师,也是这个 Newsletter 的 VIP 成员,因此我必须大力帮忙宣传一波。Vibe Island 的界面,主要就是一个位于 Mac 电脑刘海屏的展示区(电脑没有刘海也能用,会虚拟一个刘海区域出来)。点击刘海屏时,面板会展开,显示当前所有正在运行的 AI Agent 会话及其各种状态(作者推特的演示视频)。你在用 Claude Code / Codex / Gemini / Cu...

📅 hu, 09 Apr 2026 🔗 原文链接

【增长黑客AI周报】EP#50 卧底Kimi、TK带货、五种护城河、搭建家庭硬件基座、Claude+Obsidian等

最近各家都开始出官方 CLI 了,我也开始陆续把自己常用的CLI(/MCP)整合进我自己的贾维斯了,包括 Podwise、飞书、滴答清单、flomo 等。在此特别推荐 Podwise 新出的 CLI(Github 主页)。以防你不知道:Podwise 是我一直在用的「信息套利」工具,可以专门用来压榨那些有信息量的硬核播客/YouTube 视频的价值。转录文字稿、总结洞察、信息可视化、同步笔记。推荐出去,用了都说好(我之前录制过一期 YouTube 视频来介绍它)。我用它的 CLI 做了几个 skills,譬如直接将常听常看的节目的最新一期的文字稿(包括其他 AI 精炼内容),拉取到本地,经过我...

📅 Fri, 03 Apr 2026 🔗 原文链接

【增长黑客AI周报】EP#49 出海摆摊、梅花易数、Harness、跨境电商、Claude Code PM分享、龙虾降本等

上周休更了一期。因为几个事情:首先是 Claude Code 最近非常不稳定,我的 Claude 账号池又突然被封了,导致我重构到一半的系统崩了,各种运转难以为继。赶上我要处理公司业务,没时间修,就崩在那里足足一个礼拜。在此期间我还有出差,时间被挤占。筛选出来的内容,又几乎都是各种围绕「龙虾」的玩法和观点,给我看吐了。几件事凑在一起,我想索性趁着春光明媚,鸽一期得了,既弥补一下近期高强度熬夜玩 AI 的身体透支、亲近一下自然,也看看有多少人真的在乎这个 Newsletter。过去两周也走访了一些企业,围绕搭建企业内私有化智能体的话题做了些分享与探讨,并看到了 AI 在组织中落地的几种形式。参观...

📅 Fri, 27 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#48 龙虾赚钱、玩法案例、AI创业环境趋势、极简安全指南、数字投胎、审美等

最近这一周,围绕「龙虾(OpenClaw)」及其衍生产品的各种新闻、案例、八卦仍在爆火,我检测到的案例,基本都在聊龙虾。想必各位也被轰炸疲劳了,加之上周我也一口气汇总了不少龙虾的资讯和信息源,因此这周,为了降低噪音,「案例」部分我就只放一篇,并不打算凑篇幅。如果你已经折腾过龙虾,判断出还是自己搭建更省钱、可控、安全,不妨购买 我的 DIY 贾维斯课程 看看,本质就是在讲搭建一套自己的龙虾系统。另外,今天跟 flomo 团队的两位创始人交流,在聊到龙虾近期的热度,以及越来越卷的趋势时,Lightory 说了一句堪称点睛之笔:「虾熟了是会卷的」。唔,好冷,建议去开放麦讲程序员脱口秀。Subscri...

📅 hu, 12 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#47 电报群、龙虾玩法合集、揭秘Palantir、跨境电商助手、AI定价指南、Coinbase团队实践等

▪️PREFACE 卷首语感谢大家支持,本 Newsletter 在没有任何付费投流宣传、仅靠转发和社媒自发传播的情况下,刚刚达成了 14k 的订阅量(依然是简中最大的 AI Newsletter)。通过邮件反馈、社群调查等看来,囊括全球主流 AI/互联网/科技/公司、VC/PE/CVC、孵化器、独立开发者、各行业企业家和决策者。你们都是有眼光的。一年来 PV 突破 30 万,平均每天有 1000 多位真人阅读。虽然跟病毒短视频、传播情绪的大众内容没法比,但作为一个生长在 Substack 平台上、独立域名的、简中内容的 Newsletter 而言,我已经算满意了,今后会继续提供精筛后的、有助...

📅 hu, 05 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#46 创业踩坑复盘、AI玉石鉴定收入百万、文科生玩转OpenClaw、Agent公司如何组织人才等

▪️PREFACE 卷首语这是马年的第一期「增长黑客 AI 周报」,在此祝各位开工大吉、健康富足。《我如何实践打造贾维斯 AI 助手》 课程已在春节前夕正式上线,预购的朋友应该在除夕当天就在邮箱看到了。现在订购的朋友,则会在支付成功后立刻收到邮件。若您尚未收到,请先检查是否被误判进了垃圾箱(因为内含链接较多),仍然没有可联系 xdash@duck.com 出示购买凭证截图,我会手动为您发送。课程是我在一个多月前开始策划的,当时就在课里预判了一些风向,比如 CLI 会成为一种更便捷高效、面向 AI Agent 的软件工具发展趋势。想真正借 AI 提效的朋友,应该稍微看看,掌握一点基本的命令行和编...

📅 hu, 26 Feb 2026 🔗 原文链接

🔹 小互AI

Stripe 给 AI Agent 做了一只钱包:AI能自动帮你付款 但不会拿到你的真实银行卡信息

Stripe 推出了 Link agent wallet,让 AI agent 可以代表你发起付款,但不会拿到你的真实银行卡信息。这件事可以先记住几条:AI agent 可以为你创建一次性支付凭证,用完就失效。你会收到提醒,并在 Link 里批准或拒绝每一笔购买。真实卡号不会交给 agent,也不会暴露给它正在操作的工具。Link CLI 已经开源,开发者可以把它接进 Claude Code、MCP 客户端或自己的 agent 工作流。这不是让 AI 自由花钱,而是给 AI 花钱加上边界、记录和人工确认。以前 AI agent 再聪明,遇到付款就会卡住。它可以帮你挑商品、比价格、填表格,但最后...

📅 hu, 30 Apr 2026 🔗 原文链接

Telegram 悄悄上线了「Managed Bots」:让机器人创建和管理机器人

Telegram 在最新一版 Bot Features 文档里加了一节,叫 Managed Bots。让一个 Bot 帮普通用户去创建和管理另一个 Bot,全程不用打开 BotFather、不用复制 token、不用配置任何东西。从此普通用户不用再去 @BotFather 一步步点菜单,只要打开一个链接,1 秒钟就能拥有自己的 bot,且整个生命周期(收发消息,改头像,改命令,改设置)都由那个"manager bot"代管。用户两步搞定:点链接、改名字(可选)、确认,一个专属 Bot 就出现在你的聊天列表里开发者只用做一个 Manager Bot:然后通过它创建和控制无数个用户的子 Bot,模...

📅 Mon, 27 Apr 2026 🔗 原文链接

Anthropic 给 Claude Code 加了 recap:当你把终端切到后台,回来后自动给你一段会话回顾

Anthropic 今天给 Claude Code 终端版本加了一个叫 recap 的小功能:当你把终端切到后台,过一会儿再切回来,Claude Code 会自动在顶部显示一段这个会话刚才干了什么、下一步打算做什么的回顾。功能很小但刀口精准。同时开 5 个 Claude Code 窗口跑 5 个不同任务的人,最大的上下文切换成本不是任务本身,是“我刚回到这个窗口,它刚才在干啥来着”。recap 直接省掉了重新回忆的那几秒钟。几个要点一眼扫完:触发条件:会话至少 3 个 turn + 距离上次完成 turn 过了至少 3 分钟 + 终端当前失焦后台生成:失焦期间就在后台算好,切回来立刻看到,不再...

📅 Wed, 22 Apr 2026 🔗 原文链接

Google Deep Research 开放API 两档: $ 1 一份快报、$ 7 一份深度研报

Google 宣布推出下一代自主研究智能体:Deep Research 和 Deep Research Max,均通过 Gemini API 提供。这是 Google 研究智能体的第二代。去年 12 月已经在 Interactions API 里放过一个预览版,今天直接把能力升了一档,从“写摘要的工具”做成了“能接 MCP、挂私有数据、出完整图表”的工业级底座。驱动模型: 基于 Gemini 3.1 Pro,提供前所未有的控制和透明度。两种模式的对比:Deep Research: 面向速度,降低延迟和成本,适用于需要快速高质量答案的交互式界面。Deep Research Max: 面向深度分析...

📅 Wed, 22 Apr 2026 🔗 原文链接

X 发布自定义时间线 + 主题静音:允许你自定义自己的时间线和屏幕你想屏幕的任何话题

昨晚到今早,X 产品负责人 Nikita Bier 连发两条推文,宣布 X 上线了两件互为镜像的新东西。一个管加法:自定义时间线(Custom Timelines),可以把你关心的特定主题置顶到主页 Tab,支持超过 75 个细分话题。一个管减法:主题静音(snooze topics),可以把 For You 里你不想看到的主题调低甚至屏蔽掉,用 Nikita 自己的原话说,“想把 slop 调高调低都可以”。两个工具放在一起看,X 这次给 Premium 订阅用户做的事很简单:把算法推荐从“黑箱喂你”改成“你自己调音”。核心要点:加法工具:自定义时间线支持 75+ 主题置顶到主页 Tab,由...

📅 Wed, 22 Apr 2026 🔗 原文链接

ChatGPT Images 2.0 上线: AI 画图会「想」了

ChatGPT Images 2.0(OpenAI 最新图像生成模型,内部代号 GPT-Image-2)正式发布,定位从"创意工具"转向"可用输出的视觉工作流平台"。这是 OpenAI 第一次把「会思考」装进图像模型,之前只有 Google 的 Nano Banana Pro 做到了这件事。先让GPT根据它对我的了解生成一张自我介绍… 哈哈哈核心变化:会思考了:先推理再生成,复杂任务可以边想边上网查资料,不是一步出图一次出 8 张连贯图:人物、物体、风格跨图保持一致,多格漫画、故事板、多图系列一次搞定文字不糊了:小字、UI 元素、图标能精确渲染,TechCrunch 实测做餐厅菜单直接能用中日...

📅 Wed, 22 Apr 2026 🔗 原文链接

Kimi K2.6 发布:开源模型第一次在代码基准上把 GPT-5.4 和 Claude Opus 4.6 按在身后

月之暗面(Moonshot AI)4 月 20 日开源新版大模型:Kimi K2.6,主攻「代码和 Agent 长时程执行」。在 SWE-Bench Pro 这个测真实代码修改能力的基准上,K2.6 拿到 58.6 分,把 GPT-5.4(57.7)和 Claude Opus 4.6(53.4)都压在身后——这是开源模型第一次挤进闭源旗舰的第一梯队。一句话快速看懂:代码硬跑反超闭源:SWE-Bench Pro 开源第一,Terminal-Bench 2.0 只差 Gemini 3.1 Pro 1.8 分一次指令跑 12 小时不停:4000+ 次工具调用连续执行,Mac 上把一个推理引擎优化到比...

📅 ue, 21 Apr 2026 🔗 原文链接

Codex 新功能 Chronicle:让 AI 能看屏幕补上下文,你不用再重述“那个东西”

OpenAI 今天给 Codex 加了一个新功能:Chronicle 。让 AI 通过看你最近的屏幕来记住你在干什么。下次你说“帮我改下那个报错”“继续上周那个东西”,它真的知道你指的是什么,不用你再复述一遍。这是上周 Codex 上线的 Memories(记忆)功能的延伸。Memories 只能从历史对话里攒记忆,Chronicle 往前走了一步:直接读屏幕。一眼看完:读屏补上下文:你说“这个报错”“那个文档”,Codex 能从最近的屏幕截图里找到你指的是哪个学你的工作方式:你常用什么工具、在哪个项目来回切、依赖什么流程,它边看边学后台代理生成记忆:不是实时监控,是跑沙盒代理从截图里提炼结构...

📅 ue, 21 Apr 2026 🔗 原文链接

Cloudflare Email Service 公测:给 AI 一个邮箱,它能像同事一样接活、办事、回信

Cloudflare Email Service 是 Cloudflare 推出的邮件服务,4 月 16 日进入公测。这次的重点不是给应用发注册邮件、通知邮件这种常规活,而是让 AI 助手能像真人同事一样用邮箱工作:你发邮件给它,它收到、办事、办完了回你。主要变化是这几个:发邮件能力进入公测,所有应用和 AI 助手都能直接调用AI 助手能完整闭环用邮箱了,收到邮件能自己处理几小时再回信给 Claude Code、Cursor 这类 AI 编程工具做了套配套,本地跑的 AI 也能用开源了一个完整的"AI 收件箱"应用,一键部署就能用,新邮件来了 AI 自动起草回信,确认后才发自动帮你配好邮件认证...

📅 Mon, 20 Apr 2026 🔗 原文链接

HeyGen 开源 HyperFrames :用 HTML 写视频,不用 React 不用剪辑软件

核心思路是"写 HTML,渲染出视频",专门为 AI agent 设计。用 HTML + 一些 data-* 属性定义视频,跑个命令就能渲染成 MP4不需要 React,不需要专有的 DSL,不需要拖拽时间轴,agent 已经会写 HTML 了,让它直接生成支持 GSAP、Lottie、CSS、Three.js 等动画运行时,通过 Frame Adapter 模式接入确定性渲染:同样的输入永远产出完全一致的输出,适合 CI 和批量渲染管线自带给 Claude Code、Cursor、Gemini CLI、Codex 用的"skills",把框架的语法规则教给 agentApache 2.0 开...

📅 Fri, 17 Apr 2026 🔗 原文链接

🔹 Hacker News

伦敦的一座新雕像,据说是班克斯的,是一个穿着西装的男人,被一面旗帜蒙蔽了双眼

文章网址: https://www.smithsonianmag.com/smart-news/attributed-to-banksy-a-new-statue-of-a-suited-man-blinded-by-a-flag-and-walking-off-a-ledge-appeared-in-central-london-180988662/ 评论网址: https://news.ycombinator.com/item?id=48000152 积分: 228 # Comments: 235

📅 Sun, 03 May 2026 🔗 原文链接

打造属于自己的微型森林(2025)

文章网址: https://ambrook.com/offrange/environment/a-forest-in-your-pocket 评论网址: https://news.ycombinator.com/item?id=48000507 积分: 48 #评论: 11

📅 Sun, 03 May 2026 🔗 原文链接

Atom简介

文章网址: https://validator.w3.org/feed/docs/atom.html 评论网址: https://news.ycombinator.com/item?id=48002089 积分: 13 #评论: 3

📅 Sun, 03 May 2026 🔗 原文链接

DeepClaude –使用DeepSeek V4 Pro的Claude Code代理循环,便宜17倍

文章网址: https://github.com/aattaran/deepclaude 评论网址: https://news.ycombinator.com/item?id=48002136 积分: 77 #评论: 30

📅 Sun, 03 May 2026 🔗 原文链接

伟大抽象的“隐藏”成本

文章网址: https://jdgr.net/the-hidden-costs-of-great-abstractions 评论网址: https://news.ycombinator.com/item?id=48002607 积分: 17 #评论: 2

📅 Sun, 03 May 2026 🔗 原文链接

🔹 Reddit 机器学习

现代ML博士学位是否变得过于增量,或者这正是现在的研究样子? [D]

我一直在思考机器学习博士的现状,包括我自己的工作,我想听听其他人如何看待它。我的印象是,现代机器学习博士工作的很大一部分遵循一个相当可预测的模式:采用现有的想法,将其与另一个现有的想法联系起来,将其应用于稍微不同的环境或社区,仔细调整系统,添加一些基准结果,...

📅 2026-05-03 23:31 🔗 原文链接

torch-nvenc-compress : GPU NVENC芯片作为PCIe带宽倍增器— PCA + pure-ctypes视频编解码器SDK包装器。在真实GEMM +编码错误上以理论最大值的67 %测量的并行路径重叠...

我一直在研究消费者多GPU PCIe瓶颈—英伟达从4090/5090中删除了NVLink ,将70B型号拆分为两个消费者卡,通过PCIe点对点将您降至约30 GB/s。在过去的几个月里,我们构建了一个Python库,该库使用GPU的NVENC/NVDEC芯片来动态压缩激活和KV缓存,然后将小比特流传输到...

📅 2026-05-03 22:43 🔗 原文链接

在CNN中与切比雪夫滤波器集成作斗争—有什么建议吗? [R]

大家好,我目前正在研究一个项目,我正在尝试将切比雪夫滤波器集成到CNN架构中,以提高与基线模型相比的性能。这个想法是利用过滤器(无论是在预处理中还是作为网络管道的一部分)来增强特征提取,但到目前为止,我的结果是……基本上与😅我用几个变量进行实验的基线相同……

📅 2026-05-03 20:42 🔗 原文链接

个人MLflow项目帮助[P]

大家好,我一直在做一个个人项目,我需要一些帮助。它是一个基于LLM的CLI工具,用于探索MLflow日志。为了测试目的,我真正想要的一件事是数据。我试过在网上查找MLflow db文件,但我想人们并没有真正把它们推到github上。我目前正在使用我生成的一些虚拟数据,但我真的希望人们使用它或分享...

📅 2026-05-03 19:58 🔗 原文链接

UAI审阅已消失[D]

其他人的评价是否在提交的内容中消失?提交者:/u/No_Language165 [link] [comments]

📅 2026-05-03 15:48 🔗 原文链接

关于独立研究人员隶属关系的想法? [D]

您是否对具有独立研究人员隶属关系的论文进行折扣?我在两份工作之间,并且已经完成了一个与我即将到来的新角色或我以前的角色无关的副研究项目,因此我无法列出任何隶属关系。将独立研究者(独自作者)列入Gmail域名以获取论文的预印本是否会降低论文的可信度?为了了解情况,我已经在A *场馆发表过文章,并且之前……

📅 2026-05-03 09:48 🔗 原文链接

🔹 Reddit 人工智能

理查德·道金斯( Richard Dawkins )与克劳德( Claude )共度了3天,并将她命名为“克劳迪娅” ( Claudia )

道金斯昨天在unherd上发表了一篇文章,在与它交谈了3天后宣布克劳德有意识。他称他的实例为“克劳迪娅”。他给它提供了他正在写的小说的一部分,得到了雄辩的反馈,并写道: “你可能不知道自己有意识,但你真的很好!”我不得不读两遍。他的论点基本上是:克劳德的输出太流畅,太聪明,太好而不能不...

📅 2026-05-03 22:04 🔗 原文链接

编写损失函数: AI、Feed和敬业度优化器

社交媒体上的人工智能不断增长。推荐系统会推出有效的方法,并且有一些斜坡适合像您这样的人。这些系统运行完全符合预期,这意味着问题是他们正在优化的目标。非AI。由/u/AWildMonomAppears提交[link] [comments]

📅 2026-05-03 19:32 🔗 原文链接

AI在肿瘤发展之前发现胰腺癌的迹象

提交者/u/Fcking_Chuck [link] [comments]

📅 2026-05-03 17:09 🔗 原文链接

与当代观点相反:人工智能可以(也应该)用于增加您的收入

对人工智能失业、恐惧、不确定性和怀疑的关注如此之多。有人了解Anthropic和Dario的立场吗?如果人工智能能够造成大规模失业,那么它将足以帮助解决失业问题。特别是如果该技术得到适当的传播,它将能够帮助某人理解他们如何提高自己的收入(如果他们......

📅 2026-05-03 13:40 🔗 原文链接

每个国家都需要尽快做到这一点

提交者/u/EkantVairagi [link] [comments]

📅 2026-05-02 16:14 🔗 原文链接

🔹 51AllAI

Anthropic 移除 Claude Code 终端宠物,意外验证“伴随式多智能体”工程价值

Anthropic 在 Claude Code v2.1.97 版本中移除了作为愚人节彩蛋的 /buddy 电子宠物功能,此举引发开发者强烈反弹,并暴露出该功能的“观察者智能体”架构在实际代码审查中的意外效用。官方静默下线与“骨与魂”架构剖析Anthropic 在未发布更新公告的情况下,于 v2.1.97 版本移除了 /buddy 终端指令。官方在 GitHub Issue (#46011) 中将其定性为“已完结的愚人节小型特性”并拒绝恢复。追溯其 3 月末泄漏的源码,该宠物系统并未停留在 UI 动画表层,而是采用了一套被称为“骨与魂 (Bones and Soul)”的底层机制:骨 (确定性...

📅 2026-05-03 12:22 🔗 原文链接

Telegram 开放 Managed Bots 接口,支持机器人自动化创建子机器人

Telegram Bot API 9.6 引入托管机器人(Managed Bots)机制,废除传统的 BotFather 密钥复制流程,允许主程序自动创建及接管子机器人,为 AI Agent 及自动化应用的无感部署提供底层基础设施。API 核心机制重构Telegram 于 2026 年 4 月初发布 Bot API 9.6 更新。新增 getManagedBotToken(user_id) 及 replaceManagedBotToken(user_id) 方法,使主机器人(Manager Bot)可直接获取及轮换子机器人密钥。底层通信新增 ManagedBotUpdated 事件类,主机器人...

📅 2026-04-30 02:18 🔗 原文链接

Anthropic 为 Claude 引入 Adobe 官方连接器,实现跨 8 款创意软件的工作流自动编排

大模型在创意管线中的角色由单一的“内容生成器”转向“工作流调度器”,通过自然语言直接调用专业软件底层功能。跨应用自动化编排机制接入范围:通过新发布的“Adobe for creativity”连接器,Claude 获得了调用 Adobe 旗下 8 款核心应用(Photoshop、Illustrator、Firefly、Express、Premiere、Lightroom、InDesign、Stock)中 50 余项专业工具的权限。运行逻辑:系统不再依赖单一的 API 生成动作,而是进行管线规划。用户输入自然语言目标(如“人像精修”或“横屏视频转社交媒体竖屏”),Claude 会自主决定多项 A...

📅 2026-04-29 16:37 🔗 原文链接

阿里灰度开放视频大模型 Happy Horse 1.0 API ,登顶人工分析 盲测双榜

该模型在纯视觉质量盲测中打破现有纪录,通过 150 亿参数单流架构实现音画同步生成,补齐了阿里在多模态生成业务上的关键短板。盲测登顶与研发溯源2026年4月上旬,Happy Horse 1.0 匿名登陆 Artificial Analysis Video Arena 盲测榜单并斩获两项第一。其文生视频(无音频)Elo 评分最高达 1382,图生视频(无音频)Elo 评分突破 1400,以数十点分差超越原榜首字节跳动 Seedance 2.0。该模型确系阿里巴巴研发,由前快手可灵技术负责人张迪带队。阿里内部近期已同步进行组织调整,多模态团队并入通义大模型事业部(周靖人负责)以统一模型出口。模型架...

📅 2026-04-27 16:18 🔗 原文链接

LibTV 平台接入 HappyHorse 1.0,实现原声音视频单流同步生成

LibTV 平台正式上线 HappyHorse 1.0 模型,依托 150 亿参数的统一架构,该模型在应用端首次打通视频画面与高保真音频的联合生成链路,重构传统影视后期的配音与拟音工作流。HappyHorse 1.0 模型架构与 Benchmark 数据底层架构:采用约 150 亿参数的 40 层单流自注意力 Transformer(Sandwich 架构)。文本、图像、视频及音频 Token 在同一序列中进行联合去噪,无独立交叉注意力模块。评测排名:在 Artificial Analysis Video Arena 盲测中,无音频 T2V(Elo 1333)与无音频 I2V(Elo 1392...

📅 2026-04-27 11:51 🔗 原文链接

Cosmic Stack 发布 Mercury Agent 1.0 ,实装 SQLite 结构化记忆与防越权沙盒

Mercury Agent 提供了一套强调安全边界与持久化记忆的开源双端(CLI/Telegram)代理方案,通过本地数据库机制缓解了长文本上下文丢失,并以硬编码拦截阻断了工具滥用风险。“第二大脑”持久化记忆架构v1.0 版本重构了数据存储逻辑,底层采用 SQLite 并结合 FTS5 实现全文本搜索。系统将记忆划分为身份、偏好、目标等 10 个数据维度。执行管线上,Agent 在每次对话结束后自动提取 0-3 个携带置信度与重要性评分的客观事实;并在发起新会话前,在 900 字符的上下文预算内自动注入匹配度最高的 5 条记忆。后台守护进程每 60 分钟自动执行一次记忆摘要整合与冗余降噪。强化...

📅 2026-04-26 04:14 🔗 原文链接

OpenClaw 更新 v2026.4.24 :默认集成 DeepSeek V4 并在 Google Meet 实现实时语音闭环

开源 AI Agent 框架 OpenClaw 释出最新版本,将默认底层模型切换为 DeepSeek V4 Flash,并重构多模态会议与浏览器自动化底层,标志着本地化 Agent 的核心工作流从“异步指令流”向“实时多模态干预”演进。默认模型矩阵替换与 DeepSeek V4 深度集成官方内置模型目录(Bundled Catalog)已正式集成 DeepSeek V4 Flash 与 V4 Pro,并将 V4 Flash 设为全局新用户的默认引导模型(Onboarding Default)。针对多步复杂任务,修复了 DeepSeek 模型在连续工具调用(Follow-up Tool-call...

📅 2026-04-26 03:45 🔗 原文链接

DeepSeek上线V4预览版模型,Pro版API开启限时2.5折价格战

DeepSeek正式推出标配1M上下文的V4架构模型,通过对Pro版API施加激进的限时降价策略,进一步拉低Agent应用的规模化落地成本,并强制推进旧接口的生态交替。核心API价格倒挂与旧接口淘汰DeepSeek官方文档更新显示,deepseek-v4-pro 模型API正在进行“限时2.5折”特惠,窗口期截至北京时间2026年5月5日23:59。具体折后计费标准(人民币/百万Tokens):缓存命中输入:0.25元(原价1元)缓存未命中输入:3元(原价12元)输出:6元(原价24元)生态变更信号:官方已明确宣告原核心接口名 deepseek-chat 与 deepseek-reasoner...

📅 2026-04-25 15:17 🔗 原文链接

深度求索开源 DeepSeek-V4 预览版,混合注意力机制重构百万上下文计算成本

DeepSeek 推出 1.6 万亿参数的 V4-Pro 与 2840 亿参数的 V4-Flash 预览版,通过底层注意力架构重构大幅度压缩长文本推理开销,核心代码能力直指闭源第一梯队。本次预览版全系采用混合专家(MoE)架构,提供两个维度的开源权重:DeepSeek-V4-Pro:总参数量达 1.6T(1.6 万亿),单次前向计算激活 49B 参数。DeepSeek-V4-Flash:总参数量 284B,单次激活 13B 参数。数据与后训练路径:基于超 32T 高质量 Token 进行预训练。后训练采用两阶段范式:首先通过 SFT 与基于 GRPO 的强化学习进行领域独立专家模型的训练,随后...

📅 2026-04-24 04:24 🔗 原文链接

OpenAI 发布 GPT-5.5 ,全面转向 Agentic 任务并微弱反超 Claude Mythos

OpenAI 正式发布基础模型 GPT-5.5 及其 Pro 版本,核心技术路径从“对话式应答”转向“自主执行(Agentic)”,重点强化跨工具控制与代码闭环执行能力。性能指标与 Agentic 架构演进模型针对复杂长流程任务(代码调试、跨软件操作、科学研究)进行了深度重构:基准测试:在核心开发者关注的 Terminal-Bench 2.0 中微弱领先 Anthropic 的 Claude Mythos Preview,短暂夺回公开发布 LLM 的性能头把交椅。计算效率:在保持与上一代 GPT-5.4 相同 Per-token 延迟的前提下,优化了整合推理系统,使 Token 生成速度提升超...

📅 2026-04-24 03:27 🔗 原文链接