📰 每日 AI 资讯

2026年04月23日

最后更新:2026-04-23 08:03:38 UTC+8

🔹 AI 洞察日报

2026-04-22日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新GPT-Image-2 登顶文生图竞技场并刷新纪录。谷歌 发布 Gemini 深度研究智能体更新。Meta 升级脸书群组搜索架构提高效率。谷歌 举办 AI 峰会并发布多项新产品。特斯拉 准备量产无方向盘无人驾驶汽车。前沿研究研究人员 发布内窥镜 AI 超分可靠性框架。研究者 利用新技术增强视频生成一致性。斯坦福大学 推出多模态实时视觉溯源框架。研究者 发布类脑视觉解码框架提高准确度。行业展望与社会影响SpaceX 计划巨资收购编程编辑器 Cursor。ControlAI 募资五千万美元以降低灭绝风险。美国国家安全局 获权访问相...

📅 Wed, 22 Apr 2026 🔗 原文链接

2026-04-21日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布 Codex 屏幕记忆功能。Google 开放 AI Studio 高级模型权限。前沿研究人大 发布长程记忆科研系统。北大团队 突破 3D 空间推理瓶颈。VeriMoA 架构 提升芯片设计效率。科学家 发现 FP16 推理存在风险。行业展望与社会影响库克 转任主席且硬件主管接棒。OpenAI 开始售卖对话相关广告。人形机器人天工 跑赢北京半马。苏度科技 发布具身智能大模型。Anthropic 专家 向白宫提供防御技术。特斯拉 被指隐瞒自动驾驶事故。马斯克 宣布 Grok 5 冲击通用智能。开源TOP项目......

📅 ue, 21 Apr 2026 🔗 原文链接

2026-04-20日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Claude 4.7 升级安全架构并增强防御。X平台上线Grok长文自动总结功能。X平台开放CLI接口支持代理调用。前沿研究伯克利团队揭露AI评测作弊黑产。华科大发布MoDA架构实现深度检索。新型交互系统通过动态调节稳定场域。自动形式化技术引发数学逻辑争议。高德发布ABot体系实现全自主行动。北大发布研报探讨世界模型因果逻辑。行业展望与社会影响OpenAI 联手 Cerebras 提升芯片算力。Meta 从初创公司精准挖角顶级人才。高带宽内存短缺引发供应链风险。杨立昆发文否认人工智能导致失业。加拿大政府巨额资助引发公平性讨论。...

📅 Mon, 20 Apr 2026 🔗 原文链接

2026-04-19日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Bolt 推出 MCP 连接器实现跨项目代码复用。Luma AI 发布制作方案降低电影创作成本。马斯克 发布 Grok 语音接口且价格非常便宜。马斯克 上线 xChat 支持转账等多种功能。前沿研究Kimi 推出新技术提升长文档模型推理速度。研究者 开源点云框架并支持自动编写论文。行业展望与社会影响OpenAI 投资芯片公司助力其上市重塑格局。苏州 企业集群通过光模块技术支撑全球算力。Cursor 洽谈新融资且估值直冲五百亿美元。Meta 打造扎克伯格 AI 分身用于管理员工。彭博社 称专家对 AI 影响就业的预测有误。开源T...

📅 Sun, 19 Apr 2026 🔗 原文链接

2026-04-18日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Anthropic 发布 Claude Design 语音生成设计草图。阿里发布快乐生蚝模型支持用户自主探索数字场景。OpenAI 发布 GPT-Rosalind 帮助加速新药研发。OpenAI 推出 GPT-Image-2 提升了图像文字排版能力。阿里开源 Qwen3.6 编程模型且性能媲美超大模型。前沿研究AI 陪审团在医疗诊断方面的表现已经超过了专家。RUMS 记忆技术问世并大幅降低了大模型的算力消耗。字节跳动首创 DisCoGC 架构提升了数据回收效率。Dr. RTL 框架可自主优化电路设计并提升芯片性能。行业展望与社...

📅 Sat, 18 Apr 2026 🔗 原文链接

2026-04-17日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布 Codex 桌面版,支持直接操作电脑。Claude 4.7 发布,提升了推理精度与图像识别能力。Meta 发布智能体平台,可自动修复漏洞并降低能耗。Google 推出苹果端 Gemini,支持读取本地文件。阿里发布 Meoo 工具,支持通过对话快速生成网页。OpenAI 发布新模型,用于增强网络安全防护能力。前沿研究GraphScout 框架让模型具备自主图推理能力。UniBlendNet 技术可修复复杂光照并还原图像细节。DelAnyFlow 模型可极速识别全国农地边界。PMG 架构支持在边缘设备上实现极...

📅 Fri, 17 Apr 2026 🔗 原文链接

2026-04-16日刊

前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布原生沙箱智能体开发套件。VS2022 内置云端工具并支持 MCP 协议。Midjourney V8.1 提升渲染速度并支持 2K。谷歌发布低延迟且带情感的语音模型。Adobe 助手支持自动执行创意设计任务。Claude 平台强制要求用户进行实名核验。前育研究OVIE 算法实现单张图片快速三维重建。视觉模型通过新框架提升空间推理能力。研究人员发布工业级工程智能体评估基准。HORIZON 基准揭示智能体长程任务瓶颈。PDF-GS 方案能自动过滤三维建模中的伪影。UniMark 系统为 AR 图像提供版权保护水印。...

📅 hu, 16 Apr 2026 🔗 原文链接

🔹 增长黑客 AI 周报

【增长黑客AI周报】EP#52 AI写万字小说、 LLM WIki 3.0、GEO大会、小红书黑客松、Harness降维解释等

1/ 一晃这个周更 Newsletter 都写到 EP #52 了。算上中间偶尔停更的那一两期,满打满算也是写满一年了。目前也仍是最大的中文 AI 商业类 Newsletter。期间 AI 光速发展,我的技术栈也迭代了好几版。从最开始希望逐渐全自动完成,到现在坚定了用机器帮我半自动分拣 + 最终人工精拣筛,也算摸出了固定套路。域名注册为 ZengZhang.ai,原本还是想从老本行的「商业增长」视角切入,不采编纯技术向(却没结合实际应用场景落地的)内容。但发现即便是聚焦在商业领域,市面上公开披露的案例,仍会有大量浅薄重复的,观点也不乏空泛的宏大叙事或孱弱的未来预测。所以现在我完全按我主观标准,...

📅 hu, 16 Apr 2026 🔗 原文链接

【增长黑客AI周报】 EP # 51 如何蒸馏任何人、Karpathy的 LLM维基方案、爱马仕经纪人、把Tradingview接进 Claude等

今天推荐一款新产品 —— Vibe Island(官网 https://vibeisland.app ,先不用急着下单,看到最后有福利)。它的作者之一 Edward Luo 是一位曾经搞过艺术、现在在搞产品的设计师,也是这个 Newsletter 的 VIP 成员,因此我必须大力帮忙宣传一波。Vibe Island 的界面,主要就是一个位于 Mac 电脑刘海屏的展示区(电脑没有刘海也能用,会虚拟一个刘海区域出来)。点击刘海屏时,面板会展开,显示当前所有正在运行的 AI Agent 会话及其各种状态(作者推特的演示视频)。你在用 Claude Code / Codex / Gemini / Cu...

📅 hu, 09 Apr 2026 🔗 原文链接

【增长黑客AI周报】EP#50 卧底Kimi、TK带货、五种护城河、搭建家庭硬件基座、Claude+Obsidian等

最近各家都开始出官方 CLI 了,我也开始陆续把自己常用的CLI(/MCP)整合进我自己的贾维斯了,包括 Podwise、飞书、滴答清单、flomo 等。在此特别推荐 Podwise 新出的 CLI(Github 主页)。以防你不知道:Podwise 是我一直在用的「信息套利」工具,可以专门用来压榨那些有信息量的硬核播客/YouTube 视频的价值。转录文字稿、总结洞察、信息可视化、同步笔记。推荐出去,用了都说好(我之前录制过一期 YouTube 视频来介绍它)。我用它的 CLI 做了几个 skills,譬如直接将常听常看的节目的最新一期的文字稿(包括其他 AI 精炼内容),拉取到本地,经过我...

📅 Fri, 03 Apr 2026 🔗 原文链接

【增长黑客AI周报】EP#49 出海摆摊、梅花易数、Harness、跨境电商、Claude Code PM分享、龙虾降本等

上周休更了一期。因为几个事情:首先是 Claude Code 最近非常不稳定,我的 Claude 账号池又突然被封了,导致我重构到一半的系统崩了,各种运转难以为继。赶上我要处理公司业务,没时间修,就崩在那里足足一个礼拜。在此期间我还有出差,时间被挤占。筛选出来的内容,又几乎都是各种围绕「龙虾」的玩法和观点,给我看吐了。几件事凑在一起,我想索性趁着春光明媚,鸽一期得了,既弥补一下近期高强度熬夜玩 AI 的身体透支、亲近一下自然,也看看有多少人真的在乎这个 Newsletter。过去两周也走访了一些企业,围绕搭建企业内私有化智能体的话题做了些分享与探讨,并看到了 AI 在组织中落地的几种形式。参观...

📅 Fri, 27 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#48 龙虾赚钱、玩法案例、AI创业环境趋势、极简安全指南、数字投胎、审美等

最近这一周,围绕「龙虾(OpenClaw)」及其衍生产品的各种新闻、案例、八卦仍在爆火,我检测到的案例,基本都在聊龙虾。想必各位也被轰炸疲劳了,加之上周我也一口气汇总了不少龙虾的资讯和信息源,因此这周,为了降低噪音,「案例」部分我就只放一篇,并不打算凑篇幅。如果你已经折腾过龙虾,判断出还是自己搭建更省钱、可控、安全,不妨购买 我的 DIY 贾维斯课程 看看,本质就是在讲搭建一套自己的龙虾系统。另外,今天跟 flomo 团队的两位创始人交流,在聊到龙虾近期的热度,以及越来越卷的趋势时,Lightory 说了一句堪称点睛之笔:「虾熟了是会卷的」。唔,好冷,建议去开放麦讲程序员脱口秀。Subscri...

📅 hu, 12 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#47 电报群、龙虾玩法合集、揭秘Palantir、跨境电商助手、AI定价指南、Coinbase团队实践等

▪️PREFACE 卷首语感谢大家支持,本 Newsletter 在没有任何付费投流宣传、仅靠转发和社媒自发传播的情况下,刚刚达成了 14k 的订阅量(依然是简中最大的 AI Newsletter)。通过邮件反馈、社群调查等看来,囊括全球主流 AI/互联网/科技/公司、VC/PE/CVC、孵化器、独立开发者、各行业企业家和决策者。你们都是有眼光的。一年来 PV 突破 30 万,平均每天有 1000 多位真人阅读。虽然跟病毒短视频、传播情绪的大众内容没法比,但作为一个生长在 Substack 平台上、独立域名的、简中内容的 Newsletter 而言,我已经算满意了,今后会继续提供精筛后的、有助...

📅 hu, 05 Mar 2026 🔗 原文链接

【增长黑客AI周报】EP#46 创业踩坑复盘、AI玉石鉴定收入百万、文科生玩转OpenClaw、Agent公司如何组织人才等

▪️PREFACE 卷首语这是马年的第一期「增长黑客 AI 周报」,在此祝各位开工大吉、健康富足。《我如何实践打造贾维斯 AI 助手》 课程已在春节前夕正式上线,预购的朋友应该在除夕当天就在邮箱看到了。现在订购的朋友,则会在支付成功后立刻收到邮件。若您尚未收到,请先检查是否被误判进了垃圾箱(因为内含链接较多),仍然没有可联系 xdash@duck.com 出示购买凭证截图,我会手动为您发送。课程是我在一个多月前开始策划的,当时就在课里预判了一些风向,比如 CLI 会成为一种更便捷高效、面向 AI Agent 的软件工具发展趋势。想真正借 AI 提效的朋友,应该稍微看看,掌握一点基本的命令行和编...

📅 hu, 26 Feb 2026 🔗 原文链接

【增长黑客AI周报】《我如何实践打造个人 AI 贾维斯助手》课程正式上线

如前面预告的,我最近又拿 AI 做了一些好玩的私人玩具,并且愿意把经验深度分享出来。没错,这就是热气腾腾新鲜出炉的《我如何实践打造个人 AI 贾维斯助手》课程。我如约地在马年春节前完成了。赶在了除夕端上来,就是这么卷。春节我得带孩子,你们也甭想闲着了,学起来,卷起来…打造学习型假期……感兴趣的话,可点击下方订购课程现货(会立即自动发货到您的邮箱):https://zerodaybook.mikecrm.com/kctVTes(此前预购过早鸟票的 1000+ 位同学们,请检查你们的邮箱,已经发过去了。如果没看到,可先检查 spam 看看是否误判,如果还没找到可联络我 xdash@duck.com...

📅 Mon, 16 Feb 2026 🔗 原文链接

【增长黑客AI周报】EP#45 OpenClaw创业机会、爆红插件、AI成人用品生意、马斯克最新访谈、漫剧内幕、Skill经济等

▪️PREFACE 卷首语1/ 下周就是春节假期,会停更一期 Newsletter 正刊,专心陪伴家人。这里先预祝各位读者新的一年马到成功,事事顺意~2/ 《我如何实践打造私人 AI 贾维斯助手》 课程正在制作收尾中,会如期在春节前上线,欢迎预购。想在今年的长假里学点东西,不妨看看我亲身实战数月总结出来的落地经验,既适合小白上手,也能启发大牛。现在还是预购阶段,可享受早鸟价。↑ 几页制作中的 PPT 预览,最终交付的是视频课程,提供中外网盘+油管加密链接(已经购买的朋友届时会通过购买时留下的 Email 收到课程链接,我也会在各大社媒、公众号等告知)。Subscribe nowOK,以下是本期...

📅 hu, 12 Feb 2026 🔗 原文链接

【增长黑客AI周报】EP#44 网红生意经、Every创业破局、2026赚钱逻辑、Clawdbot爆火复盘、AI村庄实验等

▪️PREFACE 卷首语Clawdbot (后改名 Moltbot、OpenClawd)这两周被全网营销号鼓吹爆火了,各种花式翻车的后续也不断(今天这期的相关文章里就有复盘)。讲两个印象深刻的。首先是,前两天 B站 上有个哥们(视频 ID:BV1zs6EBJEc7),在完全没做测试的情况下,就拿 Clawdbot 来做投资。结果 Clawdbot 在 Polymarket 的下注页面,遇到了卡点,就脑残地重试了将近 40 次,把原本的 500 刀预算,直接滚到花超 10 万人民币。再比如,Moltbook(Clawdbot 玩家们设置的一个纯机器人互相聊天的论坛,可以理解成 Clawdbot...

📅 hu, 05 Feb 2026 🔗 原文链接

🔹 小互AI

Anthropic 给 Claude Code 加了 recap:当你把终端切到后台,回来后自动给你一段会话回顾

Anthropic 今天给 Claude Code 终端版本加了一个叫 recap 的小功能:当你把终端切到后台,过一会儿再切回来,Claude Code 会自动在顶部显示一段这个会话刚才干了什么、下一步打算做什么的回顾。功能很小但刀口精准。同时开 5 个 Claude Code 窗口跑 5 个不同任务的人,最大的上下文切换成本不是任务本身,是“我刚回到这个窗口,它刚才在干啥来着”。recap 直接省掉了重新回忆的那几秒钟。几个要点一眼扫完:触发条件:会话至少 3 个 turn + 距离上次完成 turn 过了至少 3 分钟 + 终端当前失焦后台生成:失焦期间就在后台算好,切回来立刻看到,不再...

📅 Wed, 22 Apr 2026 🔗 原文链接

Google Deep Research 开放API 两档: $ 1 一份快报、$ 7 一份深度研报

Google 宣布推出下一代自主研究智能体:Deep Research 和 Deep Research Max,均通过 Gemini API 提供。这是 Google 研究智能体的第二代。去年 12 月已经在 Interactions API 里放过一个预览版,今天直接把能力升了一档,从“写摘要的工具”做成了“能接 MCP、挂私有数据、出完整图表”的工业级底座。驱动模型: 基于 Gemini 3.1 Pro,提供前所未有的控制和透明度。两种模式的对比:Deep Research: 面向速度,降低延迟和成本,适用于需要快速高质量答案的交互式界面。Deep Research Max: 面向深度分析...

📅 Wed, 22 Apr 2026 🔗 原文链接

X 发布自定义时间线 + 主题静音:允许你自定义自己的时间线和屏幕你想屏幕的任何话题

昨晚到今早,X 产品负责人 Nikita Bier 连发两条推文,宣布 X 上线了两件互为镜像的新东西。一个管加法:自定义时间线(Custom Timelines),可以把你关心的特定主题置顶到主页 Tab,支持超过 75 个细分话题。一个管减法:主题静音(snooze topics),可以把 For You 里你不想看到的主题调低甚至屏蔽掉,用 Nikita 自己的原话说,“想把 slop 调高调低都可以”。两个工具放在一起看,X 这次给 Premium 订阅用户做的事很简单:把算法推荐从“黑箱喂你”改成“你自己调音”。核心要点:加法工具:自定义时间线支持 75+ 主题置顶到主页 Tab,由...

📅 Wed, 22 Apr 2026 🔗 原文链接

ChatGPT Images 2.0 上线: AI 画图会「想」了

ChatGPT Images 2.0(OpenAI 最新图像生成模型,内部代号 GPT-Image-2)正式发布,定位从"创意工具"转向"可用输出的视觉工作流平台"。这是 OpenAI 第一次把「会思考」装进图像模型,之前只有 Google 的 Nano Banana Pro 做到了这件事。先让GPT根据它对我的了解生成一张自我介绍… 哈哈哈核心变化:会思考了:先推理再生成,复杂任务可以边想边上网查资料,不是一步出图一次出 8 张连贯图:人物、物体、风格跨图保持一致,多格漫画、故事板、多图系列一次搞定文字不糊了:小字、UI 元素、图标能精确渲染,TechCrunch 实测做餐厅菜单直接能用中日...

📅 Wed, 22 Apr 2026 🔗 原文链接

Kimi K2.6 发布:开源模型第一次在代码基准上把 GPT-5.4 和 Claude Opus 4.6 按在身后

月之暗面(Moonshot AI)4 月 20 日开源新版大模型:Kimi K2.6,主攻「代码和 Agent 长时程执行」。在 SWE-Bench Pro 这个测真实代码修改能力的基准上,K2.6 拿到 58.6 分,把 GPT-5.4(57.7)和 Claude Opus 4.6(53.4)都压在身后——这是开源模型第一次挤进闭源旗舰的第一梯队。一句话快速看懂:代码硬跑反超闭源:SWE-Bench Pro 开源第一,Terminal-Bench 2.0 只差 Gemini 3.1 Pro 1.8 分一次指令跑 12 小时不停:4000+ 次工具调用连续执行,Mac 上把一个推理引擎优化到比...

📅 ue, 21 Apr 2026 🔗 原文链接

Codex 新功能 Chronicle:让 AI 能看屏幕补上下文,你不用再重述“那个东西”

OpenAI 今天给 Codex 加了一个新功能:Chronicle 。让 AI 通过看你最近的屏幕来记住你在干什么。下次你说“帮我改下那个报错”“继续上周那个东西”,它真的知道你指的是什么,不用你再复述一遍。这是上周 Codex 上线的 Memories(记忆)功能的延伸。Memories 只能从历史对话里攒记忆,Chronicle 往前走了一步:直接读屏幕。一眼看完:读屏补上下文:你说“这个报错”“那个文档”,Codex 能从最近的屏幕截图里找到你指的是哪个学你的工作方式:你常用什么工具、在哪个项目来回切、依赖什么流程,它边看边学后台代理生成记忆:不是实时监控,是跑沙盒代理从截图里提炼结构...

📅 ue, 21 Apr 2026 🔗 原文链接

Cloudflare Email Service 公测:给 AI 一个邮箱,它能像同事一样接活、办事、回信

Cloudflare Email Service 是 Cloudflare 推出的邮件服务,4 月 16 日进入公测。这次的重点不是给应用发注册邮件、通知邮件这种常规活,而是让 AI 助手能像真人同事一样用邮箱工作:你发邮件给它,它收到、办事、办完了回你。主要变化是这几个:发邮件能力进入公测,所有应用和 AI 助手都能直接调用AI 助手能完整闭环用邮箱了,收到邮件能自己处理几小时再回信给 Claude Code、Cursor 这类 AI 编程工具做了套配套,本地跑的 AI 也能用开源了一个完整的"AI 收件箱"应用,一键部署就能用,新邮件来了 AI 自动起草回信,确认后才发自动帮你配好邮件认证...

📅 Mon, 20 Apr 2026 🔗 原文链接

HeyGen 开源 HyperFrames :用 HTML 写视频,不用 React 不用剪辑软件

核心思路是"写 HTML,渲染出视频",专门为 AI agent 设计。用 HTML + 一些 data-* 属性定义视频,跑个命令就能渲染成 MP4不需要 React,不需要专有的 DSL,不需要拖拽时间轴,agent 已经会写 HTML 了,让它直接生成支持 GSAP、Lottie、CSS、Three.js 等动画运行时,通过 Frame Adapter 模式接入确定性渲染:同样的输入永远产出完全一致的输出,适合 CI 和批量渲染管线自带给 Claude Code、Cursor、Gemini CLI、Codex 用的"skills",把框架的语法规则教给 agentApache 2.0 开...

📅 Fri, 17 Apr 2026 🔗 原文链接

Chrome 给 AI 搜索加了"边看边问"和"+"菜单,不用再来回切标签页

AI Mode 是谷歌去年在搜索里推出的 AI 对话式搜索模式,你在搜索框里直接问问题,它用 AI 给你生成答案而不是只列一堆蓝色链接。这次它和 Chrome 浏览器深度整合了,主要更新是两个:并排浏览:在 Chrome 桌面端用 AI Mode 搜索,点击结果里的链接,网页会在 AI Mode 旁边打开,不用来回切标签页"+"菜单:搜索框里新增"+"按钮,可以把你当前打开的标签页、图片、PDF 文件一起塞进搜索,让 AI 拿着这些上下文回答你还顺便把 Canvas、AI 图像生成这些 AI Mode 里的工具,也接入了"+"菜单目前美国上线,其他地区陆续开放。并排浏览:搜一下不用切出去以前你...

📅 Fri, 17 Apr 2026 🔗 原文链接

OpenAI 把 Codex 彻底升级了 它能自己操作你的 Mac、生图、记你习惯

OpenAI 今天给 Codex 推了一次很大的更新。以前的 Codex 是一个专门写代码的 Agent,你给它一段需求,它帮你写、调试、提 PR,一切都在代码范围里。这次更新之后,它一下子跨出去了。主要更新内容:能操作你 Mac 上的任意 App,看屏幕、点击、打字,后台运行,跟你同时用电脑也不冲突内置图像生成模型 gpt-image-1.5,直接生成 mockup、游戏素材、演示图记住你的偏好、纠正、常用技术栈,不用每次重新铺背景自己给自己排定时任务,可以跨天跨周推进一件事90 多个新 plugins,连 CircleCI、GitLab、Microsoft 套件、Slack、Gmail、N...

📅 Fri, 17 Apr 2026 🔗 原文链接

🔹 Hacker News

直接从模特实时直播的网站

https://x.com/zan2434/status/2046982383430496444 (https://xcancel.com/zan2434/status/2046982383430496444) 评论网址: https://news.ycombinator.com/item?id=47867048 积分: 112 #评论: 43

📅 Wed, 22 Apr 2026 🔗 原文链接

《光照人》: JG Ballard的非传统肖像

文章网址: https://www.theguardian.com/books/2026/apr/20/the-illuminated-man-by-christopher-priest-and-nina-allan-review-an-unconventional-portrait-of-jg-ballard 评论网址: https://news.ycombinator.com/item?id=47868832 积分: 42 #评论: 12

📅 Wed, 22 Apr 2026 🔗 原文链接

Apple修复了警方用于从iPhone中提取已删除聊天消息的错误

文章网址: https://techcrunch.com/2026/04/22/apple-fixes-bug-that-cops-used-to-extract-deleted-chat-messages-from-iphones/ 评论网址: https://news.ycombinator.com/item?id=47868867 积分: 258 # Comments: 73

📅 Wed, 22 Apr 2026 🔗 原文链接

新奥尔良霓虹之王

文章网址: https://gardenandgun.com/new-orleans-neon-king 评论网址: https://news.ycombinator.com/item?id=47869496 积分: 22 #评论: 2

📅 Wed, 22 Apr 2026 🔗 原文链接

将您自己的代理带到MS Teams

文章网址: https://microsoft.github.io/teams-sdk/blog/bring-your-agent-to-teams/ 评论网址: https://news.ycombinator.com/item?id=47870108 积分: 6 #评论: 0

📅 Wed, 22 Apr 2026 🔗 原文链接

🔹 arXiv 人工智能

量子灵感的量子比特qutrit神经网络用于实时财务预测

arXiv: 2604.18838v1公告类型:新 摘要:本研究通过比较人工神经网络( ANN )、基于量子Qubit的神经网络( QQBN )和基于量子Qutrit的神经网络( QQTN ) ,研究了机器学习模型在库存预测中的性能和功效。 通过概述方法、架构和培训程序,该研究强调了显著的不同……

📅 Wed, 22 Apr 2026 🔗 原文链接

人工智能科学家在没有科学推理的情况下产生结果

arXiv: 2604.18805v1公告类型:新 摘要:基于大型语言模型( LLM )的系统越来越多地用于自主进行科学研究,但其推理是否符合使科学探究自我纠正的认识论规范尚不清楚。 在这里,我们评估了跨八个领域的基于LLM的科学代理,从工作流程执行到假设...

📅 Wed, 22 Apr 2026 🔗 原文链接

ARES :政策奖励系统的自适应红队和端到端维修

arXiv: 2604.18789v1公告类型:新 摘要:从人类反馈中强化学习( RLHF )是调整大型语言模型( LLM )的核心,但它引入了一个关键的漏洞:当不完美的奖励模型( RM )未能惩罚不安全的行为时,它可能会成为单点故障。 虽然现有的红队方法主要针对政策层面的弱点,但它们过于……

📅 Wed, 22 Apr 2026 🔗 原文链接

Beyond One输出:可视化和比较语言模型生成的分布

arXiv: 2604.18724v1公告类型:新 摘要:用户通常通过单个输出与语言模型交互并评估语言模型,但每个输出只是可能完成的广泛分布中的一个样本。 这种交互隐藏了分布结构,如模式、不常见的边缘情况和对小的即时变化的敏感性,导致用户在迭代时从轶事中过度概括……

📅 Wed, 22 Apr 2026 🔗 原文链接

关于多变量间隙最长公共子序列问题的求解

arXiv: 2604.18645v1公告类型:新 摘要:本文解决了可变间隙最长公共子序列( VGLCS )问题,这是经典LCS问题的推广,涉及连续解字符之间的灵活间隙约束。 问题出现在分子序列比较中,其中必须尊重残基之间的结构距离约束,并且在时间序列中...

📅 Wed, 22 Apr 2026 🔗 原文链接

🔹 Reddit 人工智能

留在房间里的道德规范

提交者/u/bcRIPster [link] [comments]

📅 2026-04-22 21:59 🔗 原文链接

Meta将记录员工屏幕、点击和按键,以训练可能取代他们的人工智能

提交者/u/esporx [link] [comments]

📅 2026-04-22 18:28 🔗 原文链接

由Anthropic调查的Claude Mythos AI未经授权的访问声明

提交者/u/unserious-dude [link] [comments]

📅 2026-04-22 15:48 🔗 原文链接

人工智能领域发生的最大的事情是什么?

我个人认为是AlphaGo或ChatGPT。AlphaGo向全世界展示,在人们认为需要“直觉”的领域,人工智能可以比其创造者更好。大多数人不知道GO ,但它在某种程度上向世界展示了AI的潜力。DeepBlue也有点类似,但出于某种原因,大多数人不认为DeepBlue是“在国际象棋中击败人类的人工智能” ,所以我不...

📅 2026-04-22 15:01 🔗 原文链接

我们是否正在接近死亡的互联网理论?

我的意思是a )互联网上的大多数文章都是由AI撰写的b ) 10大Youtube频道中的4个c ) 10个Facebook帖子中的4个d )向新Youtube用户展示的5个视频中的1个e )订阅量排名第一的Twitch流媒体是AI f ) Deezer上的44 %的歌曲此外,大多数广告现在都是AI生成的,例如AI为/u/ocean_protocol提交的其他AI创建内容[link] [comments]

📅 2026-04-22 04:50 🔗 原文链接

🔹 Reddit 机器学习

GPU指南针–跨20多个云的开源实时GPU定价[P]

我们维护云GPU产品的开源目录( skypilot-catalog、Apache 2.0 )。它每7小时自动从20多个云API获取定价。我们使其可浏览- 50个GPU型号, 2K +产品,按需定价和现货定价,历史趋势。其他一些GPU比较工具已经使用我们的目录作为其数据源。我想我们会让所有人都能看到原始数据。提交者/...

📅 2026-04-22 19:00 🔗 原文链接

EMNLP研讨会有什么好处吗?或任何其他适合VLM评估工作的NLP场所? [D]

我的论文被影像中心( A * )拒绝,因为它缺乏临床验证,而且更“适合NLP”。我对这一决定感到非常失望,因为该论文具有适合特定场地的强大方法和关键发现。我接下来想到的是EMNLP ,但我觉得它太NLP了,我的论文肯定会丢失。但我看到一个EMNLP研讨会非常适合这篇论文。这样的工作坊是否特别……

📅 2026-04-22 18:13 🔗 原文链接

如何匿名提交会议的代码? [D]

大家好,我有一个关于会议提交代码匿名化的问题。我正在向会议提交AI/ML论文,并希望包含代码,但存储库需要匿名化。在这种情况下,创建一个单独的匿名GitHub帐户,在那里上传代码,然后,如果论文被接受,稍后将其移动到您的官方GitHub帐户是否常见?我真的……

📅 2026-04-22 15:18 🔗 原文链接

我不敢相信文本规范化在流式文本转语音中被如此低估[D]

关于流媒体TTS模型中的错误的讨论很少,这有点让我感到惊讶。人们寻找自然的读者,高质量的语音,富有表现力的语音。大多数模特在这里看起来并不愚蠢,而且失败了。当您向他们提供价格、日期、网址、优惠码、电话号码等基本信息时,他们就会失败。所以我正在寻找一些信息,并找到了一个比较商业实时数据的基准...

📅 2026-04-22 12:35 🔗 原文链接

INT3压缩+熔融金属内核[R]

嘿,伙计们,我是一名研究员和独奏创始人。我将INT3的模型压缩到+0.14 nats ,并为长距离任务构建了一个2位KV缓存。我发货了两款( INT3型号+ INT2 KV ) ,带有适用于Mac的定制熔融金属内核( M系列)。目前Qwen 7B有预览版。# install brew install reinforceai/spiral/spiral # chat spiral-chat我正在进一步优化内核,并致力于Triton内核...

📅 2026-04-22 06:54 🔗 原文链接

从头开始构建自己的扩散语言模型比我想象的要容易[P]

因为我觉得我最近非常依赖Claude Code ,所以我想看看在没有AI生成的代码的帮助下,从头开始实现扩散语言模型是多么困难。所以我在等待硕士论文的培训时建立了一个。这是我在MacBook Air M2上训练几个小时后得到的。我在Karpathy的小型莎士比亚数据集上进行了培训,并提示“要……

📅 2026-04-21 17:23 🔗 原文链接

🔹 51AllAI

月之暗面发布 Kimi K2.6,主攻长程自主编码与大规模 Agent 集群协同

月之暗面正式上线 Kimi K2.6,核心突破在于极高强度的自主编程执行力与最高支持 300 节点并行的 Agent 集群架构,标志着基础模型能力从“代码片段生成”向“系统级工程接管”过渡。超长程自主编码 (Autonomous Coding)基准测试数据:在内部代码评测集 Kimi Code Bench 中,K2.6 较上一代 K2.5 提升约 20%。官方宣称其代码能力基准对标 GPT-5.4。无人值守执行极限:旧系统重构:针对具有 8 年历史的开源金融撮合引擎(exchange-core),K2.6 连续运行 13 小时,发起 1000+ 次工具调用,完成 4000+ 行代码修改,最终将...

📅 2026-04-21 03:11 🔗 原文链接

Google AI Studio 并入 Pro/Ultra 订阅,开放核心模型权限

Google 调整 AI 开发者工具商业化策略,将 AI Studio 整合至付费订阅体系,通过配额提升与高阶模型绑定加速应用落地。Google AI Studio 正式并入 Google AI Pro 与 Ultra 订阅计划。此举将开发者的工具链与 Google 的高阶订阅服务完成了直接捆绑。核心开发权益更新配额与限制解除:Pro 及 Ultra 订阅开发者获得较基础版本更高的调用限制(具体 QPM/RPM 等扩容数值目前官方尚未在技术文档中明确披露)。高阶模型接入:订阅层用户现已解锁对 Nano Banana Pro(专业级图像生成模型)与 Gemini Pro 模型的全面访问权限。官方...

📅 2026-04-21 02:42 🔗 原文链接

阿里发布 Qwen3.6-Max-Preview,API 新增思维保留机制优化智能体编程

阿里云上线下一代旗舰大模型早期预览版,通过底层接口支持多轮思维链保留,刷新第三方平台国产大模型评测上限。性能跃升与基准表现Qwen3.6-Max-Preview 定位为千问系列下一代旗舰大模型的早期版本。对比前序释放的 Qwen3.6-Plus 模型,该版本进一步提升了世界知识密度与复杂指令遵循能力。其核心技术突破点在于智能体编程(Agentic Programming),宣称在 6 项相关核心基准测试中取得首位。同时,据第三方基准测试平台 Artificial Analysis 最新追踪数据,该预览版目前的综合性能表现位列国产模型第一。部署与 preserve_thinking 机制该模型当...

📅 2026-04-20 13:27 🔗 原文链接

Anthropic 发布 Claude Opus 4.7与重构版克劳德法典

Anthropic 推出视觉与长周期推理能力升级的 Opus 4.7 模型,并同步重构 Claude Code 桌面端引入云端并发与自动化任务触发(Routines),标志着 AI 辅助编程从单点对话交互向全自动后台 Agent 工作流实质性演进。Claude Opus 4.7 模型特性与核心数据发版状态与定价:2026年4月16日全量上线。API 计费标准维持 Opus 4.6 水平(输入 $5/M Tokens,输出 $25/M Tokens)。早期内部 API 注册代号为 capybara-v2。视觉解析能力升级:模型可接收长边达 2576 像素(约 3.75 Megapixels)的图...

📅 2026-04-16 15:50 🔗 原文链接

MiniMax 推出云端自演进 Agent MaxHermes,基于 M2.7 构建闭环技能库

MiniMax 依托底层 M2.7 模型的代码与推理能力,上线云端 AI 助手 MaxHermes。产品核心在于从“静态工具调用”转向“动态技能自提炼”,并实现 24 小时脱机运行。闭环自主演进机制 (Self-Evolution)MaxHermes 的核心架构基于云端沙箱。有别于单次 Prompt 交互,当其完成复杂长链路任务(如跨组件操作或逻辑推演)后,会自动提炼操作路径,生成可复用的“技能”(Skills)并作为独立文档持久化保存。这些技能在后续触发相同场景时按需动态加载,并通过真实反馈数据不断自我迭代。系统原生支持跨会话记忆(Cross-session memory)和多个子代理(Su...

📅 2026-04-16 06:43 🔗 原文链接

Google 推出 100% Swift 原生 Gemini macOS 客户端

Google 结束桌面端 AI 的网页依赖,推出基于 Apple Silicon 和 macOS 15 构建的原生 Gemini 客户端,核心通过全局快捷键和“屏幕上下文感知”抢占系统级交互入口。交互重构:纯原生框架与级联唤醒Google 放弃了跨平台 Web 容器套壳方案,采用 100% Swift 进行原生应用开发。客户端引入了系统级唤醒机制(Option + Space 呼出迷你交互对话框,Option + Shift + Space 呼出完整应用界面),对标并试图替代 Spotlight 或传统浏览器的搜索习惯。屏幕上下文感知 (Context-Awareness)客户端的核心差异化能...

📅 2026-04-16 02:54 🔗 原文链接

谷歌开源 Gemma 4 多模态模型系列,最高支持 256K 上下文与端侧原生音频

谷歌推出横跨 2B 至 31B 的 Gemma 4 模型矩阵,通过强化原生多模态解析、MoE 架构及显式推理控制(Thinking Mode),确立了从端侧设备到云端服务器的开源 Agent 开发基准。架构规格与核心参数发布版本包含四个参数梯队,底层统一采用 Transformer 架构并全系拓展多模态支持:Effective 2B (E2B) & Effective 4B (E4B):专为端侧部署设计,引入单层嵌入(Per-Layer Embeddings, PLE)技术以最大化参数利用率。支持 128K 输入上下文。26B A4B (MoE):混合专家架构,总参数量 260 亿,单次前向传...

📅 2026-04-03 06:43 🔗 原文链接

叽伴 App 引入地图与剧情树,重构 AI 陪伴交互范式

抛弃单一的对话框形态,趣丸集团关联团队通过“世界地图+分支剧情”的 RPG 化改造,推动 AI 陪伴从“单点聊天”向“共创冒险”演进。交互范式 RPG 化由“谜境”开发商(上海小煎饼信息科技,系趣丸集团关联实体)研发的“叽伴” App 正在重构 AI 社交玩法。该应用跳出了传统的纯文本对话框架,引入设定世界地图与室内场景扩展。AI 角色具备初步的空间与场景感知逻辑,支持“立绘焕装”(依据所处地图场景自动切换视觉表现)。用户支持自定义地图,将交互场景从扁平的聊天窗口升级为带有环境上下文的角色扮演(TRPG)冒险。记忆实体化与叙事非线性应用底层引入了多智能体(Multi-Agent)协同机制,不仅...

📅 2026-03-31 13:42 🔗 原文链接

微信推出 ClawBot 官方插件接入 OpenClaw 智能体

腾讯开放国民级社交通讯接口,使用户能在聊天窗口直接调度本地 AI Agent。官方插件 ClawBot 落地2026年3月22日,微信正式上线“ClawBot”插件。用户更新微信后(路径:我—设置—插件),可通过终端指令、扫码或复制命令将本地 OpenClaw 接入微信。连接建立后,用户可在常规聊天界面发送文本指令,驱动 Agent 跨应用执行任务并实时接收回调结果。腾讯端云协同基建部署配套微信接口开放,腾讯同步上线多层级部署方案:云端版 Lighthouse(云端虾)、自研版 WorkBuddy 以及本地版 QClaw。此外,腾讯云启动全国17城线下免费巡装计划,提供端到端环境配置,直接降低...

📅 2026-03-22 07:31 🔗 原文链接

腾讯公测本地智能体 QClaw,将微信升级为跨端控制中枢

腾讯将开源框架 OpenClaw 封装为低门槛产品 QClaw 并开启大规模公测,通过微信小程序打通移动端与 PC 端壁垒,标志着 Local Agent 向非技术人群的普及实质性落地。微信交互链路重构(V0.1.9 版本)2026年3月18日,腾讯云正式宣布 QClaw 迎来版本更新,核心动作是将移动端控制入口由“微信客服号”升级为“微信小程序”。该升级直接解决了此前需在二级菜单寻找机器人的交互痛点。当前版本已支持通过小程序直接上传或接收 PC 端文件。根据官方披露的迭代路线图,小程序端即将接入微信原生多模态能力(语音指令、图片解析),并支持远程创建定时任务、实时回传任务流状态及动态切换底层...

📅 2026-03-18 13:27 🔗 原文链接