📰 每日 AI 资讯

2026年05月17日

最后更新:2026-05-17 08:02:12 UTC+8

🔹 arXiv 人工智能

PREPING :构建无任务的代理内存

arXiv: 2605.13880v1公告类型:新 摘要:座席记忆通常是通过精心策划的演示离线构建的,也可以通过部署后交互在线构建的。 但是,无论如何构建,客服代表在首次引入新环境时都会面临冷启动缺口,而没有任何特定任务的体验。 在本文中,我们研究了任务前记忆构建:是否……

📅 Sat, 16 May 2026 🔗 原文链接

Invisible Orchestrators抑制保护行为并分离Power-Holders : Multi-Agent LLM系统中的安全风险

arXiv: 2605.13851v1公告类型:新 摘要:多代理编排--其中隐藏的协调器管理专门的工作代理--正在成为企业人工智能部署的默认架构,但编排器不可见的安全影响从未得到实证测试。 我们进行了一项预先注册的3x2实验( 365次运行,每次运行5个代理) ,跨越三个组织......

📅 Sat, 16 May 2026 🔗 原文链接

人工智能Agent设计模式的二维框架:认知功能和执行拓扑

arXiv: 2605.13850v1公告类型:新 摘要:基于LLM的代理架构的现有框架从单一角度描述系统:行业指南( Anthropic、Google、LangChain )侧重于执行拓扑-数据如何流动-而认知科学调查则侧重于认知功能-代理的作用。 这两个轴都不能单独消除架构上不同的系统的歧义:

📅 Sat, 16 May 2026 🔗 原文链接

用于个性化膳食优化的混合整数目标编程,具有用户定义的膳食粒度

arXiv: 2605.13849v1公告类型:新 摘要:确定吃什么来满足营养需求是运筹学中最古老的优化问题之一,但现有的配方存在两个持久的局限性:连续变量产生不切实际的分数份( 1.7个鸡蛋, 0.37个香蕉) ,以及硬营养约束导致目标冲突时不可行。

📅 Sat, 16 May 2026 🔗 原文链接

GraphBit :一种基于图形的非线性Agent编排Agent框架

arXiv: 2605.13848v1公告类型:新 摘要: Agentic LLM框架依赖于提示编排,其中模型本身确定工作流转换,通常存在幻觉路由、无限循环和不可重现的执行。 我们引入了GraphBit ,这是一个引擎编排的框架,它将工作流显式地和确定性地定义为有向非循环图( DAG )。...

📅 Sat, 16 May 2026 🔗 原文链接

🔹 51AllAI

上海电信推出1元25万Token套餐

2026年5月15日,上海电信在第六届科技节上海站首发Token资费套餐,成为上海首个以Token为单位计费AI算力的运营商。套餐通过”智云上海 AI STORE”平台(gpushop.sh.189.cn)提供,1元对应25万额度点,支持话费账单直付。定价:1元=25万额度点,批量最高6.5折以 Kimi K2.5 模型为例,1额度点约对应1输入Token,即25万额度点可调用约25万输入Tokens。购买模式为按量计费,用多少买多少,多买享折扣——250万至5000万额度点可享阶梯优惠,最高6.5折,活动截至2026年6月30日。不同模型的输入/输出Token消耗比例及换算系数在公开报道中未...

📅 2026-05-16 15:45 🔗 原文链接

Google Gemini 学生资格启动二次验证,数千虚假账号遭清退

Google 通过 SheerID 对 Gemini AI Pro 学生订阅启动二次验证,2026 年初清退超 7000 个虚假账号,大批早期”薅羊毛”用户资格被取消。漏洞曝光与大规模清退2025 年中,Google 面向美国、英国、日本、印尼、巴西等国在读学生推出 AI Pro 免费订阅,含 Gemini Advanced、2TB Google One 存储、NotebookLM Plus、Deep Research 等权益,标准年费 $199(当时促销价 $99)。2026 年 1 月 4 日,GitHub 上出现 SheerID 验证流程的漏洞利用工具,可自动生成伪造学生凭据绕过认证。R...

📅 2026-05-15 03:15 🔗 原文链接

OpenAI 将 Codex 集成到 ChatGPT 手机端,实现远程操控

5 月 14 日,OpenAI 宣布将 Codex 编码工具集成到 ChatGPT 移动应用(iOS + Android 预览版),手机端定位为远程”移动控制台”,而非直接编码环境。手机端定位:远程控制,非直接编码OpenAI 明确界定了手机端的能力边界——“你不会在手机上用 Codex 编程”。手机端的功能是管理而非编写:查看实时代码差异(Diffs)、测试运行截图、终端反馈在 Codex 需要决策时提供指导,审批高风险的终端命令通过语音或文字下达新的迭代指令一键推送 GitHub Pull Request切换模型、启动新线程、查看终端日志手机端作为用户与编码项目环境之间的”中介”,适合通勤...

📅 2026-05-15 02:43 🔗 原文链接

Moonshot 推出 Kimi WebBridge ,让 AI代理 直接操控浏览器

Moonshot AI 发布 Kimi WebBridge 浏览器扩展,基于 Chrome DevTools Protocol 实现本地 Agent 对浏览器的直接控制,支持 Claude Code、Cursor、Codex 等第三方 Agent 接入。产品定位:Agent 的浏览器”遥控器”Kimi WebBridge 是一款 Chrome/Edge 浏览器扩展,由 Moonshot AI(月之暗面)推出。核心功能:让 AI Agent(包括 Claude Code、Cursor、Codex、Kimi Code CLI、Hermes 等)像真人一样在已登录的浏览器窗口中执行点击、滚动、填表、...

📅 2026-05-15 02:32 🔗 原文链接

Anthropic 宣布 Claude Code 每周限制临时上调 50%,有效期至 7 月 13 日

Claude Code 的周使用限制上调 50%,叠加此前 5 小时限制翻倍调整,短期缓解开发者的额度瓶颈。调整详情@ClaudeDevs(Anthropic 官方开发者账号)宣布:Claude Code 的每周使用限制上调 50%,即时生效,有效期至 2026 年 7 月 13 日。适用范围覆盖所有 Pro、Max、Team 及按席位计费的 Enterprise 计划。这是 Anthropic 在一个月内第二次调整 Claude Code 的额度。5 月 6 日,Anthropic 在官方博客宣布将 Pro、Max、Team 和 Enterprise 计划的 5 小时速率限制翻倍,并取消了 ...

📅 2026-05-14 12:46 🔗 原文链接

Google 发布Googlebook , Chromebook将被 AI笔记本取代

Google用”从操作系统到智能系统”的定位变化,把Gemini塞进笔记本的每个交互环节,Chromebook 15年品牌正式让位。全新硬件品类:为Gem Intelligence从头构建2026年5月12日,Google在”The Android Show”线上发布会上公布了全新笔记本品类 Googlebook。官方定位:”built from the ground up for Gemini Intelligence”——从底层围绕Gemini AI构建,而非在现有系统上叠加AI功能。Googlebook基于Android技术栈的部分构建,融合了Android、Google Play商店和...

📅 2026-05-13 16:09 🔗 原文链接

长亭开源MonkeyCode:内置多模型的AI工程级开发平台

长亭科技推出内置多模型的 AI 编程平台 MonkeyCode,无需本地安装,浏览器内即可完成代码编写、执行、审查全流程。长亭科技(Chaitin)于 2025 年 12 月底上线 MonkeyCode,定位为”工程级 AI 开发平台”。与 Claude Code、Cursor 等本地 CLI 或 IDE 插件不同,MonkeyCode 把完整的开发环境搬到浏览器里——无需安装,无需连接本地机器,打开网页就能让 AI 写代码、跑命令、做审查。平台开源在 GitHub(chaitin/MonkeyCode),采用 AGPL-3.0 协议,注册即送 200 元免费算力。产品形态:云端开发环境 + ...

📅 2026-05-13 08:39 🔗 原文链接

Claude Code 2.1.139 发布,新增代理视图与/目标 命令

Anthropic 为 Claude Code 推出 Agent View(研究预览)和 /goal 命令,一次解决多会话管理与目标驱动工作流两个高频需求,同时修复 30 余项覆盖认证、MCP、UI 渲染的缺陷。Agent View:统一会话列表(研究预览)新增 claude agents 命令,在一个列表中展示所有 Claude Code 会话——运行中、等待用户输入、已完成。这是此前社区反馈最密集的功能之一:开发者经常同时运行多个 agent(前台编码 + 后台调研 + 子 agent 任务),但缺乏全局视图。该功能标记为”研究预览”,意味着接口和行为可能继续调整。文档同步上线:https...

📅 2026-05-12 12:27 🔗 原文链接

Claude Code 发布 Agent View,一个终端管理所有编码会话

Claude Code 原生内置多任务管理面板,开发者无需再开多个终端或依赖 tmux 来并行调度 AI 编码会话。核心功能:一个列表掌控所有会话Agent View 是 Claude Code 的原生终端面板,以表格形式列出所有后台会话。运行 claude agents 即可打开,按状态分组排列:状态含义动画闪烁 (✽)正在工作,Claude 正在执行工具或生成回复黄色 (✻)需要输入,等待用户回答或权限确认灰色变暗 (∙)空闲,不阻塞具体问题绿色任务完成红色出错终止灰色用户手动停止需要输入和工作中的会话置顶,已完成的老会话自动折叠为”… N more”。打开 PR 的会话和失败会话始终可见...

📅 2026-05-12 06:13 🔗 原文链接

中国移动发布MoMA平台,接入超300款大模型

中国移动以运营商身份切入大模型聚合赛道,用统一网关和Token集约化运营把政企客户的模型采购流程标准化,主战场不是开发者而是政企采购。平台定位:政企模型采购的”中间层”2026年5月8日,中国移动在苏州举行的移动云大会主论坛上发布移动模型服务平台 MoMA(Mobile Model Service Platform)。平台接入超300款AI大模型,包括中国移动自研的”九天”基座大模型,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等第三方模型。统一 API 网关是核心入口——企业一次接入即可调用平台全部模型资源,无需与各模型厂商单独签约。这是 MoMA 对政企客户的核心卖点:把多头...

📅 2026-05-11 12:12 🔗 原文链接

🔹 Reddit 人工智能

我们一直说人工智能“理解”事物。是吗?还是我们只是在模式上匹配我们自己的拟人化?

每周都有一篇新的论文或推文声称某些模型“理解”上下文, “原因”关于数学,或“知道”它不知道什么。但是,当你仔细观察时,几乎没有关于“理解”在哲学上或经验上意味着什么的共识。Searle的中文房间争论已有40年历史,仍未得到彻底解决。“随机鹦鹉”框架对待代币谓词……

📅 2026-05-16 15:05 🔗 原文链接

大多数企业都试图在组织混乱的基础上扩展人工智能

我认为我们低估了大公司内部混乱的企业人工智能采用情况。从外部来看,这看起来很简单:购买更好的模型添加副驾驶自动化工作流程部署人工智能代理提高生产力但在许多企业内部,首席信息官和首席技术官正在处理一个更深层次的问题:组织本身是分散的。客户数据存在于: CRM系统计费页面...

📅 2026-05-16 14:48 🔗 原文链接

科技推动成为下一个公用事业

亚马逊没有申请成为关键基础设施的许可。他们建立了AWS ,直到足够的经济依赖于它,以至于监管变得几乎不可能。您无法关闭互联网的骨干网。现在,同样的剧本正在人工智能和数据中心中运行。在任何地方构建基础设施。大规模创建依赖关系。让自己对医疗保健、金融、政府和战役至关重要……

📅 2026-05-16 04:51 🔗 原文链接

斯坦福大学研究了51个实际的人工智能部署,发现71%与40%的生产力差距-这是两个群体之间的区别

我遇到了斯坦福大学的一篇研究论文,该论文实际上是在生产中运行人工智能的公司内部-而不是试点,不是调查,而是真正的部署。他们发现了一些粘在我身上的东西。使用他们所谓的“代理人工智能”的公司--人工智能拥有从开始到结束的任务,没有人工批准循环--生产率中位数提高了71%。使用标准人工智能来帮助人类的公司是……

📅 2026-05-15 22:37 🔗 原文链接

最近的民意调查显示, 70%的美国人不希望在当地建立人工智能数据中心

提交者/u/Tiny-Independent273 [link] [comments]

📅 2026-05-15 13:22 🔗 原文链接

🔹 Reddit 机器学习

您是否同意Judea的观点,即从数据中学习并不是一切? [D]

链接: Judea Pearl , 2011年ACM图灵奖获得者( 2:18:05 )引用:人们并非都能理解其中的局限性。我已经提到了一个局限性,即你在这里有一个层次结构,从相关性到因果关系,从因果关系到解释或想象力。对于人们来说,特别是在机器学习中,很难抓住这堵墙的局限性,

📅 2026-05-16 14:46 🔗 原文链接

对Arxiv提议的1年禁令的强烈反对确实令人困惑。[D]

其他人对Arxiv提议禁止作者和合著者发表带有幻觉参考和其他明显的LLM/Gen AI文物的论文的巨大反弹感到惊讶吗? https://x.com/tdietterich/status/2055000956144935055 https://xcancel.com/tdietterich/status/2055000956144935055一些回应: “这是人工智能的时代, Arxiv应该是移动者的一部分......

📅 2026-05-16 08:30 🔗 原文链接

KDD 2026周期2结果[D]

研究轨道的结果已发布。提交者:/u/ATadDisappointed [link] [comments]

📅 2026-05-16 04:07 🔗 原文链接

使用PyTorch和PyTorch Lightning的ROCm似乎仍然很难进行研究[D]

所以我在几周前的一篇文章中询问了人们对ROCm的体验https://www.reddit.com/r/MachineLearning/comments/1t6cng3/rocm_status_in_mid_2026_d/我实际上去购买了一个RX 7900XTX参考版本来试用我的发现是它仍然有点糟糕我有一个用于训练流匹配模型( SANA Architecture )的小代码库,它在我的RTX3090s上运行良好。但是...

📅 2026-05-16 00:01 🔗 原文链接