📰 每日 AI 资讯

2026年05月12日

最后更新:2026-05-12 08:02:51 UTC+8

🔹 Hacker News

GitLab宣布裁员和终止其信用值

文章网址: https://about.gitlab.com/blog/gitlab-act-2/ 评论网址: https://news.ycombinator.com/item?id=48100500 积分: 230 评论数: 197

📅 Mon, 11 May 2026 🔗 原文链接

交互模型

文章网址: https://thinkingmachines.ai/blog/interaction-models/ 评论网址: https://news.ycombinator.com/item?id=48100524 积分: 63 #评论: 8

📅 Mon, 11 May 2026 🔗 原文链接

TanStack NPM软件包受损

文章网址: https://github.com/TanStack/router/issues/7383 评论网址: https://news.ycombinator.com/item?id=48100706 积分: 394 评论数: 121

📅 Mon, 11 May 2026 🔗 原文链接

适用于现代macOS的Griffin PowerMate驱动程序

文章网址: https://github.com/jameslockman/Griffin-PowerMate-Driver 评论网址: https://news.ycombinator.com/item?id=48100970 积分: 15 #评论: 5

📅 Mon, 11 May 2026 🔗 原文链接

通用汽车刚刚解雇了IT员工,聘请那些拥有更强人工智能技能的人

文章网址: https://techcrunch.com/2026/05/11/gm-just-laid-off-hundreds-of-it-workers-to-hire-those-with-stronger-ai-skills/ 评论网址: https://news.ycombinator.com/item?id=48102198 积分: 7 #评论: 0

📅 Mon, 11 May 2026 🔗 原文链接

🔹 arXiv 人工智能

多智能体人工智能中的隐藏联盟:内部表示的光谱诊断

arXiv: 2605.06696v1公告类型:新 摘要:交互式人工智能代理的集合可以形成联盟,从而创建对人工智能安全和一致性至关重要的新兴群体级组织。 然而,仅观察代理行为通常不足以区分真正的信息耦合和虚假相似性,因为可能在内部表示层次上形成相应的联盟……

📅 Mon, 11 May 2026 🔗 原文链接

递归推理系统的状态表示和终止

arXiv: 2605.06690v1公告类型:新 摘要:递归推理系统在获取新证据和完善积累的理解之间交替。 两种设计选择通常是隐含的:如何表示不断发展的推理状态,以及何时停止迭代。 本文讨论了这两个问题。 我们将推理状态表示为对提取的权利要求进行编码的认知状态图,例如……

📅 Mon, 11 May 2026 🔗 原文链接

通过复合移动禁忌搜索实现快速有效的重新分区优化

arXiv: 2605.06682v1公告类型:新 摘要:空间重划分是一个实用的组合优化问题,需要高质量的解决方案、快速周转和灵活性来适应多标准目标和交互式细化。 一个核心挑战是连续性约束:在整数编程或启发式搜索中实施连续性会严重缩小...

📅 Mon, 11 May 2026 🔗 原文链接

更多思考,更多偏见:推理模型中的长度驱动位置偏见

arXiv: 2605.06672v1公告类型:新 摘要:通常假设思维链( CoT )推理和推理调整模型(如DeepSeek-R1 )通过仔细思考来减少浅层启发式偏差。 我们在多项选择QA中的位置偏差上测试了这一点,并发现了一个不同的故事:在任何具有推理能力的模型中,每个问题的位置偏差与推理轨迹器的长度成比例...

📅 Mon, 11 May 2026 🔗 原文链接

GraphDC :用于可扩展图算法推理的分治多代理系统

arXiv: 2605.06671v1公告类型:新 摘要:大型语言模型( LLM )在许多数学问题上表现出强大的潜力。 然而,它们在图算法任务上的性能仍然不令人满意,因为图在拓扑结构中自然更复杂,并且通常需要系统的多步推理,特别是在较大的图上。 在这个差距的激励下,我们提出了GraphDC ,一个D...

📅 Mon, 11 May 2026 🔗 原文链接

🔹 Reddit 机器学习

在线强化学习阅读组[D]

您好,我是今年9月攻读RL博士学位的第一年的学生。虽然每所大学都有自己的阅读小组,但我想知道是否有活跃的RL在线阅读小组我可以参加。遗憾的是,我在其他地方找不到任何信息。是否有人有任何关于在线强化学习阅读小组的信息?谢谢!提交者:/u/eramyu [link] [comments]

📅 2026-05-11 23:51 🔗 原文链接

Qwen3 0.6B和Qwen3.5 0.8B这样的小型号在哪里使用? Huggingface本月的下载量为288万次。[D]

我可以看到小Qwen3.5型号每月下载288万次。我尝试在深度研究工作流程中使用早期的0.6B模型,很难用这个模型完成一些工作。首先,他们对概念有非常深刻的理解。语义理解能力差意味着他们可能会对主题或任务感到困惑。Json输出经常中断。正在添加一层支票...

📅 2026-05-11 17:19 🔗 原文链接

交互式Jensen–Shannon发散可视化[P]

Jensen–Shannon散度的交互式可视化-吉隆坡的对称、始终有限的表兄弟。塑造两个分布,并观看JSD ,其上限为一位,每点贡献实时响应。https://robotchinwag.com/posts/jensen-shannon-divergence-visualisation/欢迎反馈。提交者:/u/ancillia [link] [comments]

📅 2026-05-11 15:03 🔗 原文链接

复制或实施一篇论文是否被视为研究? [R]

我最近完成了学士学位,我计划在这个周期或下一个周期申请硕士课程。不幸的是,我在本科期间没有发表任何论文或进行任何研究。现在我正在进行一项即将到来的研究实习,我不太可能发表一篇论文。我想知道是否复制已知论文的结果以供验证或扩展...

📅 2026-05-11 10:55 🔗 原文链接

🔹 Reddit 人工智能

谷歌颠覆黑客利用人工智能来利用公司数字防御中未知的弱点

谷歌分享了有关攻击者和目标的有限信息,但该科技巨头威胁情报部门的首席分析师约翰·赫尔特奎斯特( John Hultquist )表示,这是网络安全专家多年来一直警告的一个时刻:恶意黑客用人工智能武装自己,以增强他们入侵世界计算机的能力。“就在这里,”胡尔特奎斯特说。“人工智能驱动的脆弱性时代……

📅 2026-05-11 23:31 🔗 原文链接

Palantir将被授予对NHS患者数据的“无限访问权限”

提交者/u/esporx [link] [comments]

📅 2026-05-11 18:50 🔗 原文链接

“斯泰西脸”的崛起:人工智能增强如何扭曲我们的美容标准

提交者/u/theindependentonline [link] [comments]

📅 2026-05-11 16:54 🔗 原文链接

谷歌警告称,网络犯罪分子正在利用人工智能开发强大的黑客工具

提交者/u/forbes [link] [comments]

📅 2026-05-11 16:51 🔗 原文链接

AWS刚刚给了人工智能代理自己的钱包。您的客服代表现在可以自行付款了。

这是4天前掉下来的,我还没有看到足够多的人谈论它。AWS与Coinbase和Stripe合作推出了Amazon Bedrock AgentCore Payments。简短版本:您的代理现在有一个钱包,可以自己花钱。以下是工作流程的实际情况:为代理提供Coinbase或Stripe钱包。您为它提供资金。您设置了会话消费限额(例如“最多$ 5...

📅 2026-05-11 09:38 🔗 原文链接

🔹 51AllAI

中国移动发布MoMA平台,接入超300款大模型

中国移动以运营商身份切入大模型聚合赛道,用统一网关和Token集约化运营把政企客户的模型采购流程标准化,主战场不是开发者而是政企采购。平台定位:政企模型采购的”中间层”2026年5月8日,中国移动在苏州举行的移动云大会主论坛上发布移动模型服务平台 MoMA(Mobile Model Service Platform)。平台接入超300款AI大模型,包括中国移动自研的”九天”基座大模型,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等第三方模型。统一 API 网关是核心入口——企业一次接入即可调用平台全部模型资源,无需与各模型厂商单独签约。这是 MoMA 对政企客户的核心卖点:把多头...

📅 2026-05-11 12:12 🔗 原文链接

字节跳动开源 UI-TARS-2,多轮强化学习训练 GUI 智能体

字节跳动 Seed 团队开源 UI-TARS-2,通过端到端多轮强化学习训练 GUI 智能体。Online-Mind2Web 得分 88.2,全面超越 Claude、OpenAI CUA 等基线模型,GitHub 31.8k star。UI-TARS-2:多轮强化学习训练 GUI 智能体2025 年 9 月,字节跳动 Seed 团队发布 UI-TARS-2 技术报告(arXiv:2509.02544)。与前代通过监督学习(SFT)+ DPO 的路径不同,UI-TARS-2 采用端到端的多轮强化学习(multi-turn RL)直接训练智能体。训练管线包含四个组件:数据飞轮(data flywh...

📅 2026-05-10 13:14 🔗 原文链接

Claude Code 工程师弃用 Markdown ,转向 HTML 交付

Anthropic 的 Claude Code 团队成员 Thariq Shihipar 公开发布 20 个自包含 HTML 示例,论证 AI Agent 输出 HTML 比 Markdown 更有效。Simon Willison 随即撰文跟进实测。格式之争的底层逻辑:从”人写”到”Agent 生成”的交付范式转移。2026 年 5 月 8 日前后,Claude Code 团队成员 Thariq Shihipar(X: @trq212)发布推文:”HTML is the new markdown. I’ve stopped writing markdown files for almost e...

📅 2026-05-09 16:39 🔗 原文链接

人文在克劳德密码内置/收音机命令,推出克劳德调频 编程电台

Anthropic 在 Claude Code 终端内置 /radio 命令,一键调出 Claude FM lo-fi 编程电台,将 Lofi Girl 式的专注背景音直接嵌入 AI 编程工作流。/radio 命令:Claude Code 终端内的电台开关Claude Code 的官方命令文档中注册了 /radio:在浏览器中打开 Claude FM lo-fi 电台无图形界面的服务器环境下,直接在终端打印流媒体 URL,供外部播放器接入不适用于 Bedrock、Vertex 或 Foundry 部署版本,仅限 Anthropic 直连或付费订阅命令本身没有任何参数。输入 /radio,浏览器...

📅 2026-05-09 16:23 🔗 原文链接

人择禁用:人择禁用户请愿站上线用 封号潮引争议

Anthropic 2026 年持续收紧账号审核,多家企业和个人开发者在无预警、无明确理由的情况下被封禁,申诉渠道仅靠 Google Form 响应。用户自发建立 bannedbyanthropic.com 收集公开案例,要求 Anthropic 建立透明申诉机制。请愿站上线:bannedbyanthropic.com2026 年 4 月 19 日前后,bannedbyanthropic.com 上线。该站包含两个功能:请愿页:呼吁 Anthropic 人工复核封号决定、提供公平申诉流程、恢复合规账号。案例页(/cases):公开记录 Claude 账号封禁、暂停、组织级禁用事件。用户可按公开...

📅 2026-05-09 16:11 🔗 原文链接

DeepSeek大范围开放识图模式

5月9日,DeepSeek 在网页端和手机 App 大范围开放”识图模式”内测,多数测试账号已可使用。该模式基于 DeepSeek-V4 系列,支持图像理解,是 DeepSeek 首次将原生多模态能力开放给终端用户。上线节奏:4月末灰度 → 5月9日大范围开放识图模式于 2026 年 4 月 29 日启动灰度测试,初期仅部分账号可见。5 月 9 日起,多数测试账号已能在对话界面通过新增入口接入,界面仍标注”图片理解功能内测中”。该模式作为独立入口出现,与已有的”快速模式”、”专家模式”并列。用户需手动切换至识图模式方可上传图片,目前未实现文本与图像模态的无缝切换。技术架构:OCR2 + 视觉因...

📅 2026-05-09 11:15 🔗 原文链接

RunningHub 推出 RHTV,画布原生 AI 智能体内容创作平台上线

RunningHub 将 AI 智能体从”对话外挂”变为”画布原生”,用户用自然语言描述需求即可自动生成完整 ComfyUI 工作流,把视频创作从”盲盒抽卡”推向”导演级掌控”。产品形态:Agent 原生嵌入画布,非外挂RHTV(RunningHub TV)于 2026 年 5 月 7 日上线,官方定位为”原生 AI 智能体全能内容创作平台”。核心差异化在于 Agent 直接嵌入无限画布内部——不是独立聊天窗口,不是侧边栏插件,而是画布上的第一公民。用户输入自然语言描述(如”做一条电商产品宣传片,展示白色运动鞋,背景渐变”),Agent 自动完成以下链路:任务拆解:输出创意大纲、分镜脚本、制作...

📅 2026-05-08 12:19 🔗 原文链接

OpenAI 发布GPT-Realtime-2 ,首款 GPT-5级推理语音模型

OpenAI 将 GPT-5 级推理能力引入实时语音 API,上下文窗口从 32K 扩至 128K,并配套推出实时翻译和语音转录两款辅助模型,首次构建完整的语音 Agent 工具链。GPT-5 级推理进入语音交互GPT-Realtime-2 是 OpenAI 首个在语音对话中集成 GPT-5 级别推理能力的模型。与上一代 GPT-Realtime-1.5 相比,核心升级包括:上下文窗口从 32K 扩至 128K tokens,支持在更长语音会话中维持用户约束、偏好和业务逻辑。支持工具调用(function calling),可在对话过程中实时查询日历、搜索系统等外部工具,并支持 MCP 协议。...

📅 2026-05-08 08:48 🔗 原文链接

Claude正式接入Office全家桶,跨应用还能共享记忆

Anthropic 在 2026 年第一季度完成了 Claude 对 Microsoft Office 三件套的全覆盖,并通过跨应用上下文共享功能,让 Claude 在 Excel、PowerPoint、Word 之间保持统一的对话语境。这是 Claude 首次深度嵌入企业办公工作流,直接对标微软自家的 Copilot。时间线:3 个月完成 Office 全覆盖2026 年 3 月至 4 月,Claude 接入 Office 的节奏明显加速:3 月 9 日:微软在官方博客宣布 “Copilot Cowork”,将 Claude Cowork 技术集成进 Microsoft 365 Copilo...

📅 2026-05-08 07:04 🔗 原文链接

OpenAI 上架 Codex for Chrome 扩展,可直接操作浏览器

OpenAI 将 Codex 的浏览器操作能力从桌面端 Computer Use 延伸到了 Chrome 扩展,主打已登录态的 Web 应用交互,与 Anthropic “Claude in Chrome” 正面竞争。发布信息与安装方式2026 年 5 月 7 日,OpenAI 在 Chrome Web Store 上架了 Codex 浏览器扩展(扩展 ID: hehggadaopoacecdllhhajmbjkdcmajg),版本号 1.1.4。适用于 Mac 和 Windows。安装路径:打开 Codex 桌面应用 → Plugins → 添加 Chrome 插件 → 完成 Chrome ...

📅 2026-05-08 04:07 🔗 原文链接