2026年05月16日
最后更新:2026-05-16 08:06:03 UTC+8
文章网址: https://sciencedemonstrations.fas.harvard.edu/presentations/microscale-thermite-reaction 评论网址: https://news.ycombinator.com/item?id=48153142 积分: 47 #评论: 17
https://xcancel.com/mitchellh/status/2055380239711457578https://hachyderm.io/ @ mitchellh/116580433508108130 评论网址: https://news.ycombinator.com/item?id=48153379 积分: 624 评论数: 285
文章网址: https://reclaimthenet.org/london-police-deploy-facial-recognition-at-protest-for-first-time 评论网址: https://news.ycombinator.com/item?id=48153400 积分: 84 # Comments: 62
文章网址: https://www.vldb.org/pvldb/vol19/p1469-lee.pdf 评论网址: https://news.ycombinator.com/item?id=48154711 积分: 24 #评论: 3
文章网址: https://spectre-docs.pages.dev 评论网址: https://news.ycombinator.com/item?id=48155159 积分: 3 #评论: 0
arXiv: 2605.13880v1公告类型:新 摘要:座席记忆通常是通过精心策划的演示离线构建的,也可以通过部署后交互在线构建的。 但是,无论如何构建,客服代表在首次引入新环境时都会面临冷启动缺口,而没有任何特定任务的体验。 在本文中,我们研究了任务前记忆构建:是否……
arXiv: 2605.13851v1公告类型:新 摘要:多代理编排--其中隐藏的协调器管理专门的工作代理--正在成为企业人工智能部署的默认架构,但编排器不可见的安全影响从未得到实证测试。 我们进行了一项预先注册的3x2实验( 365次运行,每次运行5个代理) ,跨越三个组织......
arXiv: 2605.13850v1公告类型:新 摘要:基于LLM的代理架构的现有框架从单一角度描述系统:行业指南( Anthropic、Google、LangChain )侧重于执行拓扑-数据如何流动-而认知科学调查则侧重于认知功能-代理的作用。 这两个轴都不能单独消除架构上不同的系统的歧义:
arXiv: 2605.13849v1公告类型:新 摘要:确定吃什么来满足营养需求是运筹学中最古老的优化问题之一,但现有的配方存在两个持久的局限性:连续变量产生不切实际的分数份( 1.7个鸡蛋, 0.37个香蕉) ,以及硬营养约束导致目标冲突时不可行。
arXiv: 2605.13848v1公告类型:新 摘要: Agentic LLM框架依赖于提示编排,其中模型本身确定工作流转换,通常存在幻觉路由、无限循环和不可重现的执行。 我们引入了GraphBit ,这是一个引擎编排的框架,它将工作流显式地和确定性地定义为有向非循环图( DAG )。...
所以我在几周前的一篇文章中询问了人们对ROCm的体验https://www.reddit.com/r/MachineLearning/comments/1t6cng3/rocm_status_in_mid_2026_d/我实际上去购买了一个RX 7900XTX参考版本来试用我的发现是它仍然有点糟糕我有一个用于训练流匹配模型( SANA Architecture )的小代码库,它在我的RTX3090s上运行良好。但是...
大家好,我正在使用2D X射线血管造影来处理2级分类问题( LCA与RCA冠状动脉)。我目前陷入了极端过度拟合的循环,可以就我的培训策略提供一些建议。设置:数据集:小(来自约300个独特DICOM的约900个训练帧)。架构: InceptionV3 ( PyTorch )。输入:灰度.npy数组转换为3通道,大小调整为...
论文: https://arxiv.org/abs/2605.12825代码: https://github.com/chiennv2000/orthrus披露:共同作者。想法:将可训练的扩散注意力模块注入冷冻AR变压器的每一层。两个磁头共用一个KV缓存。扩散头并行投射K = 32个令牌; AR头在第二次通过时进行验证并接受最长的匹配前缀。输出分布是可证明的……
来自Thomas G. Dietterich ( cs.LG的arXiv主持人) ,网址: https://x.com/tdietterich/status/2055000956144935055 https://xcancel.com/tdietterich/status/2055000956144935055 “ArXiv作者注意:我们的行为准则规定,作为论文作者签署您的姓名,每位作者对其所有内容承担全部责任,无论内容如何生成。如果...
我遇到了斯坦福大学的一篇研究论文,该论文实际上是在生产中运行人工智能的公司内部-而不是试点,不是调查,而是真正的部署。他们发现了一些粘在我身上的东西。使用他们所谓的“代理人工智能”的公司--人工智能拥有从开始到结束的任务,没有人工批准循环--生产率中位数提高了71%。使用标准人工智能来帮助人类的公司是……
提交者:/u/UberDrive [link] [comments]
我认为最大的人工智能风险之一可能开始转变。早些时候,人们担心的是: “如果人工智能经常出错怎么办?”但现在我认为更深层次的风险可能是: “当人工智能经常变得正确,以至于人类不再有意义地质疑它时,会发生什么?“在许多企业系统中,监督会慢慢改变形态。起初:人类仔细审查一切。然后:他们只审查例外情况。
提交者/u/Tiny-Independent273 [link] [comments]
Anthropic今天发表了一篇新的研究论文,概述了到2028年全球人工智能领导力的两种可能的未来,它更像是一个地缘政治简报,而不是典型的人工智能安全论文。核心论点:美国目前在前沿人工智能领域领先中国,主要是因为计算(芯片)。美国及其盟国公司(英伟达、台积电、ASML等)在中国打造了简单的技术。
Google 通过 SheerID 对 Gemini AI Pro 学生订阅启动二次验证,2026 年初清退超 7000 个虚假账号,大批早期”薅羊毛”用户资格被取消。漏洞曝光与大规模清退2025 年中,Google 面向美国、英国、日本、印尼、巴西等国在读学生推出 AI Pro 免费订阅,含 Gemini Advanced、2TB Google One 存储、NotebookLM Plus、Deep Research 等权益,标准年费 $199(当时促销价 $99)。2026 年 1 月 4 日,GitHub 上出现 SheerID 验证流程的漏洞利用工具,可自动生成伪造学生凭据绕过认证。R...
5 月 14 日,OpenAI 宣布将 Codex 编码工具集成到 ChatGPT 移动应用(iOS + Android 预览版),手机端定位为远程”移动控制台”,而非直接编码环境。手机端定位:远程控制,非直接编码OpenAI 明确界定了手机端的能力边界——“你不会在手机上用 Codex 编程”。手机端的功能是管理而非编写:查看实时代码差异(Diffs)、测试运行截图、终端反馈在 Codex 需要决策时提供指导,审批高风险的终端命令通过语音或文字下达新的迭代指令一键推送 GitHub Pull Request切换模型、启动新线程、查看终端日志手机端作为用户与编码项目环境之间的”中介”,适合通勤...
Moonshot AI 发布 Kimi WebBridge 浏览器扩展,基于 Chrome DevTools Protocol 实现本地 Agent 对浏览器的直接控制,支持 Claude Code、Cursor、Codex 等第三方 Agent 接入。产品定位:Agent 的浏览器”遥控器”Kimi WebBridge 是一款 Chrome/Edge 浏览器扩展,由 Moonshot AI(月之暗面)推出。核心功能:让 AI Agent(包括 Claude Code、Cursor、Codex、Kimi Code CLI、Hermes 等)像真人一样在已登录的浏览器窗口中执行点击、滚动、填表、...
Claude Code 的周使用限制上调 50%,叠加此前 5 小时限制翻倍调整,短期缓解开发者的额度瓶颈。调整详情@ClaudeDevs(Anthropic 官方开发者账号)宣布:Claude Code 的每周使用限制上调 50%,即时生效,有效期至 2026 年 7 月 13 日。适用范围覆盖所有 Pro、Max、Team 及按席位计费的 Enterprise 计划。这是 Anthropic 在一个月内第二次调整 Claude Code 的额度。5 月 6 日,Anthropic 在官方博客宣布将 Pro、Max、Team 和 Enterprise 计划的 5 小时速率限制翻倍,并取消了 ...
Google用”从操作系统到智能系统”的定位变化,把Gemini塞进笔记本的每个交互环节,Chromebook 15年品牌正式让位。全新硬件品类:为Gem Intelligence从头构建2026年5月12日,Google在”The Android Show”线上发布会上公布了全新笔记本品类 Googlebook。官方定位:”built from the ground up for Gemini Intelligence”——从底层围绕Gemini AI构建,而非在现有系统上叠加AI功能。Googlebook基于Android技术栈的部分构建,融合了Android、Google Play商店和...
长亭科技推出内置多模型的 AI 编程平台 MonkeyCode,无需本地安装,浏览器内即可完成代码编写、执行、审查全流程。长亭科技(Chaitin)于 2025 年 12 月底上线 MonkeyCode,定位为”工程级 AI 开发平台”。与 Claude Code、Cursor 等本地 CLI 或 IDE 插件不同,MonkeyCode 把完整的开发环境搬到浏览器里——无需安装,无需连接本地机器,打开网页就能让 AI 写代码、跑命令、做审查。平台开源在 GitHub(chaitin/MonkeyCode),采用 AGPL-3.0 协议,注册即送 200 元免费算力。产品形态:云端开发环境 + ...
Anthropic 为 Claude Code 推出 Agent View(研究预览)和 /goal 命令,一次解决多会话管理与目标驱动工作流两个高频需求,同时修复 30 余项覆盖认证、MCP、UI 渲染的缺陷。Agent View:统一会话列表(研究预览)新增 claude agents 命令,在一个列表中展示所有 Claude Code 会话——运行中、等待用户输入、已完成。这是此前社区反馈最密集的功能之一:开发者经常同时运行多个 agent(前台编码 + 后台调研 + 子 agent 任务),但缺乏全局视图。该功能标记为”研究预览”,意味着接口和行为可能继续调整。文档同步上线:https...
Claude Code 原生内置多任务管理面板,开发者无需再开多个终端或依赖 tmux 来并行调度 AI 编码会话。核心功能:一个列表掌控所有会话Agent View 是 Claude Code 的原生终端面板,以表格形式列出所有后台会话。运行 claude agents 即可打开,按状态分组排列:状态含义动画闪烁 (✽)正在工作,Claude 正在执行工具或生成回复黄色 (✻)需要输入,等待用户回答或权限确认灰色变暗 (∙)空闲,不阻塞具体问题绿色任务完成红色出错终止灰色用户手动停止需要输入和工作中的会话置顶,已完成的老会话自动折叠为”… N more”。打开 PR 的会话和失败会话始终可见...
中国移动以运营商身份切入大模型聚合赛道,用统一网关和Token集约化运营把政企客户的模型采购流程标准化,主战场不是开发者而是政企采购。平台定位:政企模型采购的”中间层”2026年5月8日,中国移动在苏州举行的移动云大会主论坛上发布移动模型服务平台 MoMA(Mobile Model Service Platform)。平台接入超300款AI大模型,包括中国移动自研的”九天”基座大模型,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等第三方模型。统一 API 网关是核心入口——企业一次接入即可调用平台全部模型资源,无需与各模型厂商单独签约。这是 MoMA 对政企客户的核心卖点:把多头...
字节跳动 Seed 团队开源 UI-TARS-2,通过端到端多轮强化学习训练 GUI 智能体。Online-Mind2Web 得分 88.2,全面超越 Claude、OpenAI CUA 等基线模型,GitHub 31.8k star。UI-TARS-2:多轮强化学习训练 GUI 智能体2025 年 9 月,字节跳动 Seed 团队发布 UI-TARS-2 技术报告(arXiv:2509.02544)。与前代通过监督学习(SFT)+ DPO 的路径不同,UI-TARS-2 采用端到端的多轮强化学习(multi-turn RL)直接训练智能体。训练管线包含四个组件:数据飞轮(data flywh...