2026年06月18日
最后更新:2026-06-18 08:04:55 UTC+8
文章网址: https://openrouter.ai/blog/insights/royale-last-agent-standing/ 评论网址: https://news.ycombinator.com/item?id=48576824 积分: 140 #评论: 116
文章网址: https://arstechnica.com/information-technology/2026/06/tesco-moving-40000-server-workloads-off-vmware-amid-broadcoms-abusive-conduct/ 评论网址: https://news.ycombinator.com/item?id=48576838 积分: 109 #评论: 50
文章网址: https://arstechnica.com/ai/2026/06/leaked-financial-docs-show-openai-is-losing-billions-of-dollars-a-year/ 评论网址: https://news.ycombinator.com/item?id=48577208 积分: 176 #评论: 109
文章网址: https://storiedcolors.com/ 评论网址: https://news.ycombinator.com/item?id=48577374 积分: 54 #评论: 8
文章网址: https://pluralistic.net/2026/06/17/its-the-stupid-economy-stupid/ 评论网址: https://news.ycombinator.com/item?id=48578248 积分: 21 #评论: 0
arXiv: 2606.17289v1公告类型:新 摘要:基于人工神经网络的人工智能系统正在开发中,其愿望是推动人类数学知识的边界。 这些系统的一个关键问题是他们可以在培训数据之外达到多大程度。 数学发现需要一种强大的不分布泛化形式;真正假设的能力……
arXiv: 2606.17269v1公告类型:新 摘要:在技能受限的生产库存系统中,明天可用的合格人力资源取决于今天做出的培训决策:生产需要经过认证的工人,除非维护,否则认证会衰减,培训消耗的工时与生产现在需要的工时相同。 我们研究一个闭环技能约束模型预测...
arXiv: 2606.17266v1公告类型:新 摘要:生产计划越来越多地将劳动力能力视为决策变量:如果技能得不到维护,认证就会失效,新产品需要当前劳动力不具备的技能,而再培训则需要与生产相同的工作时间。 现有的运营基准通常将劳动力视为外源性,而...
arXiv: 2606.17220v1公告类型:新 摘要:由于法律语言的复杂性以及查询和相关案件之间需要精确的词汇一致性,法律案件检索仍然具有挑战性。 尽管密集检索模型取得了显著进展,但实证研究表明, BM25继续作为该领域的强基线。 它激励我们提出自我进化……
arXiv: 2606.17209v1公告类型:新 摘要:代理搜索的测试时间缩放通常会增加深度(即每个轨迹的更多回合和令牌)或广度(即更多并行推出)。 在这里,我们侧重于宽度缩放,显示标准并行采样产生的回报递减,在第一回合追踪到查询冗余。 当模型发出类似的第一个查询时...
我以学士学位毕业于前3名CS课程,经历了一个艰难的招聘季节。我在一家税务软件公司获得了人工智能产品工程师的全职录用,他们正试图成为更原生的人工智能。它本质上是一个PM + AI工程角色。从长远来看,我很乐意在前沿实验室工作,或者在人工智能初创公司担任研究/更多技术职务。所以,我应该接受这个提议还是……
我还不太精通机器学习。我知道“注意力是你所需要的”是基于当时几个高端游戏GPU所做的工作。我可以负担得起。假设我有能力重新创建最先进的结果,如果我可以访问所需的硬件,我是否仍然需要访问大量的硬件......
大家好,我有一个相当弱的本科生:来自普通尼日利亚大学的计算机工程专业的3.3/5 GPA。对于我的硕士学位,我在一所普通的欧洲大学学习人工智能,在那里我完成了8/10的GPA。我的硕士论文的精简版最近被ACL 2026录取, meta-review得分为8/10 ,置信度得分为5/5。预定时间是……
Microsoft Research预印本Next-token预测是近视的。如果变压器学会预测自己的下一个潜伏状态呢? Microsoft Research推出了Next-Latent Prediction ( NextLat ) :一种自我监督的学习方法,教变压器形成紧凑的世界模型进行推理和规划。它还可以通过自我投机解码解锁高达3.3倍的推理速度!在next-toke之上……
Kimi K2.7 Code 已开放权重,定位长程编码智能体模型。它沿用 K2.6 架构,给出 1T 总参数、32B 激活参数、256K 上下文和 MoonViT 视觉编码器;性能数据仍缺少独立复现,需要开发者在真实仓库里长测。K2.7 Code 把更新焦点压到编码 Agent月之暗面这次不是只给 Kimi K2 系列补一个小版本号。Kimi K2.7 Code 的定位很窄:coding-focused agentic model,面向端到端软件工程任务,而不是通用聊天。模型建立在 Kimi K2.6 之上,架构仍是 MoE。当前公开规格是:1T 总参数、32B 激活参数、61 层、384 个...
Anthropic 暂停 Claude Fable 5 与 Mythos 5 访问,导火索是美国政府针对外国用户使用先进模型的限制指令。公开信息仍缺少完整官方原文,但核心信号已经清楚:AI 出口管制正在从芯片、算力和云服务,推进到模型访问本身。Fable 5 刚开放就被按下暂停键Claude Fable 5 的生命周期被拉得很短。它在本周刚作为 Anthropic 面向更广用户开放的 Mythos 级模型出现,随后又因为美国政府指令被暂停访问。受影响的不只是普通用户,限制口径还覆盖外国个人和实体,甚至包括身在美国境内的外国国民。Anthropic 选择统一下线,而不是只做地区或身份分流。这个动...
Kimi 智能助手在 2026 年 6 月 12 日宣布 Kimi 信用卡开放预约,官方称其为“AI 原生信用卡”。目前确定的信息是:消费积分可兑换 Kimi 算力额度、Agent 使用额度和高级功能权限;具体申领条件、审核标准、合作银行和兑换比例仍未公布。Kimi 把会员权益包装进信用卡6 月 12 日,Kimi 智能助手官方微信公众号发布《全球首张 AI 原生信用卡!开放预约!》,宣布 Kimi 信用卡开启预约。官方给出的定位不是传统联名卡,而是把 AI 服务放进信用卡权益体系:持卡人的消费积分可转化为 Kimi 算力额度,并用于兑换 Agent 使用额度、高级功能权限等。这句话里真正有信...
Google 在 6 月 9 日发布 Gemini 3.5 Live Translate,定位为实时语音到语音翻译音频模型。官方称其支持 70 多种语言、2000 多种语言组合,并开始接入 API、Google Translate 和 Meet。不是翻译按钮,而是连续语音流模型Google 把 Gemini 3.5 Live Translate 定义为“latest audio model”,不是 Google Translate 里的一个普通 UI 更新。它面向的是 speech-to-speech translation:输入连续语音流,输出另一种语言的语音,同时保留说话人的语调、节奏和音...
Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5,把此前只在 Project Glasswing 中受限开放的 Mythos 级能力推向通用用户。它的关键信息不是“更强”,而是 1M 上下文、128k 输出、每百万输入 10 美元、每百万输出 50 美元,以及高风险请求会回退到 Claude Opus 4.8。Fable 5 是通用版 MythosAnthropic 将 Claude Fable 5 定义为“面向通用用户安全开放的 Mythos-class 模型”。官方说明里,Mythos-class 位于 Opus class 之上;4 月先通过 Pro...
Google 在 6 月 8 日升级 NotebookLM:默认底座转向 Gemini 3.5 与 Antigravity,给每个 notebook 配置安全云端计算机,可运行代码、生成文件,并从聊天中补全来源库。现阶段面向 Google AI Ultra 和部分 Workspace 商业客户开放。NotebookLM 开始承担执行型研究任务Google 官方博客把这次更新定义为 NotebookLM 的“agentic capabilities”升级。具体变化有三项:聊天体验接入 Gemini 3.5 与 Antigravity;每个 notebook 配置安全云端计算机,可以写代码、运行代...
Google AI Plus 不是简单从9.99美元降到4.99美元,而是出现了更细的订阅分层:入门档价格下探,2TB 档位继续以9.99美元出现在 Google One 官网。入门 AI Plus 降到 4.99 美元6月8日,Google AI Plus 入门订阅将从美国区 7.99 美元/月降至 4.99 美元/月,包含储存空间从 200GB 提高到 400GB。价格下调会在用户下一次续费时生效,储存扩容则在未来几天内陆续推出。这个变化的信号不在“便宜了3美元”本身,而在 Google 开始把消费级 AI 订阅压到 5 美元附近。ChatGPT Plus、Claude Pro、Googl...
Kimi Code 这轮“焕新升级”的主线不是模型参数,而是开发者工具本身重写:新版 CLI 从 Python/uv 迁到 Node.js,配置格式、终端 UI、插件、子 Agent、目标队列和 ACP 接入都在 5 月末到 6 月初密集更新。新版 CLI 从 Python/uv 切到 Node.jsKimi Code 官方迁移文档把这次升级定义为“重大版本升级”:CLI 底层从 Python/uv 迁移到 Node.js,旧版将逐渐停止维护。官方给出的直接收益是安装链路更简单、启动更快、终端界面重新设计。这不是简单改安装脚本。新版数据目录、配置文件和会话结构与旧版不同。官方文档说明,第一次运...
微信开放平台公布小程序接入微信 AI 生态的指引。开发者需要在「小程序管理后台 - AI 能力」主动授权,平台提供自动模式和开发模式;功能仍处于内测阶段,目前用户侧暂不能体验。微信开放平台面向小程序开发者开放接入微信 AI 生态的能力。接入不是默认开启,开发者需要进入「小程序管理后台 - AI 能力」主动授权。这点决定了它不是简单的模型 API 接入,而是微信把 AI 助手与小程序运行、页面理解、审核链路放在同一个平台能力里处理。微信方面同时强调,是否接入由开发者自主决定,不影响现有小程序服务。自动模式让平台读取源码并分析页面自动模式的核心是低开发成本。开发者授权后,平台会在提审时读取小程序源...
WorkBuddy 的邀请积分活动开始在用户社区扩散。腾讯云开发者社区文章称,用户通过邀请链接带来新注册后,邀请人与新用户双方各得 500 积分;但截至发稿,WorkBuddy 官方落地页没有单独披露邀请活动细则。积分体系是 WorkBuddy 增长入口WorkBuddy 采用积分消耗制,积分与模型调用、任务规划和自动化执行成本相关。用户社区对积分的关注,来自两个直接约束:一是桌面 Agent 任务往往不是单轮问答,执行链路会持续消耗额度;二是 WorkBuddy 把专家中心、技能市场、跨平台连接和云服务能力打包到同一个工作台,积分余额会直接影响用户尝试频率。官方 WorkBuddy 落地页确...