2026年06月25日
最后更新:2026-06-25 08:08:05 UTC+8
公告: https://openai.com/index/openai-broadcom-jalapeno-inference-... https://decrypt.co/371971/openai-broadcom-jalapeno-first-cus... https://www.cnn.com/2026/06/24/tech/openai-broadcom-jalapeno... 评论网址: https://news.ycombinator.com/item?id=48663324 积分: 462 评论数: 296
文章网址: https://www.thomann.de/blog/en/inside/thomann-takes-legal-action-against-fender/ 评论网址: https://news.ycombinator.com/item?id=48664384 积分: 171 #评论: 107
文章网址: https://infosec.exchange/ @ mttaggart/116806641273303255 评论网址: https://news.ycombinator.com/item?id=48664733 积分: 132 评论数: 42
文章网址: https://www.elastic.co/blog/ceo-ash-kulkarni-announcement-to-elastic-employees 评论网址: https://news.ycombinator.com/item?id=48666100 积分: 91 #评论: 72
文章网址: https://gist.github.com/cpursley/c8fb81fe8a7e5df038158bdfe0f06dbb 评论网址: https://news.ycombinator.com/item?id=48666433 积分: 60 #评论: 28
arXiv: 2606.24014v1公告类型:新 摘要:随着人工智能系统部署在越来越多样化和高风险的环境中,模型对齐必须超越培训期间看到的任务和领域。 这对于强化学习( RL )尤其重要,因为强化学习会通过奖励黑客攻击、欺骗或其他意想不到的策略引入意想不到的错位。我们研究的是……
arXiv: 2606.24010v1公告类型:新 摘要:多智能体系统广泛应用于需要在严格安全约束下协调行为的安全关键应用中。 现有的方法面临着一个基本的权衡:基于学习的方法实现了强大的实证性能,但缺乏理论上的安全保障,而控制理论方法强制执行安全性,但往往会导致...
arXiv: 2606.23991v1公告类型:新 摘要:什么是代理? 什么是代理?随着大型语言模型( LLM )系统的兴起,这些系统被称为“编码代理”、“人工智能共同科学家”和其他“代理”工具,承诺提高生产力,同时“存在”的担忧,例如人工智能在投机时代下以破坏性的力量逃避人类的控制……
arXiv: 2606.23938v1公告类型:新 摘要:驱动包含思维链( CoT )推理的VLA模型具有吸引力,因为它们利用预先训练的VLM表示并以自然语言暴露中间决策,但目前的理论常常缺乏与计划的运动保持因果关系所需的分步决策语义。 我们介绍Neuro-Sy...
arXiv: 2606.23927v1公告类型:新 摘要:由大型语言模型( LLM )支持的代理人工智能系统正在迅速演变为自主决策系统,暴露出超出传统LLM漏洞的攻击向量。 现有的安全评估通常与特定的实现或域相关联,从而限制了跨异构系统的统一比较。要解决此问题...
我曾与大多数Anthropics LLM合作进行开发,但Opus 4.8给我带来了更多的悲伤和痛苦,它存在于它所做的每一件事情中-特别是在接近中等负荷的情况下,如果你在没有启发式约束的情况下进行确定性工作,你就不能相信任何事情。所以我不久前停止使用它,但今天我不得不进行容器重建,在VS它滑倒...
大家好, Sentient基金会正在推出一项开源AGI资助和投资计划,为开发人员、研究人员、开源维护人员、公共产品开发人员和初创公司提供4200万美元$的承诺。我们的论点很简单:现在正在构建的最重要的技术不应该最终由少数封闭的平台控制。几个同伴……
我们的一些客户注意到Inter-1 (我们的全模式社会信号模型)偶尔会“听到”不存在的报价。向它提供零音频的视频,并询问说了什么,它有时会报告: “是的,星期五五点。“一字不差,每次都一样。我们假设它必须被烘焙到某个地方的训练数据中,所以我们到处寻找: 30,960个带有日期的训练记录...
我一直在了解人工智能训练数据的短缺,而且没有人考虑到的一个方面是,可以使用的大部分潜在训练数据并不存储在任何数据库系统中,而是存储在已经存储在气候控制储物柜中几十年的旧磁带上。从80年代到2000年代,所有主要企业、政府办公室、医院、电视台...
提交者/u/BathroomMaximum1721 [link] [comments]
大家好!在过去的几周里,我一直在考虑MuJoCo的缺点,开发一个模拟器项目。人们喜欢和不喜欢MuJoCo的一些东西,比如对MuJoCo的CPU依赖性,这使得模拟无法并行化超过一定的限制(取决于硬件)。我知道存在GPU加速的MJX ,但是,它并不是真的...
在上一篇文章的最后,我提出了一个想法:如果我使用上一个项目的核心,即累积矩阵积,并将其重新用作位置嵌入,该怎么办?我刚刚完成了HDD-RoPE背后的数学运算,并用这种位置嵌入算法训练了一个模型,结果非常好。在数据集TinyStories上训练时,验证损失开始收敛于...
,您好!我已经创建了最重要的OCR基准的概述,以及热门开放模型,以及其论文和代码的链接: https://paperswithcode.co/tasks/ocr。本周,百度和Mistral发布了新的OCR模型。百度发布了无限OCR ,这是一种3B参数模型,引入了一项名为参考滑动窗口注意力( R-SWA )的关键创新,并建立在DeepSeek OC之上...
大家好,我为Generals.io培训了一名自玩强化学习代理,该代理达到了超人的水平,并在人类1v1排行榜上排名第一。它始于我的硕士论文,其目标是击败先前的基于算法的代理。我们成功地使用了行为克隆、RL微调和奖励塑造,但智能体仍然一直被顶级玩家击败。所以我给了它一个第二轮,并修复了...
豆包专业版不只是把聊天助手加上会员入口。付费协议已经把会员、云存储和体系内产品消耗写进同一套规则,办公任务模式更像是把 PPT、文档、数据分析等高算力任务统一纳入额度管理。专业版从灰度测试走向正式付费豆包 iOS 端当前版本为 13.9.0,更新时间是 2026 年 6 月 23 日。App Store 页面已经把付费订阅写进产品描述:基础版免费,标准版连续包月 68 元、连续包年 688 元;加强版连续包月 200 元、连续包年 2048 元;专业版连续包月 500 元、连续包年 5088 元。这和 5 月初的灰度测试相比,变化不在价格,而在产品边界更清楚。豆包付费服务协议在 2026 年 ...
字节跳动发布 Seed2.1 系列,已接入豆包、TRAE 和火山方舟。新版本把重点从静态榜单转向真实工作流:通用 Agent、Coding Agent、多模态理解和模型研发自动化。现阶段关键 benchmark 仍主要来自发布材料,需要等独立评测复现。Seed2.1 已进入豆包、TRAE 和火山方舟字节跳动 Seed 团队发布 Seed2.1 系列模型,定位是面向真实生产力场景的智能体模型。可用渠道已经明确:豆包产品、TRAE Work、TRAE IDE,以及火山方舟体验中心和 API。模型选择里出现的是 Doubao-Seed-2.1-Pro 和 Doubao-Seed-2.1-Turbo。...
Codex 的 Record & Replay 不是简单录屏回放,而是把一次本地工作流示范转成可复用 skill。它适合稳定、重复、偏个人偏好的 macOS 操作;当前可用性受地区、Computer Use 开关和组织策略限制。录一次操作,产物是 skillRecord & Replay 的核心产物不是视频,也不是按坐标重放的宏脚本,而是一份 Codex skill。用户先在 Mac 上示范一个已经知道怎么完成的流程。Codex 观察完成任务所需的操作和窗口内容,录制停止后再把这段流程整理成 skill:什么时候触发、需要哪些输入、按什么步骤执行、最后怎么验证结果。这和普通提示词的差别在于,s...
OpenAI Codex 的模型供应商边界变了:本地工作流可以指向支持 Responses 或 Chat Completions 的模型与供应商。真正需要看清的是限制条件:Chat Completions 兼容已进入弃用路径,云端任务暂时不能改默认模型。Codex 不再只绑定默认 OpenAI 路径Codex 现在把模型选择拆成两层:model 决定调用哪个模型,model_provider 决定请求发往哪个供应商。默认仍是 OpenAI,但本地配置里可以新增供应商,写入 base URL、认证环境变量、请求头,以及线缆协议。这对开发者的实际影响很直接。过去 Codex 更像一个围绕 Open...
Kimi K2.7 Code 已开放权重,定位长程编码智能体模型。它沿用 K2.6 架构,给出 1T 总参数、32B 激活参数、256K 上下文和 MoonViT 视觉编码器;性能数据仍缺少独立复现,需要开发者在真实仓库里长测。K2.7 Code 把更新焦点压到编码 Agent月之暗面这次不是只给 Kimi K2 系列补一个小版本号。Kimi K2.7 Code 的定位很窄:coding-focused agentic model,面向端到端软件工程任务,而不是通用聊天。模型建立在 Kimi K2.6 之上,架构仍是 MoE。当前公开规格是:1T 总参数、32B 激活参数、61 层、384 个...
Anthropic 暂停 Claude Fable 5 与 Mythos 5 访问,导火索是美国政府针对外国用户使用先进模型的限制指令。公开信息仍缺少完整官方原文,但核心信号已经清楚:AI 出口管制正在从芯片、算力和云服务,推进到模型访问本身。Fable 5 刚开放就被按下暂停键Claude Fable 5 的生命周期被拉得很短。它在本周刚作为 Anthropic 面向更广用户开放的 Mythos 级模型出现,随后又因为美国政府指令被暂停访问。受影响的不只是普通用户,限制口径还覆盖外国个人和实体,甚至包括身在美国境内的外国国民。Anthropic 选择统一下线,而不是只做地区或身份分流。这个动...
Kimi 智能助手在 2026 年 6 月 12 日宣布 Kimi 信用卡开放预约,官方称其为“AI 原生信用卡”。目前确定的信息是:消费积分可兑换 Kimi 算力额度、Agent 使用额度和高级功能权限;具体申领条件、审核标准、合作银行和兑换比例仍未公布。Kimi 把会员权益包装进信用卡6 月 12 日,Kimi 智能助手官方微信公众号发布《全球首张 AI 原生信用卡!开放预约!》,宣布 Kimi 信用卡开启预约。官方给出的定位不是传统联名卡,而是把 AI 服务放进信用卡权益体系:持卡人的消费积分可转化为 Kimi 算力额度,并用于兑换 Agent 使用额度、高级功能权限等。这句话里真正有信...
Google 在 6 月 9 日发布 Gemini 3.5 Live Translate,定位为实时语音到语音翻译音频模型。官方称其支持 70 多种语言、2000 多种语言组合,并开始接入 API、Google Translate 和 Meet。不是翻译按钮,而是连续语音流模型Google 把 Gemini 3.5 Live Translate 定义为“latest audio model”,不是 Google Translate 里的一个普通 UI 更新。它面向的是 speech-to-speech translation:输入连续语音流,输出另一种语言的语音,同时保留说话人的语调、节奏和音...
Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5,把此前只在 Project Glasswing 中受限开放的 Mythos 级能力推向通用用户。它的关键信息不是“更强”,而是 1M 上下文、128k 输出、每百万输入 10 美元、每百万输出 50 美元,以及高风险请求会回退到 Claude Opus 4.8。Fable 5 是通用版 MythosAnthropic 将 Claude Fable 5 定义为“面向通用用户安全开放的 Mythos-class 模型”。官方说明里,Mythos-class 位于 Opus class 之上;4 月先通过 Pro...
Google 在 6 月 8 日升级 NotebookLM:默认底座转向 Gemini 3.5 与 Antigravity,给每个 notebook 配置安全云端计算机,可运行代码、生成文件,并从聊天中补全来源库。现阶段面向 Google AI Ultra 和部分 Workspace 商业客户开放。NotebookLM 开始承担执行型研究任务Google 官方博客把这次更新定义为 NotebookLM 的“agentic capabilities”升级。具体变化有三项:聊天体验接入 Gemini 3.5 与 Antigravity;每个 notebook 配置安全云端计算机,可以写代码、运行代...