📰 每日 AI 资讯

2026年06月30日

最后更新:2026-06-30 08:01:36 UTC+8

🔹 Hacker News

微代理:通过模型 API 内部协作击败前沿模型

文章网址: https://vllm.ai/blog/2026-06-29-micro-agent-frontier-models 评论网址: https://news.ycombinator.com/item?id=48722802 积分: 44 #评论: 13

📅 Mon, 29 Jun 2026 🔗 原文链接

JumpServer:开源特权访问管理

Article URL: https://github.com/jumpserver/jumpserver Comments URL: https://news.ycombinator.com/item?id=48723677 积分:48 # 评论: 14

📅 Mon, 29 Jun 2026 🔗 原文链接

.self:旨在支持自托管的新顶级域名

文章网址: https://hccf.onmy.cloud/2026/06/21/reclaiming-our-digital-selves-hccfs-vision-for-a-human-centered-top-level-domain/ 评论网址: https://news.ycombinator.com/item?id=48724230 积分: 241 #评论: 149

📅 Mon, 29 Jun 2026 🔗 原文链接

科学家发现液态水中两种结构的分子水平证据

Article URL: https://phys.org/news/2026-06-scientists-molecular-evidence-liquid.html Comments URL: https://news.ycombinator.com/item?id=48726073 积分:33 # 评论: 6

📅 Mon, 29 Jun 2026 🔗 原文链接

韩国将花费 1T 美元增加存储芯片生产和人形机器人

Article URL: https://arstechnica.com/ai/2026/06/south-korea-to-spend-1t-on-more-memory-chip-production-and-humanoid-robots/ Comments URL: https://news.ycombinator.com/item?id=48726102 积分:48 # 评论: 14

📅 Mon, 29 Jun 2026 🔗 原文链接

🔹 arXiv 人工智能

DysLexLens:用于分析诵读困难学习者在线论坛见解的低资源法学硕士框架

arXiv:2606.27619v1 公告类型:新 摘要:阅读困难的学习者越来越多地使用人工智能(AI)工具来支持阅读、写作、组织和学习相关的任务。然而,他们使用这些工具的生活经验在很大程度上仍然没有得到充分的审视。本文提出了 DysLexLens,这是一种低资源 LLM 框架,旨在通过在线分析阅读障碍学习者的 AI 体验...

📅 Mon, 29 Jun 2026 🔗 原文链接

奥德赛:构建可验证的本地保存真相的基础模型

arXiv:2606.27593v1 公告类型:新 Abstract: We introduce a categorical framework called ODYSSEY for constructing verifiable, local truth-preserving foundation models as compositions of foundries: building-block architectural components that specify a cover of local contexts, local representation families, ...

📅 Mon, 29 Jun 2026 🔗 原文链接

内化未来:世界模型规划的统一代理训练范式

arXiv:2606.27483v1 公告类型:新 摘要:大语言模型(LLM)智能体在顺序决策方面表现出了强大的能力,但它们在长期任务中仍然基本上是反应性的。与在承诺之前使用“假设”推理来评估潜在计划的人类不同,标准代理缺乏内部世界模型来模拟未来的结果。 Therefore, we propose...

📅 Mon, 29 Jun 2026 🔗 原文链接

人格构成何时对多代理 LLM 团队很重要?

arXiv:2606.27443v1 公告类型:新 摘要:个性提示决定了大型语言模型的沟通方式,但这些行为转变是否影响客观任务结果仍有待探索。 Prior work shows that agents prompted with low agreeableness produce adversarial language, while those prompted with high agreeableness become cooperative, but the relationship between communi...

📅 Mon, 29 Jun 2026 🔗 原文链接

人工智能模型网络:概念、现状和未来

arXiv:2606.27382v1 公告类型:新 摘要:计算机的主要功能在于计算和处理,而互联网的核心价值则植根于共享和协作。计算机创造了互联网,互联网又赋能了计算机的价值。互联网、云计算、大数据的快速发展,正在推动人工智能进入大...

📅 Mon, 29 Jun 2026 🔗 原文链接

🔹 Reddit 机器学习

实例表示学习中的损失函数[R]

在Wu等人中,由于数据集中的图像数量较多, MLE目标在计算上是不可行的。非参数Softmax负对数似然对于大n , ( 2 )中的分母很难计算。因此,他们使用NCE (噪声对比估计)。NCE目标本质上,它们近似于( 3 )中的困难损失,更易于计算( 7 )中的损失。然而,我们……

📅 2026-06-29 23:34 🔗 原文链接

Cerebras OpenAI 交易能力实际上已经消除了其他所有人的候补名单 [D]

我很生气。我们是一家小型人工智能初创公司,致力于构建实时编码代理。我们的 p95 延迟要求很严格(并且是自我强加的,但这就是产品)。我们需要每秒约 1-2k 个令牌的持续高吞吐量推理。几个月来一直在 Cerebras 等待名单上尝试获取 API 访问权限。我们不进行培训,因此不需要 H100 仓库。 We need fast, high-throughput ASIC infer...

📅 2026-06-29 12:00 🔗 原文链接

EML 树是通用逼近器 [R]

嘿! EML 函数最近在互联网上作为一种“酷技巧”流传开来,它允许通过组合来表示所有基本函数。作为一种数学好奇心,我们证明了 EML(类型)树的通用逼近定理。 Intuitively, one expects that if elementary functions can be presented by compositions of EMLs, then so too can polynomials, and polynomials ...

📅 2026-06-29 11:16 🔗 原文链接

Google 的代理同行评审员在 ICML/STOC 处理了约 10,000 篇论文 — 正式研究论文现已发布 [R]

谷歌在两个顶级计算机科学会议上部署了一位代理人工智能同行审稿人,在 30 分钟的时间内审阅了约 10,000 篇论文,新的正式研究论文显示,它比零样本提示多发现了 34% 的数学错误;会议规模的人工智能自动科学审查的先例已经确立,现已正式记录。 -- Source: https://arxiv.org/abs/2606.28277 submitted by /...

📅 2026-06-29 10:05 🔗 原文链接

🔹 51AllAI

DeepSeek发布DSpark,为V4加入推测解码加速

DeepSeek 把 DSpark 放到了 DeepSeek-V4 的发布链路里:它面向 Pro 和 Flash 两个检查点,核心目标是用推测解码压低生成延迟。这不是新基座模型发布,更接近一次推理系统侧的加速更新。DSpark改的是解码,不是模型定位DSpark 的位置需要先说清楚:它不是 DeepSeek-V4 之外的新一代大模型,而是给 DeepSeek-V4 Pro 和 DeepSeek-V4 Flash 配套的推测解码模块。推测解码的基本思路很直接。先让一个更轻的草稿模块连续猜出若干 token,再由主模型批量校验。猜对的 token 可以一次性通过,猜错就回退到主模型正常生成。理想情...

📅 2026-06-28 08:18 🔗 原文链接

豆包推出专业版,办公任务进入付费额度体系

豆包专业版不只是把聊天助手加上会员入口。付费协议已经把会员、云存储和体系内产品消耗写进同一套规则,办公任务模式更像是把 PPT、文档、数据分析等高算力任务统一纳入额度管理。专业版从灰度测试走向正式付费豆包 iOS 端当前版本为 13.9.0,更新时间是 2026 年 6 月 23 日。App Store 页面已经把付费订阅写进产品描述:基础版免费,标准版连续包月 68 元、连续包年 688 元;加强版连续包月 200 元、连续包年 2048 元;专业版连续包月 500 元、连续包年 5088 元。这和 5 月初的灰度测试相比,变化不在价格,而在产品边界更清楚。豆包付费服务协议在 2026 年 ...

📅 2026-06-24 04:09 🔗 原文链接

字节跳动发布 Seed2.1,强化 Agent、Coding 与多模态生产力

字节跳动发布 Seed2.1 系列,已接入豆包、TRAE 和火山方舟。新版本把重点从静态榜单转向真实工作流:通用 Agent、Coding Agent、多模态理解和模型研发自动化。现阶段关键 benchmark 仍主要来自发布材料,需要等独立评测复现。Seed2.1 已进入豆包、TRAE 和火山方舟字节跳动 Seed 团队发布 Seed2.1 系列模型,定位是面向真实生产力场景的智能体模型。可用渠道已经明确:豆包产品、TRAE Work、TRAE IDE,以及火山方舟体验中心和 API。模型选择里出现的是 Doubao-Seed-2.1-Pro 和 Doubao-Seed-2.1-Turbo。...

📅 2026-06-23 12:41 🔗 原文链接

Codex 推出 Record & Replay,把本地操作录成可复用技能

Codex 的 Record & Replay 不是简单录屏回放,而是把一次本地工作流示范转成可复用 skill。它适合稳定、重复、偏个人偏好的 macOS 操作;当前可用性受地区、Computer Use 开关和组织策略限制。录一次操作,产物是 skillRecord & Replay 的核心产物不是视频,也不是按坐标重放的宏脚本,而是一份 Codex skill。用户先在 Mac 上示范一个已经知道怎么完成的流程。Codex 观察完成任务所需的操作和窗口内容,录制停止后再把这段流程整理成 skill:什么时候触发、需要哪些输入、按什么步骤执行、最后怎么验证结果。这和普通提示词的差别在于,s...

📅 2026-06-19 14:03 🔗 原文链接

OpenAI 放开 Codex 模型供应商,本地工作流可接第三方模型

OpenAI Codex 的模型供应商边界变了:本地工作流可以指向支持 Responses 或 Chat Completions 的模型与供应商。真正需要看清的是限制条件:Chat Completions 兼容已进入弃用路径,云端任务暂时不能改默认模型。Codex 不再只绑定默认 OpenAI 路径Codex 现在把模型选择拆成两层:model 决定调用哪个模型,model_provider 决定请求发往哪个供应商。默认仍是 OpenAI,但本地配置里可以新增供应商,写入 base URL、认证环境变量、请求头,以及线缆协议。这对开发者的实际影响很直接。过去 Codex 更像一个围绕 Open...

📅 2026-06-18 01:54 🔗 原文链接

月之暗面开源 Kimi K2.7 Code,强化长程编码任务

Kimi K2.7 Code 已开放权重,定位长程编码智能体模型。它沿用 K2.6 架构,给出 1T 总参数、32B 激活参数、256K 上下文和 MoonViT 视觉编码器;性能数据仍缺少独立复现,需要开发者在真实仓库里长测。K2.7 Code 把更新焦点压到编码 Agent月之暗面这次不是只给 Kimi K2 系列补一个小版本号。Kimi K2.7 Code 的定位很窄:coding-focused agentic model,面向端到端软件工程任务,而不是通用聊天。模型建立在 Kimi K2.6 之上,架构仍是 MoE。当前公开规格是:1T 总参数、32B 激活参数、61 层、384 个...

📅 2026-06-13 10:35 🔗 原文链接

Anthropic 暂停 Claude Fable 5 访问,美国出口管制伸向模型层

Anthropic 暂停 Claude Fable 5 与 Mythos 5 访问,导火索是美国政府针对外国用户使用先进模型的限制指令。公开信息仍缺少完整官方原文,但核心信号已经清楚:AI 出口管制正在从芯片、算力和云服务,推进到模型访问本身。Fable 5 刚开放就被按下暂停键Claude Fable 5 的生命周期被拉得很短。它在本周刚作为 Anthropic 面向更广用户开放的 Mythos 级模型出现,随后又因为美国政府指令被暂停访问。受影响的不只是普通用户,限制口径还覆盖外国个人和实体,甚至包括身在美国境内的外国国民。Anthropic 选择统一下线,而不是只做地区或身份分流。这个动...

📅 2026-06-13 04:20 🔗 原文链接

Kimi 信用卡开启预约,消费积分可换算力额度

Kimi 智能助手在 2026 年 6 月 12 日宣布 Kimi 信用卡开放预约,官方称其为“AI 原生信用卡”。目前确定的信息是:消费积分可兑换 Kimi 算力额度、Agent 使用额度和高级功能权限;具体申领条件、审核标准、合作银行和兑换比例仍未公布。Kimi 把会员权益包装进信用卡6 月 12 日,Kimi 智能助手官方微信公众号发布《全球首张 AI 原生信用卡!开放预约!》,宣布 Kimi 信用卡开启预约。官方给出的定位不是传统联名卡,而是把 AI 服务放进信用卡权益体系:持卡人的消费积分可转化为 Kimi 算力额度,并用于兑换 Agent 使用额度、高级功能权限等。这句话里真正有信...

📅 2026-06-12 15:23 🔗 原文链接

Google发布Gemini 3.5 Live Translate,实时语音翻译覆盖70多种语言

Google 在 6 月 9 日发布 Gemini 3.5 Live Translate,定位为实时语音到语音翻译音频模型。官方称其支持 70 多种语言、2000 多种语言组合,并开始接入 API、Google Translate 和 Meet。不是翻译按钮,而是连续语音流模型Google 把 Gemini 3.5 Live Translate 定义为“latest audio model”,不是 Google Translate 里的一个普通 UI 更新。它面向的是 speech-to-speech translation:输入连续语音流,输出另一种语言的语音,同时保留说话人的语调、节奏和音...

📅 2026-06-10 10:43 🔗 原文链接

Anthropic发布Claude Fable 5,Mythos级模型首次面向通用用户

Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5,把此前只在 Project Glasswing 中受限开放的 Mythos 级能力推向通用用户。它的关键信息不是“更强”,而是 1M 上下文、128k 输出、每百万输入 10 美元、每百万输出 50 美元,以及高风险请求会回退到 Claude Opus 4.8。Fable 5 是通用版 MythosAnthropic 将 Claude Fable 5 定义为“面向通用用户安全开放的 Mythos-class 模型”。官方说明里,Mythos-class 位于 Opus class 之上;4 月先通过 Pro...

📅 2026-06-10 01:58 🔗 原文链接