2026年06月09日
最后更新:2026-06-09 08:04:34 UTC+8
文章网址: https://signal.org/blog/pdfs/2026-06-08-uk-surveillance-is-not-safety.pdf 评论网址: https://news.ycombinator.com/item?id=48450646 积分: 325 #评论: 97
文章网址: https://cognition.ai/blog/frontier-code 评论网址: https://news.ycombinator.com/item?id=48451723 积分: 72 #评论: 15
文章网址: https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will-woo-small-developers/ 评论网址: https://news.ycombinator.com/item?id=48452000 积分: 7 #评论: 1
文章网址: https://openai.com/index/openai-submits-confidential-s-1/ 评论网址: https://news.ycombinator.com/item?id=48452317 积分: 218 评论数: 130
HN ,您好!我是Mach ( https://github.com/octalide/mach或https://machlang.org )的创建者。两天前,我们终于实现了完全自助出租。我想在这里发帖展示这种语言,因为这对我们来说是一个重要的里程碑。# # TL; DR为那些好奇的人介绍这种语言: -在管道中的任何地方都没有外部依赖关系。这包括LLVM、libc绑定或任何分类...
arXiv: 2606.06526v1公告类型:新 摘要:大型语言模型在数学推理方面取得了实质性进展,但现有基准通常通过最终答案、逐步解决方案或完整证明来评估明确规定的问题。 他们没有捕捉到协作的开放式问题解决:参与者提出部分论点,找出差距或错误的设置...
arXiv: 2606.06523v1公告类型:新 摘要:装备大型语言模型( LLM )以执行可靠的多步骤工作流已成为人工智能的核心挑战。 尽管LLM的代理功能最近取得了进展,但大多数代理系统仍然缺乏指定、验证和调试其工作流和执行轨迹的正式方法。 这个挑战反映了一个孤独的...
arXiv: 2606.06519v1公告类型:新 摘要:开放式权重LLM越来越多地被微调为定制助手,但下游微调会削弱安全对齐,使模型更容易受到恶意提示的影响,即使训练数据并非故意有害。 这会产生一个反复出现的安全恢复问题,因为目标模型会反复更新新的任务数据或...
arXiv: 2606.06518v1公告类型:新 摘要:数独是一个具有代表性的约束满足问题,需要在严格的离散约束下进行全局结构推理。 现有的解决数独的工作主要集中在两种主要方法上,即传统的启发式和深度学习求解器。 然而,它们有两个互补的局限性:基于学习的求解器缺乏...
arXiv: 2606.06514v1公告类型:新 摘要:部署在高风险社会经济环境中的机器学习系统通常会显示出偏见。 我们将偏差形式化为对称打破运算:如果分类器的输出在切换敏感属性的反事实运算下保持不变,则分类器是公平的,优点特征保持不变。 我们将基于损失的正则化作为一种符号来实现...
编辑:针对中国研究人员的原始帖子已被MODS删除。很抱歉给您带来困扰。是的,我要大声说出来。这是种族主义。作为r/MachineLearning的活跃成员和华裔研究人员,我对占该领域一半以上的研究人员群体的毫无根据的指控感到厌恶。这样的帖子每隔一周就会出现,以阴谋论为基础……
我被应用数学专业的UPS和TUD录取了,我想听听关于哪一个更好的建议。就上下文而言,我想从事某种形式的人工智能研究,最有可能在行业内。目前,我最感兴趣的是隐私保护机器学习或机械可解释性。你认为哪一个会在……之后给我留下更好的职业机会
ArXiv有代言系统是有原因的。我只会为我与之有直接学术合作或指导关系的人提供代言,因为我将自己的学术声誉置于风险之中。这也是我所知的几乎所有严肃的学术研究人员的标准。现在, ArXiv正在努力打击AI SLOP ,并禁止帐户上传低质量的研究论文,我...
作为工作流程的一部分,我对生成图像模型进行评估,主要是比较不同架构的一致性、及时遵守和构图准确性。这里的共识似乎是,开放模型仍然落后于封闭的API。根据我最近的基准,这个差距比人们想象的要小得多。特别是在成分控制方面,最新的开放检查...
提交者/u/ThereWas [link] [comments]
提交者/u/techhunter_2026 [link] [comments]
在尝试改进工作流程时,有一件事我没有想到:实际任务并不是花费大部分时间的事情。所有的上下文都围绕着它们进行切换。比如: -在工具之间跳转只是为了完成一个小步骤-将数据从一个地方复制到另一个地方-停止你正在做的事情来处理重复的事情-切换回去并找出你离开的地方Individua...
这是一家中型初创公司的PM。直到本周才真正注意到情况有多糟糕。我现在的工作流程: Claude for ideation ChatGPT for rewriting specs Cursor for implementation Perplexity for research Notion AI for docs Atoms AI for larger tasks这些工具都没有真正取代我的工作。他们只是重新分配了它。我仍然是所有人之间拖动的上下文。昨天我真的……
我经常看到越来越多的公司允许人工智能代理访问真实的内容,如电子邮件、数据库、内部工具、客户数据等。奇怪的是它现在开始感觉如何正常。不久前,每个人都担心聊天机器人会给出错误的答案。现在我们基本上就像是,当然,继续为我们做事情。我不知道当你真正想到的时候,跳跃感觉有点大……
Kimi Code 这轮“焕新升级”的主线不是模型参数,而是开发者工具本身重写:新版 CLI 从 Python/uv 迁到 Node.js,配置格式、终端 UI、插件、子 Agent、目标队列和 ACP 接入都在 5 月末到 6 月初密集更新。新版 CLI 从 Python/uv 切到 Node.jsKimi Code 官方迁移文档把这次升级定义为“重大版本升级”:CLI 底层从 Python/uv 迁移到 Node.js,旧版将逐渐停止维护。官方给出的直接收益是安装链路更简单、启动更快、终端界面重新设计。这不是简单改安装脚本。新版数据目录、配置文件和会话结构与旧版不同。官方文档说明,第一次运...
微信开放平台公布小程序接入微信 AI 生态的指引。开发者需要在「小程序管理后台 - AI 能力」主动授权,平台提供自动模式和开发模式;功能仍处于内测阶段,目前用户侧暂不能体验。微信开放平台面向小程序开发者开放接入微信 AI 生态的能力。接入不是默认开启,开发者需要进入「小程序管理后台 - AI 能力」主动授权。这点决定了它不是简单的模型 API 接入,而是微信把 AI 助手与小程序运行、页面理解、审核链路放在同一个平台能力里处理。微信方面同时强调,是否接入由开发者自主决定,不影响现有小程序服务。自动模式让平台读取源码并分析页面自动模式的核心是低开发成本。开发者授权后,平台会在提审时读取小程序源...
WorkBuddy 的邀请积分活动开始在用户社区扩散。腾讯云开发者社区文章称,用户通过邀请链接带来新注册后,邀请人与新用户双方各得 500 积分;但截至发稿,WorkBuddy 官方落地页没有单独披露邀请活动细则。积分体系是 WorkBuddy 增长入口WorkBuddy 采用积分消耗制,积分与模型调用、任务规划和自动化执行成本相关。用户社区对积分的关注,来自两个直接约束:一是桌面 Agent 任务往往不是单轮问答,执行链路会持续消耗额度;二是 WorkBuddy 把专家中心、技能市场、跨平台连接和云服务能力打包到同一个工作台,积分余额会直接影响用户尝试频率。官方 WorkBuddy 落地页确...
6 月 5 日,Reddit 的 r/codex、r/OpenAI 和 r/ChatGPT 出现多条 OpenAI / ChatGPT / Codex 账号被停用的反馈。当前可确认的是社区反馈密集出现,且部分用户称收到“误停用后恢复”的邮件;OpenAI 状态页尚未把它列为账号封禁事故。社区反馈集中在 Codex 与付费账号这轮反馈最密集的位置不是传统媒体,而是 Reddit 的 Codex 用户社区。多条帖子在 6 月 5 日集中出现,描述相似:账号被 deactivated、disabled 或 banned,邮件理由笼统,用户无法确认具体触发项。受影响者的自述覆盖几类场景:Pro 账号、...
月之暗面 Kimi 发布桌面端产品 Kimi Work,定位知识工作者的本地 Agent。官方页面把能力集中在本地文件、WebBridge 浏览器自动化、Cron 定时任务、Agent Swarm、PPT/Excel 交付和金融数据接入。Kimi Work 从网页问答转向本地执行Kimi Work 不是网页版 Kimi 的外壳。官方 FAQ 给出的区分很明确:网页版 Kimi 主要负责轻量对话问答,Kimi Work 则是桌面本地 Agent,能读取用户授权的本地文件夹、操控浏览器、后台运行 Python 代码,并支持定时任务。这把 Kimi 的入口从聊天窗口推到操作系统侧。官方页面给出的示例...
OpenAI 在 2026 年 6 月 2 日发布 Codex 重大更新,把重点从编程代理扩展到白领工作流。官方称,新推出的六类角色插件合计包含 62 个应用和 110 个技能,并加入 Sites 和内容批注能力。Codex 的目标人群被重新定义OpenAI 这次没有把 Codex 包装成更强的代码补全工具。官方博客开头给出的信号很直接:Codex 周活跃用户超过 500 万,非开发者约占整体用户的 20%,增长速度是开发者的 3 倍以上。这组数据来自 OpenAI 自述,Axios 也在报道中引用了同一口径,并补充称知识工作者中增长最快的任务包括数据分析、研究,以及报告、备忘录、文档、合同、...
豆包付费内容的时间表从“测试中”推进到“预计6月下旬上线”。目前可确认的是 App Store 订阅声明和官方“基础免费、增值服务测试中”的回应;6月下旬窗口、Force 大会更新和三季度电商联动,仍来自媒体转述知情人士。豆包预计将在 6 月下旬正式上线付费内容,并在同期举行的 Force 大会上更新相关功能。报道给出的原因是,PC 端与移动端仍需约一个月完成基础功能和收费体系适配。三档价格已经曝光,基础免费口径未变此前 App Store 页面披露的三档订阅为:档位连续包月连续包年标准版68 元/月688 元/年加强版200 元/月2048 元/年专业版500 元/月5088 元/年豆包官方...
MiniMax M3 已在官方页面和第三方 API 平台上线。官方把它定位为首个同时覆盖编程智能体、百万上下文和原生多模态的开源权重前沿模型,但截至发稿,权重与技术报告仍是“约 10 天内发布”的承诺,不能等同于权重已经公开可下载。发布重点不是单一榜单,而是三项能力打包MiniMax 在官方发布页中给 M3 的主标题是“Frontier Coding, 1M Context, Native Multimodality”。这三项分别对应编程与智能体任务、最高 100 万 token 上下文,以及从训练阶段开始的原生多模态能力。这也是本次发布的核心卖点:不是只做长上下文模型,也不是只做编程模型,而...
OpenAI 将 Codex Open Source Fund 扩展为面向开源维护者的申请制项目。入选者可获得 6 个月 ChatGPT Pro、项目 API 额度,以及按仓库需求评估的 Codex Security 访问权;目前核心信息来自 OpenAI 官方页面。计划从 API 额度扩展到维护者工具包OpenAI 开发者社区页显示,Codex for Open Source 面向开源维护者开放申请。项目不是新的开源模型发布,而是给维护者提供 Codex 相关工具和额度,覆盖日常编码、问题分类、代码审查、维护自动化和发布流程。官方页面同时提到,过去一年 Codex Open Source F...
CC Switch v3.16.0 把 Codex 的第三方供应商能力补上了关键一环:本地代理可将 Codex Responses 请求转换为 Chat Completions,再把响应重建回 Responses 形态。它解决的是协议适配问题,不是模型能力本身的保证。Codex 不再只等 Responses 上游CC Switch 在 2026 年 5 月 29 日发布 v3.16.0。发布说明把首要更新放在 Codex Chat Completions 路由:Codex 供应商现在可以由只支持 OpenAI Chat Completions API 的上游提供服务。这层代理做三件事:把 Co...