2026年06月10日
最后更新:2026-06-10 08:04:53 UTC+8
文章网址: https://github.blog/changelog/2026-06-09-upcoming-breaking-changes-for-npm-v12/ 评论网址: https://news.ycombinator.com/item?id=48467705 积分: 137 #评论: 38
文章网址: https://www.404media.co/this-company-will-add-phone-airpod-and-smartwatch-trackers-to-license-plate-readers/ 评论网址: https://news.ycombinator.com/item?id=48467712 积分: 75 #评论: 22
文章网址: https://github.com/signalblur/exifsmugglingpoc 评论网址: https://news.ycombinator.com/item?id=48467759 积分: 42 #评论: 19
文章网址: https://jonready.com/blog/posts/claude-fable5-is-allowed-to-sabotage-your-app-if-youre-a-competitor.html 评论网址: https://news.ycombinator.com/item?id=48467896 积分: 321 评论数: 141
文章网址: https://blog.oscars.dev/posts/rip-software-hackathons-long-live-the-hardware-hackathon/ 评论网址: https://news.ycombinator.com/item?id=48468766 积分: 16 #评论: 2
arXiv: 2606.07720v1公告类型:新 摘要:大型语言模型( LLM )在数学和多跳规划任务方面表现出非凡的推理能力。 CoCoNuT (连续思维链)范式~\ cite {hao2024coconut}扩展了这一点,使模型能够在潜在空间中进行推理,同时探索多条推理路径,而不是致力于单链推理……
arXiv: 2606.07718v1公告类型:新 摘要: Agentic AI工具为科学研究管道中的软件开发瓶颈的自动化提供了一条有希望的途径,特别是对于需要领域专家数天到数月时间来构建的阶段,科学家们关心的是正确性和鲁棒性,而不是实施细节。 我们提出了一项关于通用编码代理的实证研究……
arXiv: 2606.07594v1公告类型:新 摘要:个人人工智能代理必须越来越多地跨API、shell、Web表面和桌面GUI运行,但许多系统仍然调整到单个界面,并为用户教学和可审核性提供有限的支持。 我们展示了Syll ,这是一个开源、自托管的多模式代理线束,它将MCP/API工具、CLI执行和可视化GUI控制统一在...
arXiv: 2606.07577v1公告类型:新 摘要:视听大型语言模型( LLM )对长视频理解有很强的希望,但其长视频推理从根本上受到视频令牌和键值( KV )缓存的线性增长的限制。 我们推出了OmniMem ,这是一个专为视听LLM设计的节省内存的流媒体框架。 不像现有的压缩我……
arXiv: 2606.07549v1公告类型:新 摘要:多模态大型语言模型( MLLM )和代理工作流程的最新进展已显示出计算病理学的强大前景,但可靠的补丁级推理仍然具有挑战性。 端到端病理MLM通常会产生形态学特征的幻觉,而最近的代理系统通常会将工具输出和检索到的知识合并为清晰的...
通过Claude或自定义GPT包装器预订差旅或支付订阅或进行采购,不再需要确认按钮。能力方面的问题大多已经解决。人们谈论不够的是,当它横向发展时会发生什么。存储在代理上下文中的卡意味着它可以访问整个会话。一个糟糕的工具通话,它正在外面花钱……
来自新闻稿:今天,我们推出了Claude Fable 5 :我们已安全用于一般用途的Mythos-class1模型。寓言5的功能超过了我们曾经推出的任何型号。它是几乎所有经过测试的人工智能能力基准的最先进技术,在软件工程、知识工作、愿景、科学研究和许多其他方面表现出卓越的性能……
提交者/u/Hot-Upstairs9603 [link] [comments]
好吧,所以我在扩展思维模式下使用Gemini 3.1 pro与画布模式来制作一个以铁路为主题的液态玻璃网站,它创造了我,但我看到它下面的另一个选项是“创建没有画布选项” ,它实际上产生了一些科幻故事的完全胡说八道,当我问它为什么这样回答时,它说: “我很抱歉造成混乱!那是一个com……
我刚刚从科学和公共政策的角度与克劳德就“百草枯” (一种农用化学品)进行了长时间的对话。我想讨论它的毒理学机制,为什么它很难治疗(如果有人喝它) ,目前的研究,农业法规(许多国家已经禁止这种化学物质,因为它毒性太大) ,更安全的除草剂,植物特异性生物化学......
从iOS模拟器的文件中找到。两者都是浓缩咖啡格式还有另一个编译的CoreML用于音乐会排名,根据其中的内容看起来像是一个简单的逻辑回归。请参阅https://www.reddit.com/r/jailbreak/comments/1u1e1b4/access_to_simulators_root_files/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button编辑:其...
人工智能将如何影响我们自己思考和判断的能力?我们的新论文由30位专家共同撰写,探讨了认知风险--人工智能对我们准确形成信仰、合理推理和维护健康信息环境的集体能力构成的威胁。我们着眼于人工智能如何通过这些机制造成伤害:说服和操纵:人工智能系统非常有说服力,开放......
大家好,我目前正在研究ASR模型,我收集了一些最近的文献。从我的文献搜索来看,由于两个主要原因, ASR模型似乎越来越强大。由于伪标记数据正在增长,监督模型正在迅速上升。Whisper-large-v3已经接受了500万小时的弱监督数据培训, Nvidia Parakeet v3已经接受了...
编辑:针对中国研究人员的原始帖子已被MODS删除。此处提出的要点是对该特定帖子的回复。因此,当您对此帖子发表评论时,请务必意识到目前无法提供特定的背景信息。很抱歉给您带来困扰。虽然我调用的原始帖子已被删除,但我确实认为这是一个重要的话题,并选择将我的帖子保留在...
Google 在 6 月 8 日升级 NotebookLM:默认底座转向 Gemini 3.5 与 Antigravity,给每个 notebook 配置安全云端计算机,可运行代码、生成文件,并从聊天中补全来源库。现阶段面向 Google AI Ultra 和部分 Workspace 商业客户开放。NotebookLM 开始承担执行型研究任务Google 官方博客把这次更新定义为 NotebookLM 的“agentic capabilities”升级。具体变化有三项:聊天体验接入 Gemini 3.5 与 Antigravity;每个 notebook 配置安全云端计算机,可以写代码、运行代...
Google AI Plus 不是简单从9.99美元降到4.99美元,而是出现了更细的订阅分层:入门档价格下探,2TB 档位继续以9.99美元出现在 Google One 官网。入门 AI Plus 降到 4.99 美元6月8日,Google AI Plus 入门订阅将从美国区 7.99 美元/月降至 4.99 美元/月,包含储存空间从 200GB 提高到 400GB。价格下调会在用户下一次续费时生效,储存扩容则在未来几天内陆续推出。这个变化的信号不在“便宜了3美元”本身,而在 Google 开始把消费级 AI 订阅压到 5 美元附近。ChatGPT Plus、Claude Pro、Googl...
Kimi Code 这轮“焕新升级”的主线不是模型参数,而是开发者工具本身重写:新版 CLI 从 Python/uv 迁到 Node.js,配置格式、终端 UI、插件、子 Agent、目标队列和 ACP 接入都在 5 月末到 6 月初密集更新。新版 CLI 从 Python/uv 切到 Node.jsKimi Code 官方迁移文档把这次升级定义为“重大版本升级”:CLI 底层从 Python/uv 迁移到 Node.js,旧版将逐渐停止维护。官方给出的直接收益是安装链路更简单、启动更快、终端界面重新设计。这不是简单改安装脚本。新版数据目录、配置文件和会话结构与旧版不同。官方文档说明,第一次运...
微信开放平台公布小程序接入微信 AI 生态的指引。开发者需要在「小程序管理后台 - AI 能力」主动授权,平台提供自动模式和开发模式;功能仍处于内测阶段,目前用户侧暂不能体验。微信开放平台面向小程序开发者开放接入微信 AI 生态的能力。接入不是默认开启,开发者需要进入「小程序管理后台 - AI 能力」主动授权。这点决定了它不是简单的模型 API 接入,而是微信把 AI 助手与小程序运行、页面理解、审核链路放在同一个平台能力里处理。微信方面同时强调,是否接入由开发者自主决定,不影响现有小程序服务。自动模式让平台读取源码并分析页面自动模式的核心是低开发成本。开发者授权后,平台会在提审时读取小程序源...
WorkBuddy 的邀请积分活动开始在用户社区扩散。腾讯云开发者社区文章称,用户通过邀请链接带来新注册后,邀请人与新用户双方各得 500 积分;但截至发稿,WorkBuddy 官方落地页没有单独披露邀请活动细则。积分体系是 WorkBuddy 增长入口WorkBuddy 采用积分消耗制,积分与模型调用、任务规划和自动化执行成本相关。用户社区对积分的关注,来自两个直接约束:一是桌面 Agent 任务往往不是单轮问答,执行链路会持续消耗额度;二是 WorkBuddy 把专家中心、技能市场、跨平台连接和云服务能力打包到同一个工作台,积分余额会直接影响用户尝试频率。官方 WorkBuddy 落地页确...
6 月 5 日,Reddit 的 r/codex、r/OpenAI 和 r/ChatGPT 出现多条 OpenAI / ChatGPT / Codex 账号被停用的反馈。当前可确认的是社区反馈密集出现,且部分用户称收到“误停用后恢复”的邮件;OpenAI 状态页尚未把它列为账号封禁事故。社区反馈集中在 Codex 与付费账号这轮反馈最密集的位置不是传统媒体,而是 Reddit 的 Codex 用户社区。多条帖子在 6 月 5 日集中出现,描述相似:账号被 deactivated、disabled 或 banned,邮件理由笼统,用户无法确认具体触发项。受影响者的自述覆盖几类场景:Pro 账号、...
月之暗面 Kimi 发布桌面端产品 Kimi Work,定位知识工作者的本地 Agent。官方页面把能力集中在本地文件、WebBridge 浏览器自动化、Cron 定时任务、Agent Swarm、PPT/Excel 交付和金融数据接入。Kimi Work 从网页问答转向本地执行Kimi Work 不是网页版 Kimi 的外壳。官方 FAQ 给出的区分很明确:网页版 Kimi 主要负责轻量对话问答,Kimi Work 则是桌面本地 Agent,能读取用户授权的本地文件夹、操控浏览器、后台运行 Python 代码,并支持定时任务。这把 Kimi 的入口从聊天窗口推到操作系统侧。官方页面给出的示例...
OpenAI 在 2026 年 6 月 2 日发布 Codex 重大更新,把重点从编程代理扩展到白领工作流。官方称,新推出的六类角色插件合计包含 62 个应用和 110 个技能,并加入 Sites 和内容批注能力。Codex 的目标人群被重新定义OpenAI 这次没有把 Codex 包装成更强的代码补全工具。官方博客开头给出的信号很直接:Codex 周活跃用户超过 500 万,非开发者约占整体用户的 20%,增长速度是开发者的 3 倍以上。这组数据来自 OpenAI 自述,Axios 也在报道中引用了同一口径,并补充称知识工作者中增长最快的任务包括数据分析、研究,以及报告、备忘录、文档、合同、...
豆包付费内容的时间表从“测试中”推进到“预计6月下旬上线”。目前可确认的是 App Store 订阅声明和官方“基础免费、增值服务测试中”的回应;6月下旬窗口、Force 大会更新和三季度电商联动,仍来自媒体转述知情人士。豆包预计将在 6 月下旬正式上线付费内容,并在同期举行的 Force 大会上更新相关功能。报道给出的原因是,PC 端与移动端仍需约一个月完成基础功能和收费体系适配。三档价格已经曝光,基础免费口径未变此前 App Store 页面披露的三档订阅为:档位连续包月连续包年标准版68 元/月688 元/年加强版200 元/月2048 元/年专业版500 元/月5088 元/年豆包官方...
MiniMax M3 已在官方页面和第三方 API 平台上线。官方把它定位为首个同时覆盖编程智能体、百万上下文和原生多模态的开源权重前沿模型,但截至发稿,权重与技术报告仍是“约 10 天内发布”的承诺,不能等同于权重已经公开可下载。发布重点不是单一榜单,而是三项能力打包MiniMax 在官方发布页中给 M3 的主标题是“Frontier Coding, 1M Context, Native Multimodality”。这三项分别对应编程与智能体任务、最高 100 万 token 上下文,以及从训练阶段开始的原生多模态能力。这也是本次发布的核心卖点:不是只做长上下文模型,也不是只做编程模型,而...