2026年06月27日
最后更新:2026-06-27 08:08:03 UTC+8
文章网址: https://www.outsideonline.com/outdoor-adventure/environment/nps-internal-memo-deaths/?link_source=ta_first_comment&taid=6a3dae4f4d2dce00016deef8&utm_content=trueanthem&utm_medium=social&utm_source=facebook 评论网址: https://news.ycombinator.com/item?id=48692098 积分: 61 #评论: 23
Eigenpal下的github repo消失了。 Docx-editor的网站是503。 不知道是怎么回事。 评论网址: https://news.ycombinator.com/item?id=48692474 积分: 34 #评论: 29
文章网址: https://spectrum.ieee.org/ai-in-mathematics 评论网址: https://news.ycombinator.com/item?id=48692883 积分: 7 #评论: 3
文章网址: https://physics.stackexchange.com/questions/535/why-does-kinetic-energy-increase-quadratically-not-linearly-with-speed 评论网址: https://news.ycombinator.com/item?id=48692946 积分: 8 #评论: 0
文章网址: https://www.reuters.com/technology/us-releases-anthropic-model-mythos-some-us-companies-semafor-reports-2026-06-26/ 评论网址: https://news.ycombinator.com/item?id=48692995 积分: 93 评论数: 41
arXiv: 2606.26203v1公告类型:新 摘要:随着人工智能代理协议的激增,塑造其互操作性标准的治理结构在实践中仍未得到充分考虑。 我们为大规模治理话语分析引入了基于LLM的比较管道,集成了自动化注释、神经主题建模和多层网络分析,以研究社会技术力量...
arXiv: 2606.26173v1公告类型:新 摘要:最近的研究表明,大型语言模型( LLM )可以作为程序和证明的进化发现的语义突变运算符。 当前大多数应用程序侧重于静态编码基准。 我们将这种范式扩展到算法交易。 此域具有独特的挑战性,因为它嘈杂、非平稳且高度不连续……
arXiv: 2606.26161v1公告类型:新 摘要:在指令调整的聊天模型中,激活空间中的线性方向已被识别为拒绝和角色特征,但两者已被研究为单独的机制。 我们展示了他们的互动:一个合规的角色大门拒绝。 在Qwen2.5-7B-Instruct和Llama-3.1-8B-Instruct中,我们提取了合规的模型角色方向和拒绝...
arXiv: 2606.26158v1公告类型:新 摘要:当基准的准确性饱和时,它通常会被淘汰,取而代之的是更具挑战性的版本。 我们表明,这种方法具有准确性,并错过了研究代理绩效的其他六个关键维度的机会:构造有效性问题,如快捷方式、分布外可推广性、效率、可靠性、相关性...
arXiv: 2606.26155v1公告类型:新 摘要:通过激活转向方法解释和控制模型行为需要许多对比样本,这些样本明显表现出期望或不期望的行为。 这些数据对决定了可解释性框架可以可靠地检测负责某种行为的模型特征的程度,从而决定了引导...
我一直看到Doomer的帖子谈论AI将如何夺走所有工作。我相信相反的情况-从长远来看, AI将增加更多的工作岗位,而不是削减工作岗位,现在我一直看到这方面的证据。我遇到的职位头衔表明, 2-3年更有利可图。我很好奇,所以我创建了一个网站来跟踪这个情况。我刮了各种招聘板,过滤掉了头衔……
如果是这样,这些工作会是什么样子?由/u/AppropriateHamster提交[link] [comments]
Shazeer到openai ,然后John Jumper ( alphaFold诺贝尔奖获得者)到anthropic ,再加上Adler和Pritzler在一周内走出同一扇门。每当其中一个掉落时,框架就是谷歌在流血。我认为人们正在反过来阅读它。如果真正训练过这个东西的人可以马上离开并立刻对竞争对手产生影响,那么重量永远不是资产。判断如何驾驭……
Anthropic今天放弃了2026年6月的经济指数,并隐藏在调查数据中,这应该成为头条新闻:超过三分之一的受访者( 9700名实际Claude用户,与实际使用数据相关联)认为,人工智能将能够在明年内处理大部分或几乎所有的工作任务。不是“一些任务”。不是“帮助我写电子邮件。”他们的大部分工作。这是P...
这里的大多数公开与封闭的谈话是关于你是否可以在自己的硬件上运行这个东西。公平地说,这是明显的吸引力。但我认为睡觉的部分是,开放的权重意味着你实际上可以在底座上发布火车,而不仅仅是运行推理。使用封闭的API ,您可以租用智能设备。您可以提示它,您可以在它周围抹布,但您永远无法让它成为您的。您不能罚款......
在尝试GRPO培训时,我一直在做这样的事情:当奖励增加时,很难判断该政策是真的在改善还是仅仅在利用奖励功能。因此,我构建了一个名为rewardspy的小库,它包装了现有的奖励函数,并不断监控通常在奖励黑客攻击之前的指标。它目前跟踪的事情像滚动...
我关于实时持续学习用例的问题被这里的主持人删除了,因为他们认为我提出了有关实时持续学习的基本问题,我认为这是一项前沿研究。但无论如何。是否有人有兴趣谈论持续学习(实时)和灾难性遗忘?提交者:/u/fourwheels2512 [link] [comments]
我一直在使用LLM API (来自OpenRouter )开发人工智能产品,但想在我自己的Prod环境中部署一个开源LLM ,我可以控制。这背后的原因很少: -我想拥有我的产品的完整堆栈。-其次,我想围绕我的二手包对模型进行微调。那么,什么是最实惠但却是一个很好的平台呢?我不是人工智能工程师,所以不想停留在CUDA中……
分享我一直在做的一个名为Third Eye的项目。它进行可视化地理定位。给定视频,它仅使用图像内容找出拍摄地点,并在地图上绘制路线。流水线简而言之:针对街道图像索引的每帧位置识别轨迹搜索,将帧缝合到一个连贯的路径中,进行几何验证步骤以捕捉虚假匹配。
豆包专业版不只是把聊天助手加上会员入口。付费协议已经把会员、云存储和体系内产品消耗写进同一套规则,办公任务模式更像是把 PPT、文档、数据分析等高算力任务统一纳入额度管理。专业版从灰度测试走向正式付费豆包 iOS 端当前版本为 13.9.0,更新时间是 2026 年 6 月 23 日。App Store 页面已经把付费订阅写进产品描述:基础版免费,标准版连续包月 68 元、连续包年 688 元;加强版连续包月 200 元、连续包年 2048 元;专业版连续包月 500 元、连续包年 5088 元。这和 5 月初的灰度测试相比,变化不在价格,而在产品边界更清楚。豆包付费服务协议在 2026 年 ...
字节跳动发布 Seed2.1 系列,已接入豆包、TRAE 和火山方舟。新版本把重点从静态榜单转向真实工作流:通用 Agent、Coding Agent、多模态理解和模型研发自动化。现阶段关键 benchmark 仍主要来自发布材料,需要等独立评测复现。Seed2.1 已进入豆包、TRAE 和火山方舟字节跳动 Seed 团队发布 Seed2.1 系列模型,定位是面向真实生产力场景的智能体模型。可用渠道已经明确:豆包产品、TRAE Work、TRAE IDE,以及火山方舟体验中心和 API。模型选择里出现的是 Doubao-Seed-2.1-Pro 和 Doubao-Seed-2.1-Turbo。...
Codex 的 Record & Replay 不是简单录屏回放,而是把一次本地工作流示范转成可复用 skill。它适合稳定、重复、偏个人偏好的 macOS 操作;当前可用性受地区、Computer Use 开关和组织策略限制。录一次操作,产物是 skillRecord & Replay 的核心产物不是视频,也不是按坐标重放的宏脚本,而是一份 Codex skill。用户先在 Mac 上示范一个已经知道怎么完成的流程。Codex 观察完成任务所需的操作和窗口内容,录制停止后再把这段流程整理成 skill:什么时候触发、需要哪些输入、按什么步骤执行、最后怎么验证结果。这和普通提示词的差别在于,s...
OpenAI Codex 的模型供应商边界变了:本地工作流可以指向支持 Responses 或 Chat Completions 的模型与供应商。真正需要看清的是限制条件:Chat Completions 兼容已进入弃用路径,云端任务暂时不能改默认模型。Codex 不再只绑定默认 OpenAI 路径Codex 现在把模型选择拆成两层:model 决定调用哪个模型,model_provider 决定请求发往哪个供应商。默认仍是 OpenAI,但本地配置里可以新增供应商,写入 base URL、认证环境变量、请求头,以及线缆协议。这对开发者的实际影响很直接。过去 Codex 更像一个围绕 Open...
Kimi K2.7 Code 已开放权重,定位长程编码智能体模型。它沿用 K2.6 架构,给出 1T 总参数、32B 激活参数、256K 上下文和 MoonViT 视觉编码器;性能数据仍缺少独立复现,需要开发者在真实仓库里长测。K2.7 Code 把更新焦点压到编码 Agent月之暗面这次不是只给 Kimi K2 系列补一个小版本号。Kimi K2.7 Code 的定位很窄:coding-focused agentic model,面向端到端软件工程任务,而不是通用聊天。模型建立在 Kimi K2.6 之上,架构仍是 MoE。当前公开规格是:1T 总参数、32B 激活参数、61 层、384 个...
Anthropic 暂停 Claude Fable 5 与 Mythos 5 访问,导火索是美国政府针对外国用户使用先进模型的限制指令。公开信息仍缺少完整官方原文,但核心信号已经清楚:AI 出口管制正在从芯片、算力和云服务,推进到模型访问本身。Fable 5 刚开放就被按下暂停键Claude Fable 5 的生命周期被拉得很短。它在本周刚作为 Anthropic 面向更广用户开放的 Mythos 级模型出现,随后又因为美国政府指令被暂停访问。受影响的不只是普通用户,限制口径还覆盖外国个人和实体,甚至包括身在美国境内的外国国民。Anthropic 选择统一下线,而不是只做地区或身份分流。这个动...
Kimi 智能助手在 2026 年 6 月 12 日宣布 Kimi 信用卡开放预约,官方称其为“AI 原生信用卡”。目前确定的信息是:消费积分可兑换 Kimi 算力额度、Agent 使用额度和高级功能权限;具体申领条件、审核标准、合作银行和兑换比例仍未公布。Kimi 把会员权益包装进信用卡6 月 12 日,Kimi 智能助手官方微信公众号发布《全球首张 AI 原生信用卡!开放预约!》,宣布 Kimi 信用卡开启预约。官方给出的定位不是传统联名卡,而是把 AI 服务放进信用卡权益体系:持卡人的消费积分可转化为 Kimi 算力额度,并用于兑换 Agent 使用额度、高级功能权限等。这句话里真正有信...
Google 在 6 月 9 日发布 Gemini 3.5 Live Translate,定位为实时语音到语音翻译音频模型。官方称其支持 70 多种语言、2000 多种语言组合,并开始接入 API、Google Translate 和 Meet。不是翻译按钮,而是连续语音流模型Google 把 Gemini 3.5 Live Translate 定义为“latest audio model”,不是 Google Translate 里的一个普通 UI 更新。它面向的是 speech-to-speech translation:输入连续语音流,输出另一种语言的语音,同时保留说话人的语调、节奏和音...
Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5,把此前只在 Project Glasswing 中受限开放的 Mythos 级能力推向通用用户。它的关键信息不是“更强”,而是 1M 上下文、128k 输出、每百万输入 10 美元、每百万输出 50 美元,以及高风险请求会回退到 Claude Opus 4.8。Fable 5 是通用版 MythosAnthropic 将 Claude Fable 5 定义为“面向通用用户安全开放的 Mythos-class 模型”。官方说明里,Mythos-class 位于 Opus class 之上;4 月先通过 Pro...
Google 在 6 月 8 日升级 NotebookLM:默认底座转向 Gemini 3.5 与 Antigravity,给每个 notebook 配置安全云端计算机,可运行代码、生成文件,并从聊天中补全来源库。现阶段面向 Google AI Ultra 和部分 Workspace 商业客户开放。NotebookLM 开始承担执行型研究任务Google 官方博客把这次更新定义为 NotebookLM 的“agentic capabilities”升级。具体变化有三项:聊天体验接入 Gemini 3.5 与 Antigravity;每个 notebook 配置安全云端计算机,可以写代码、运行代...