2026年07月04日
最后更新:2026-07-04 08:04:31 UTC+8
文章网址:https://github.com/FossPrime/Steam-Controller-Auto-Charge 评论网址:https://news.ycombinator.com/item?id=48780865 积分:23 # 评论: 4
文章网址:https://news.exeter.ac.uk/faculty-of-environment-science-and-economy/giant-trees-have-no-trouble-pumping-water-to-top-branches/ 评论网址:https://news.ycombinator.com/item?id=48780870 积分:30 # 评论: 13
文章网址:https://worksinprogress.co/issue/how-amsterdam-invented-the-fire-department/ 评论网址:https://news.ycombinator.com/item?id=48780913 积分:19 # 评论: 5
文章网址:https://www.engineering.columbia.edu/about/news/ Circuit-lets-your-brain-think-and-see 评论网址:https://news.ycombinator.com/item?id=48780996 积分:11 # 评论: 0
文章网址:https://katamari64.se/posts/2026/odin-wikipedia/ 评论网址:https://news.ycombinator.com/item?id=48781196 积分:7 # 评论: 0
arXiv:2607.01426v1 公告类型:新 摘要:自主客户服务代理正在从会话界面转向操作执行角色:他们检索公司记录、应用服务策略并执行后端写入,例如退款、取消、换货、订单修改和预订更改。这种转变产生了服务控制问题:公司必须保持常规......
arXiv:2607.01425v1 公告类型:新 摘要:理解大型、复杂的代码库,尤其是那些结构混乱和文档不完整的代码库,仍然是一个重大挑战。现有的代码摘要解决方案通常依赖于单一语言模型或像 Claude Code 这样的编码助手,并将源代码视为平面文本,没有充分利用丰富的相互依赖关系和层次结构......
arXiv:2607.01394v1 公告类型:新 摘要:我们提出了 Wiola,一种完全原创的小语言模型 (SLM) 架构,它根据第一原理构建,与任何现有模型系列(包括 GPT、LLaMA、Mistral 或 Falcon)不共享结构谱系。 Wiola 引入了五个独立的新颖组件:(i)螺旋旋转位置编码(SRPE),它将令牌位置嵌入到三毛钱......
arXiv:2607.01366v1 公告类型:新 摘要:联邦学习(FL)研究通常依赖于许多微小但重要的算法选择:优化器变体、服务器聚合规则、本地训练计划、标准化、正则化和模型架构。手动探索这些选择的成本很高,并且当候选更改也会改变 FL 时很难公平比较......
arXiv:2607.01306v1 公告类型:新 摘要:反事实解释通过识别会改变模型决策的最小输入变化来解释机器学习预测。尽管许多现有方法成功地生成了改变预测的替代方案,但由于缺乏整合领域知识的明确机制,它们经常会产生不切实际或不可行的建议。
我一直在进行一个实验,我称之为原生因子分解权重 (NFW):不是训练标准转换器并随后对其进行压缩,而是在初始化时将每个线性层替换为 W = V·Uᵀ 并从头开始以这种方式进行训练。 No post-hoc SVD.预训练模型之上没有 LoRA 适配器。 The factorization is the basis for the model and earns the name "Sliver layers" as each lay...
大家好,我构建了 H64LM,这是一个研究项目,旨在通过在 PyTorch 中从头开始实现一个来更好地理解现代法学硕士。我没有依赖高级训练框架,而是自己实现了核心组件注意力、MoE 路由、标准化和训练循环。具有 249M 参数 Transformer 分组查询注意 (GQA) 稀疏专家混合(8 位专家、Top-2 路由...
考虑在他的网站上呆两个月,对机器学习有更深入的了解,因为我正在用拥抱脸的人工智能模型构建工具。有人尝试过吗? 由 /u/TheSmashingChamp 提交 [链接] [评论]
我们构建了一种模型比较方法,仅使用灰盒 Logit 访问(无权重、无激活、无探测语料库)从经过微调的 LLM 中恢复逐字内容。最近的工作(Minder、Dumas 等人,“Narrow Finetuning Leaves Clearly Readable Traces in Activation Differences”)表明,微调在基础模型和微调模型之间的激活差异中留下了可检测的痕迹。他们的 ...
Claude Code“隐藏后门检测中国用户”的说法正在传播,但目前能确认的是访问地区限制、身份验证和源码泄露背景。把地理风控直接等同于后门,证据不够;对中国开发者更现实的风险,是代理和中转服务泄露账号、密钥和提示词。可以确认的是访问限制,不是后门Claude Code 不是一个完全离线的本地二进制。它可以读取代码库、编辑文件、运行命令,但核心能力仍依赖账号、订阅、API 或第三方模型通道。官方安装文档把所在地列为前置要求:用户需要位于支持国家或地区。公开的支持地区列表覆盖 API 和 Claude.ai,两张列表里都没有中国大陆、香港和澳门。这已经足够解释一部分社区现象:同样的客户端,在不同...
Anthropic 在 2026 年 6 月 30 日发布 Claude Sonnet 5。它的标准 API 价格是每百万输入 3 美元、输出 15 美元,比 Opus 4.8 低 40%;到 8 月 31 日还有每百万输入 2 美元、输出 10 美元的限时价。能力叙事集中在编码、浏览器使用和长链路 Agent,独立复现仍要等真实项目数据。价格:标准价比 Opus 4.8 低 40%Claude Sonnet 5 的 API ID 是 claude-sonnet-5,定位不是旗舰线替代品,而是把更多 Agent 能力放进 Sonnet 价格带。标准价格维持 Sonnet 4.6 水平:每百万输...
Gemini Omni Flash 的重点不是“又一个视频模型”,而是把文本、图片、视频和音频都纳入同一条生成链路。它先在 Flow、Gemini 和 YouTube Shorts 等产品内落地,API 与第三方长测还没有形成稳定结论。Omni 从视频开始Gemini Omni 是 Google 新开出的生成模型系列,第一款模型叫 Gemini Omni Flash。这个名字容易误读:它不是 Gemini Flash 文本模型的普通小版本更新,而是一个面向生成媒体的 Omni 分支,首个落点是视频。它能把文本、图片、视频、音频作为引用输入,生成一段带画面和声音的视频,或者在已有视频上做多轮编辑...
Nano Banana 2 Lite 已在 Gemini API GA,模型 ID 为 gemini-3.1-flash-lite-image。它只支持 1K 输出,标准调用每张约 0.0336 美元,Batch 约 0.0168 美元,定位不是画质旗舰,而是高频交互和低成本编辑。Lite 把重点放在吞吐和价格Nano Banana 2 Lite 的稳定模型 ID 是 gemini-3.1-flash-lite-image,另有 gemini-3.1-flash-lite-image-preview-06-30 预览别名。它已进入 GA,Gemini API 的生产环境可以直接调用稳定 ID。...
DeepSeek V4 正式版被列入 7 月中旬上线窗口,API 计费可能从单一价格切到峰谷价。Pro 版输出在平时为 6 元/百万 tokens,高峰时段为 12 元;Flash 输出从 2 元升到 4 元。公开页面尚未同步这组调整,现阶段只能按 API 用户通知处理。正式版时间窗口落在 7 月中旬DeepSeek V4 预览版已经跑了两个多月。新的 API 用户通知给出下一步安排:V4 正式版计划在 2026 年 7 月中旬上线,更新方向包括功能优化和性能提升,但没有给出新的 benchmark、上下文窗口变化或模型架构细节。这类信息不能写成完整发布。更准确的判断是:DeepSeek 已经...
DeepSeek 把 DSpark 放到了 DeepSeek-V4 的发布链路里:它面向 Pro 和 Flash 两个检查点,核心目标是用推测解码压低生成延迟。这不是新基座模型发布,更接近一次推理系统侧的加速更新。DSpark改的是解码,不是模型定位DSpark 的位置需要先说清楚:它不是 DeepSeek-V4 之外的新一代大模型,而是给 DeepSeek-V4 Pro 和 DeepSeek-V4 Flash 配套的推测解码模块。推测解码的基本思路很直接。先让一个更轻的草稿模块连续猜出若干 token,再由主模型批量校验。猜对的 token 可以一次性通过,猜错就回退到主模型正常生成。理想情...
豆包专业版不只是把聊天助手加上会员入口。付费协议已经把会员、云存储和体系内产品消耗写进同一套规则,办公任务模式更像是把 PPT、文档、数据分析等高算力任务统一纳入额度管理。专业版从灰度测试走向正式付费豆包 iOS 端当前版本为 13.9.0,更新时间是 2026 年 6 月 23 日。App Store 页面已经把付费订阅写进产品描述:基础版免费,标准版连续包月 68 元、连续包年 688 元;加强版连续包月 200 元、连续包年 2048 元;专业版连续包月 500 元、连续包年 5088 元。这和 5 月初的灰度测试相比,变化不在价格,而在产品边界更清楚。豆包付费服务协议在 2026 年 ...
字节跳动发布 Seed2.1 系列,已接入豆包、TRAE 和火山方舟。新版本把重点从静态榜单转向真实工作流:通用 Agent、Coding Agent、多模态理解和模型研发自动化。现阶段关键 benchmark 仍主要来自发布材料,需要等独立评测复现。Seed2.1 已进入豆包、TRAE 和火山方舟字节跳动 Seed 团队发布 Seed2.1 系列模型,定位是面向真实生产力场景的智能体模型。可用渠道已经明确:豆包产品、TRAE Work、TRAE IDE,以及火山方舟体验中心和 API。模型选择里出现的是 Doubao-Seed-2.1-Pro 和 Doubao-Seed-2.1-Turbo。...
Codex 的 Record & Replay 不是简单录屏回放,而是把一次本地工作流示范转成可复用 skill。它适合稳定、重复、偏个人偏好的 macOS 操作;当前可用性受地区、Computer Use 开关和组织策略限制。录一次操作,产物是 skillRecord & Replay 的核心产物不是视频,也不是按坐标重放的宏脚本,而是一份 Codex skill。用户先在 Mac 上示范一个已经知道怎么完成的流程。Codex 观察完成任务所需的操作和窗口内容,录制停止后再把这段流程整理成 skill:什么时候触发、需要哪些输入、按什么步骤执行、最后怎么验证结果。这和普通提示词的差别在于,s...
OpenAI Codex 的模型供应商边界变了:本地工作流可以指向支持 Responses 或 Chat Completions 的模型与供应商。真正需要看清的是限制条件:Chat Completions 兼容已进入弃用路径,云端任务暂时不能改默认模型。Codex 不再只绑定默认 OpenAI 路径Codex 现在把模型选择拆成两层:model 决定调用哪个模型,model_provider 决定请求发往哪个供应商。默认仍是 OpenAI,但本地配置里可以新增供应商,写入 base URL、认证环境变量、请求头,以及线缆协议。这对开发者的实际影响很直接。过去 Codex 更像一个围绕 Open...