📰 每日 AI 资讯

2026年07月01日

最后更新:2026-07-01 08:07:46 UTC+8

🔹 Hacker News

从脑电波到语言:无需手术的沟通新途径

文章网址:https://ai.meta.com/blog/brain2qwerty-brain-ai- human-communication/?_fb_noscript=1 评论网址:https://news.ycombinator.com/item?id=48739466 积分:88 # 评论: 47

📅 ue, 30 Jun 2026 🔗 原文链接

了解晶格风险:营销与现实之间的许多差异

文章网址:https://blog.cr.yp.to/20260630-risk.html 评论网址:https://news.ycombinator.com/item?id=48739467 积分:11 # 评论: 2

📅 ue, 30 Jun 2026 🔗 原文链接

消失但未被遗忘:恢复死网

文章网址:https://blog.archive.org/2026/04/23/gone-but-not-forgotten-recovering-the-dead-web/ 评论网址:https://news.ycombinator.com/item?id=48739682 积分:7 # 评论: 0

📅 ue, 30 Jun 2026 🔗 原文链接

TabFM:表格数据的零样本基础模型

文章网址:https://research.google/blog/introducing-tabfm-a-zero-shot-foundation-model-for-tabular-data/ 评论网址:https://news.ycombinator.com/item?id=48739919 积分:21 # 评论: 4

📅 ue, 30 Jun 2026 🔗 原文链接

Hatari – 在线 Atari ST/STE/TT/Falcon 模拟器

文章网址:https://hatari.frama.io/hatari/online/hatari.html 评论网址:https://news.ycombinator.com/item?id=48740135 积分:20 # 评论: 3

📅 ue, 30 Jun 2026 🔗 原文链接

🔹 arXiv 人工智能

从推理中寻找真理:用于引导 LLM 轨迹的动态表示编辑框架

arXiv:2606.28589v1 公告类型:新 摘要:当前增强大语言模型(LLM)推理的方法,例如思想链和“等待”提示,主要鼓励模型更多地思考,但往往无法引导它们走向真理。虽然表示编辑(RepE)提供了内在的控制,但其在动态推理轨迹中的应用仍未得到充分探索。在这项工作中,我们...

📅 ue, 30 Jun 2026 🔗 原文链接

IMCBench:基于图像的医学对话中多模式法学硕士的基准

arXiv:2606.28556v1 公告类型:新 摘要:大型语言模型和视觉语言模型的最新进展使得多模态数据推理成为可能,为决策支持和分类等临床应用提供了机会。然而,现有的医疗人工智能基准是支离破碎的:一些支持多轮对话但缺乏图像,而另一些提供多模态输入但......

📅 ue, 30 Jun 2026 🔗 原文链接

GPTNT:对多模式代理之间的实时协作进行基准测试,保持通话且无人爆炸

arXiv:2606.28514v1 公告类型:新 摘要:多模态模型越来越多地被部署来与人类或其他人工智能体协作解决任务。现有的基准测试表明,这些模型拥有许多所需的组件功能,但协作中符合的条件,包括时间压力、信息不对称和不完善的沟通,通常......

📅 ue, 30 Jun 2026 🔗 原文链接

数据和评估闭环增强模型能力

arXiv:2606.28471v1 公告类型:新 摘要:模型能力是 LLM 预训练的核心变量,但从未被直接观察到:数据前瞻性地塑造它,而评估仅回顾性地揭示它,将样本、提示、解码和评分规则压缩为一个噪声分数。实际的优化是这样逆向进行的:首先观察到故障,然后工程师必须影响...

📅 ue, 30 Jun 2026 🔗 原文链接

通过保留选择的递归自我进化代理

arXiv:2606.28374v1 公告类型:新 摘要:通过发展自然语言工件(例如反射、工作流程、剧本、备忘单或优化提示),在没有权重更新的情况下,LLM 代理得到了不断的改进,这些工件以冻结策略为条件。这些方法通常被报告为在有帮助的单一基准测试中取得胜利。我们对它们进行逐一研究,并得出更清晰的结果……

📅 ue, 30 Jun 2026 🔗 原文链接

🔹 Reddit 人工智能

2026 年最佳 NSFW AI 图像生成器

首先,不要听有链接的帖子,这些帖子几乎都是附属机构或品牌。我是一个真正的用户,花了太多时间探索这个兔子洞。无论如何,如果我遗漏了任何内容或者您认为我的清单不准确,请告诉我。 Secrets AI - 您可能会认为这看起来与其他的有点不同,您是对的。然而,他们有一整代...

📅 2026-06-30 21:47 🔗 原文链接

你的人工智能需要人工智能吗?

我写这篇文章是因为我认为很多人都在运行多个人工智能并且感到震惊。欢迎 /u/CitizenOctopus [链接] [评论] 提交任何反馈

📅 2026-06-30 18:13 🔗 原文链接

Reddit 用户对人工智能的影响最大吗?

由 /u/xJouissance 提交 [链接] [评论]

📅 2026-06-30 16:40 🔗 原文链接

人工智能让我提出了比搜索引擎更好的问题。还有其他人吗?

我没想到经常使用人工智能的一件事是它改变了我的思维方式。我没有寻找快速答案,而是花更多时间思考如何提出更好的问题。即使当我在没有人工智能的情况下研究某些东西时,我注意到我正在将问题分解成更小的步骤,而不是仅仅寻找一个完美的答案。有没有其他人经历过这种情况,或者人工智能改变了不同的习惯......

📅 2026-06-30 15:20 🔗 原文链接

Meta 一直在 Google Gemini 上秘密运行,然后因使用过多而被切断

今天看到这篇文章,我真的很惊讶 Meta 一直在使用 Gemini 进行客户服务、广告工具、内容审核等等。显然选择它是因为它比他们自己的 Llama 模型效果更好,然后谷歌因为 Meta 消耗太多容量而切断了它们。现在,员工被告知要注意他们的代币使用情况。这正是推动员工的同一家公司......

📅 2026-06-29 20:36 🔗 原文链接

🔹 Reddit 机器学习

如何改进 5 级糖尿病视网膜病变模型 (APTOS 2019) – 跨类别的混合预测[P]

大家好,我是一名计算机工程专业的最后一年学生,正在构建基于 Flask 的人工智能糖尿病视网膜病变检测系统。 Web 应用程序本身具有患者管理、身份验证、仪表板、PDF 报告生成、预测历史记录和 AI 推理功能。我面临的唯一问题是人工智能模型。我正在使用在 APTOS 201 上训练的 5 级糖尿病视网膜病变分类器...

📅 2026-06-30 19:58 🔗 原文链接

按语义相似度和时间切片划分的最新 1100 万篇论文图谱 [P]

我正在建立探索科学文献的替代方法。目标是通过可视化宏观趋势,使每天发表的大量论文更容易跟上。任何有兴趣尝试的人都可以在全球研究空间免费使用!我是如何构建它的 我从 OpenAlex 和 Arxiv 获取了最新的 1100 万篇论文,并使用 SPECTER 2 对标题和摘要进行了编码...

📅 2026-06-30 11:55 🔗 原文链接

CVIL 更新:实习后的免费简历面试准备清单...刚刚添加了分段、OCR 和 VLM 部分 [D]

大家好,不久前发布了这个……我在准备简历实习时制作的清单(找到了,因此分享)。它不是教科书,只是 CV/ML 面试实际学习内容的分阶段地图:数学 → CNN → ViT → 检测 → 跟踪,以及您根据角色选择的专业化跟踪。一段时间后检查了一下,它得到了相当多的星星,这让很多人感到惊讶......

📅 2026-06-30 10:40 🔗 原文链接

Cerebras OpenAI 交易能力实际上已经消除了其他所有人的候补名单 [D]

我很生气。我们是一家小型人工智能初创公司,致力于构建实时编码代理。我们的 p95 延迟要求很严格(并且是自我强加的,但这就是产品)。我们需要每秒约 1-2k 个令牌的持续高吞吐量推理。几个月来一直在 Cerebras 等待名单上尝试获取 API 访问权限。我们不进行培训,因此不需要 H100 仓库。我们需要快速、高吞吐量的 ASIC 推理...

📅 2026-06-29 12:00 🔗 原文链接

🔹 51AllAI

DeepSeek V4 正式版计划 7 月中旬上线,API 计费或引入高峰价

DeepSeek V4 正式版被列入 7 月中旬上线窗口,API 计费可能从单一价格切到峰谷价。Pro 版输出在平时为 6 元/百万 tokens,高峰时段为 12 元;Flash 输出从 2 元升到 4 元。公开页面尚未同步这组调整,现阶段只能按 API 用户通知处理。正式版时间窗口落在 7 月中旬DeepSeek V4 预览版已经跑了两个多月。新的 API 用户通知给出下一步安排:V4 正式版计划在 2026 年 7 月中旬上线,更新方向包括功能优化和性能提升,但没有给出新的 benchmark、上下文窗口变化或模型架构细节。这类信息不能写成完整发布。更准确的判断是:DeepSeek 已经...

📅 2026-06-30 01:20 🔗 原文链接

DeepSeek发布DSpark,为V4加入推测解码加速

DeepSeek 把 DSpark 放到了 DeepSeek-V4 的发布链路里:它面向 Pro 和 Flash 两个检查点,核心目标是用推测解码压低生成延迟。这不是新基座模型发布,更接近一次推理系统侧的加速更新。DSpark改的是解码,不是模型定位DSpark 的位置需要先说清楚:它不是 DeepSeek-V4 之外的新一代大模型,而是给 DeepSeek-V4 Pro 和 DeepSeek-V4 Flash 配套的推测解码模块。推测解码的基本思路很直接。先让一个更轻的草稿模块连续猜出若干 token,再由主模型批量校验。猜对的 token 可以一次性通过,猜错就回退到主模型正常生成。理想情...

📅 2026-06-28 08:18 🔗 原文链接

豆包推出专业版,办公任务进入付费额度体系

豆包专业版不只是把聊天助手加上会员入口。付费协议已经把会员、云存储和体系内产品消耗写进同一套规则,办公任务模式更像是把 PPT、文档、数据分析等高算力任务统一纳入额度管理。专业版从灰度测试走向正式付费豆包 iOS 端当前版本为 13.9.0,更新时间是 2026 年 6 月 23 日。App Store 页面已经把付费订阅写进产品描述:基础版免费,标准版连续包月 68 元、连续包年 688 元;加强版连续包月 200 元、连续包年 2048 元;专业版连续包月 500 元、连续包年 5088 元。这和 5 月初的灰度测试相比,变化不在价格,而在产品边界更清楚。豆包付费服务协议在 2026 年 ...

📅 2026-06-24 04:09 🔗 原文链接

字节跳动发布 Seed2.1,强化 Agent、Coding 与多模态生产力

字节跳动发布 Seed2.1 系列,已接入豆包、TRAE 和火山方舟。新版本把重点从静态榜单转向真实工作流:通用 Agent、Coding Agent、多模态理解和模型研发自动化。现阶段关键 benchmark 仍主要来自发布材料,需要等独立评测复现。Seed2.1 已进入豆包、TRAE 和火山方舟字节跳动 Seed 团队发布 Seed2.1 系列模型,定位是面向真实生产力场景的智能体模型。可用渠道已经明确:豆包产品、TRAE Work、TRAE IDE,以及火山方舟体验中心和 API。模型选择里出现的是 Doubao-Seed-2.1-Pro 和 Doubao-Seed-2.1-Turbo。...

📅 2026-06-23 12:41 🔗 原文链接

Codex 推出 Record & Replay,把本地操作录成可复用技能

Codex 的 Record & Replay 不是简单录屏回放,而是把一次本地工作流示范转成可复用 skill。它适合稳定、重复、偏个人偏好的 macOS 操作;当前可用性受地区、Computer Use 开关和组织策略限制。录一次操作,产物是 skillRecord & Replay 的核心产物不是视频,也不是按坐标重放的宏脚本,而是一份 Codex skill。用户先在 Mac 上示范一个已经知道怎么完成的流程。Codex 观察完成任务所需的操作和窗口内容,录制停止后再把这段流程整理成 skill:什么时候触发、需要哪些输入、按什么步骤执行、最后怎么验证结果。这和普通提示词的差别在于,s...

📅 2026-06-19 14:03 🔗 原文链接

OpenAI 放开 Codex 模型供应商,本地工作流可接第三方模型

OpenAI Codex 的模型供应商边界变了:本地工作流可以指向支持 Responses 或 Chat Completions 的模型与供应商。真正需要看清的是限制条件:Chat Completions 兼容已进入弃用路径,云端任务暂时不能改默认模型。Codex 不再只绑定默认 OpenAI 路径Codex 现在把模型选择拆成两层:model 决定调用哪个模型,model_provider 决定请求发往哪个供应商。默认仍是 OpenAI,但本地配置里可以新增供应商,写入 base URL、认证环境变量、请求头,以及线缆协议。这对开发者的实际影响很直接。过去 Codex 更像一个围绕 Open...

📅 2026-06-18 01:54 🔗 原文链接

月之暗面开源 Kimi K2.7 Code,强化长程编码任务

Kimi K2.7 Code 已开放权重,定位长程编码智能体模型。它沿用 K2.6 架构,给出 1T 总参数、32B 激活参数、256K 上下文和 MoonViT 视觉编码器;性能数据仍缺少独立复现,需要开发者在真实仓库里长测。K2.7 Code 把更新焦点压到编码 Agent月之暗面这次不是只给 Kimi K2 系列补一个小版本号。Kimi K2.7 Code 的定位很窄:coding-focused agentic model,面向端到端软件工程任务,而不是通用聊天。模型建立在 Kimi K2.6 之上,架构仍是 MoE。当前公开规格是:1T 总参数、32B 激活参数、61 层、384 个...

📅 2026-06-13 10:35 🔗 原文链接

Anthropic 暂停 Claude Fable 5 访问,美国出口管制伸向模型层

Anthropic 暂停 Claude Fable 5 与 Mythos 5 访问,导火索是美国政府针对外国用户使用先进模型的限制指令。公开信息仍缺少完整官方原文,但核心信号已经清楚:AI 出口管制正在从芯片、算力和云服务,推进到模型访问本身。Fable 5 刚开放就被按下暂停键Claude Fable 5 的生命周期被拉得很短。它在本周刚作为 Anthropic 面向更广用户开放的 Mythos 级模型出现,随后又因为美国政府指令被暂停访问。受影响的不只是普通用户,限制口径还覆盖外国个人和实体,甚至包括身在美国境内的外国国民。Anthropic 选择统一下线,而不是只做地区或身份分流。这个动...

📅 2026-06-13 04:20 🔗 原文链接

Kimi 信用卡开启预约,消费积分可换算力额度

Kimi 智能助手在 2026 年 6 月 12 日宣布 Kimi 信用卡开放预约,官方称其为“AI 原生信用卡”。目前确定的信息是:消费积分可兑换 Kimi 算力额度、Agent 使用额度和高级功能权限;具体申领条件、审核标准、合作银行和兑换比例仍未公布。Kimi 把会员权益包装进信用卡6 月 12 日,Kimi 智能助手官方微信公众号发布《全球首张 AI 原生信用卡!开放预约!》,宣布 Kimi 信用卡开启预约。官方给出的定位不是传统联名卡,而是把 AI 服务放进信用卡权益体系:持卡人的消费积分可转化为 Kimi 算力额度,并用于兑换 Agent 使用额度、高级功能权限等。这句话里真正有信...

📅 2026-06-12 15:23 🔗 原文链接

Google发布Gemini 3.5 Live Translate,实时语音翻译覆盖70多种语言

Google 在 6 月 9 日发布 Gemini 3.5 Live Translate,定位为实时语音到语音翻译音频模型。官方称其支持 70 多种语言、2000 多种语言组合,并开始接入 API、Google Translate 和 Meet。不是翻译按钮,而是连续语音流模型Google 把 Gemini 3.5 Live Translate 定义为“latest audio model”,不是 Google Translate 里的一个普通 UI 更新。它面向的是 speech-to-speech translation:输入连续语音流,输出另一种语言的语音,同时保留说话人的语调、节奏和音...

📅 2026-06-10 10:43 🔗 原文链接