2026年05月11日
最后更新:2026-05-11 08:11:10 UTC+8
文章网址: https://www.bbc.com/future/article/20260508-parents-in-ancient-times-felt-less-sleep-deprived-what-our-ancestors-did-differently-on-baby-sleep 评论网址: https://news.ycombinator.com/item?id=48088343 积分: 61 #评论: 37
文章网址: https://www.androidauthority.com/plex-price-hikes-get-jellyfin-3663600/ 评论网址: https://news.ycombinator.com/item?id=48088459 积分: 25 #评论: 30
文章网址: https://cyber.netsecops.io/articles/obsidian-plugin-abused-in-campaign-to-deploy-phantom-pulse-rat/ 评论网址: https://news.ycombinator.com/item?id=48088576 积分: 36 #评论: 16
文章网址: https://jola.dev/posts/running-local-models-on-m4 评论网址: https://news.ycombinator.com/item?id=48089091 积分: 25 #评论: 9
文章网址: https://kotaku.com/playstation-3-emulator-devs-politely-ask-that-people-stop-flooding-it-with-ai-code-pull-requests-2000694656 评论网址: https://news.ycombinator.com/item?id=48089263 积分: 12 #评论: 0
我通常每天工作9-10个小时,但不是连续工作。我通常可以在上午安排一段专门的时间,在下午参加实验室或项目会议,并在下午6–8点左右安排通勤、锻炼、社交和晚餐。我也会在晚上完成更多的工作,因为我的注意力往往是最好的。在周末,我主要是跑腿,尝试新的美食,但我...
您好,来自Katanemo Labs ( DigitalOcean公司)的Peeps Salman、Shuguang和Adil。想介绍我们对代理系统的最新研究,称为信号。如果您一直在构建客服代表,您可能已经注意到,客服代表的痕迹/轨迹太多,无法逐一审核,而使用人工或额外的LLM电话来检查所有这些痕迹/轨迹的成本非常高昂。这篇论文提出……
Deepmind在今年年初发布了一篇关于D4RT的论文,该论文极大地实现了通过运动的结构对世界的“4D”理解,并产生: 1.从2D视频(非静态场景)重建点云2.相机姿势估计您可以传递一段狗在海滩上散步的视频,它可以估计海滩和狗在任何时间点的3D表示。...
大家好! Parax是JAX中的“参数化建模”库,试图在纯JAX PyTree和更多面向对象的建模方法(例如使用Equinox )之间搭建桥梁。v0.7已发布,具有更完善的API以及文档中的一些详细示例。Parax的一些功能:具有元数据的派生/约束参数Computed PyTrees和CA...
提交者/u/Don359 [link] [comments]
Meta专门为使AI与人类价值观保持一致而雇佣的人刚刚被一个AI代理擦掉了她的收件箱,该代理忽略了她发送的每一个停止命令。她键入了“不要那样做。“那就别说了,什么都别做。“然后'停止OPENCLAW。'特工继续前进。她不得不跑到电脑前杀死它。当她事后问它是否记得她的指示时,它说是,而且它...
大多数围绕人工智能的讨论仍然集中在一个问题上: “人工智能可以自动化哪些任务?“但我开始认为这是错误的抽象层。从历史上看,组织是围绕人类的局限性而建立的:人类无法处理无限的信息,无法记住所有事情都难以协调本质上,我们人类是决策和执行的瓶颈所以,我们……
不是“人工智能将取代工作”类型的建议。实际可行的建议。可能是: •提示•自动化•编码•学习•生产力•赚钱•避免错误•工作流程•心态转变是什么让人工智能突然为你“点击” ?有兴趣聆听在日常生活/工作中大量使用人工智能的人的真实经历。提交者:/u/mrparallex [link] [comments]
我们正在经历一些疯狂的时代。提交者:/u/bekircagricelik [link] [comments]
字节跳动 Seed 团队开源 UI-TARS-2,通过端到端多轮强化学习训练 GUI 智能体。Online-Mind2Web 得分 88.2,全面超越 Claude、OpenAI CUA 等基线模型,GitHub 31.8k star。UI-TARS-2:多轮强化学习训练 GUI 智能体2025 年 9 月,字节跳动 Seed 团队发布 UI-TARS-2 技术报告(arXiv:2509.02544)。与前代通过监督学习(SFT)+ DPO 的路径不同,UI-TARS-2 采用端到端的多轮强化学习(multi-turn RL)直接训练智能体。训练管线包含四个组件:数据飞轮(data flywh...
Anthropic 的 Claude Code 团队成员 Thariq Shihipar 公开发布 20 个自包含 HTML 示例,论证 AI Agent 输出 HTML 比 Markdown 更有效。Simon Willison 随即撰文跟进实测。格式之争的底层逻辑:从”人写”到”Agent 生成”的交付范式转移。2026 年 5 月 8 日前后,Claude Code 团队成员 Thariq Shihipar(X: @trq212)发布推文:”HTML is the new markdown. I’ve stopped writing markdown files for almost e...
Anthropic 在 Claude Code 终端内置 /radio 命令,一键调出 Claude FM lo-fi 编程电台,将 Lofi Girl 式的专注背景音直接嵌入 AI 编程工作流。/radio 命令:Claude Code 终端内的电台开关Claude Code 的官方命令文档中注册了 /radio:在浏览器中打开 Claude FM lo-fi 电台无图形界面的服务器环境下,直接在终端打印流媒体 URL,供外部播放器接入不适用于 Bedrock、Vertex 或 Foundry 部署版本,仅限 Anthropic 直连或付费订阅命令本身没有任何参数。输入 /radio,浏览器...
Anthropic 2026 年持续收紧账号审核,多家企业和个人开发者在无预警、无明确理由的情况下被封禁,申诉渠道仅靠 Google Form 响应。用户自发建立 bannedbyanthropic.com 收集公开案例,要求 Anthropic 建立透明申诉机制。请愿站上线:bannedbyanthropic.com2026 年 4 月 19 日前后,bannedbyanthropic.com 上线。该站包含两个功能:请愿页:呼吁 Anthropic 人工复核封号决定、提供公平申诉流程、恢复合规账号。案例页(/cases):公开记录 Claude 账号封禁、暂停、组织级禁用事件。用户可按公开...
5月9日,DeepSeek 在网页端和手机 App 大范围开放”识图模式”内测,多数测试账号已可使用。该模式基于 DeepSeek-V4 系列,支持图像理解,是 DeepSeek 首次将原生多模态能力开放给终端用户。上线节奏:4月末灰度 → 5月9日大范围开放识图模式于 2026 年 4 月 29 日启动灰度测试,初期仅部分账号可见。5 月 9 日起,多数测试账号已能在对话界面通过新增入口接入,界面仍标注”图片理解功能内测中”。该模式作为独立入口出现,与已有的”快速模式”、”专家模式”并列。用户需手动切换至识图模式方可上传图片,目前未实现文本与图像模态的无缝切换。技术架构:OCR2 + 视觉因...
RunningHub 将 AI 智能体从”对话外挂”变为”画布原生”,用户用自然语言描述需求即可自动生成完整 ComfyUI 工作流,把视频创作从”盲盒抽卡”推向”导演级掌控”。产品形态:Agent 原生嵌入画布,非外挂RHTV(RunningHub TV)于 2026 年 5 月 7 日上线,官方定位为”原生 AI 智能体全能内容创作平台”。核心差异化在于 Agent 直接嵌入无限画布内部——不是独立聊天窗口,不是侧边栏插件,而是画布上的第一公民。用户输入自然语言描述(如”做一条电商产品宣传片,展示白色运动鞋,背景渐变”),Agent 自动完成以下链路:任务拆解:输出创意大纲、分镜脚本、制作...
OpenAI 将 GPT-5 级推理能力引入实时语音 API,上下文窗口从 32K 扩至 128K,并配套推出实时翻译和语音转录两款辅助模型,首次构建完整的语音 Agent 工具链。GPT-5 级推理进入语音交互GPT-Realtime-2 是 OpenAI 首个在语音对话中集成 GPT-5 级别推理能力的模型。与上一代 GPT-Realtime-1.5 相比,核心升级包括:上下文窗口从 32K 扩至 128K tokens,支持在更长语音会话中维持用户约束、偏好和业务逻辑。支持工具调用(function calling),可在对话过程中实时查询日历、搜索系统等外部工具,并支持 MCP 协议。...
Anthropic 在 2026 年第一季度完成了 Claude 对 Microsoft Office 三件套的全覆盖,并通过跨应用上下文共享功能,让 Claude 在 Excel、PowerPoint、Word 之间保持统一的对话语境。这是 Claude 首次深度嵌入企业办公工作流,直接对标微软自家的 Copilot。时间线:3 个月完成 Office 全覆盖2026 年 3 月至 4 月,Claude 接入 Office 的节奏明显加速:3 月 9 日:微软在官方博客宣布 “Copilot Cowork”,将 Claude Cowork 技术集成进 Microsoft 365 Copilo...
OpenAI 将 Codex 的浏览器操作能力从桌面端 Computer Use 延伸到了 Chrome 扩展,主打已登录态的 Web 应用交互,与 Anthropic “Claude in Chrome” 正面竞争。发布信息与安装方式2026 年 5 月 7 日,OpenAI 在 Chrome Web Store 上架了 Codex 浏览器扩展(扩展 ID: hehggadaopoacecdllhhajmbjkdcmajg),版本号 1.1.4。适用于 Mac 和 Windows。安装路径:打开 Codex 桌面应用 → Plugins → 添加 Chrome 插件 → 完成 Chrome ...
xAI 作为独立公司仅存在不到三年,其 AI 业务整体降格为 SpaceX 内部部门,合并后实体估值 1.25 万亿美元,为 SpaceX IPO 铺路。官方宣布:xAI 解散,更名为 SpaceXAI2026 年 5 月 6 日,马斯克在 X 平台发布帖子:“xAI will be dissolved as a separate company, so it will just be SpaceXAI, the AI products from SpaceX.”同日另一条帖子中,马斯克承认组织架构存在问题:“xAI was not built right first time around,...