2026年04月24日
最后更新:2026-04-24 08:03:07 UTC+8
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布临床版 ChatGPT 提升医疗效率。月之暗面推出 Kimi K2.6 支持多智能体协作。谷歌 Chrome 浏览器升级 Gemini 实现自动化。海信发布 AI 芯片电视提升画质与操控体验。谷歌发布 Gemma 4 支持完全离线和数据保护。索尼乒乓球机器人成功击败人类顶级球员。X 平台上线 Grok 驱动的自定义时间线功能。YouTube 推出新工具防止 AI 伪造明星肖像。前沿研究滴滴与清华发布 STAPO 算法提升自驾表现。英伟达在 Orin 平台实现视觉语言模型控制。科学家研发去噪递归模型提升机器推理...
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新GPT-Image-2 登顶文生图竞技场并刷新纪录。谷歌 发布 Gemini 深度研究智能体更新。Meta 升级脸书群组搜索架构提高效率。谷歌 举办 AI 峰会并发布多项新产品。特斯拉 准备量产无方向盘无人驾驶汽车。前沿研究研究人员 发布内窥镜 AI 超分可靠性框架。研究者 利用新技术增强视频生成一致性。斯坦福大学 推出多模态实时视觉溯源框架。研究者 发布类脑视觉解码框架提高准确度。行业展望与社会影响SpaceX 计划巨资收购编程编辑器 Cursor。ControlAI 募资五千万美元以降低灭绝风险。美国国家安全局 获权访问相...
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布 Codex 屏幕记忆功能。Google 开放 AI Studio 高级模型权限。前沿研究人大 发布长程记忆科研系统。北大团队 突破 3D 空间推理瓶颈。VeriMoA 架构 提升芯片设计效率。科学家 发现 FP16 推理存在风险。行业展望与社会影响库克 转任主席且硬件主管接棒。OpenAI 开始售卖对话相关广告。人形机器人天工 跑赢北京半马。苏度科技 发布具身智能大模型。Anthropic 专家 向白宫提供防御技术。特斯拉 被指隐瞒自动驾驶事故。马斯克 宣布 Grok 5 冲击通用智能。开源TOP项目......
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Claude 4.7 升级安全架构并增强防御。X平台上线Grok长文自动总结功能。X平台开放CLI接口支持代理调用。前沿研究伯克利团队揭露AI评测作弊黑产。华科大发布MoDA架构实现深度检索。新型交互系统通过动态调节稳定场域。自动形式化技术引发数学逻辑争议。高德发布ABot体系实现全自主行动。北大发布研报探讨世界模型因果逻辑。行业展望与社会影响OpenAI 联手 Cerebras 提升芯片算力。Meta 从初创公司精准挖角顶级人才。高带宽内存短缺引发供应链风险。杨立昆发文否认人工智能导致失业。加拿大政府巨额资助引发公平性讨论。...
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Bolt 推出 MCP 连接器实现跨项目代码复用。Luma AI 发布制作方案降低电影创作成本。马斯克 发布 Grok 语音接口且价格非常便宜。马斯克 上线 xChat 支持转账等多种功能。前沿研究Kimi 推出新技术提升长文档模型推理速度。研究者 开源点云框架并支持自动编写论文。行业展望与社会影响OpenAI 投资芯片公司助力其上市重塑格局。苏州 企业集群通过光模块技术支撑全球算力。Cursor 洽谈新融资且估值直冲五百亿美元。Meta 打造扎克伯格 AI 分身用于管理员工。彭博社 称专家对 AI 影响就业的预测有误。开源T...
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新Anthropic 发布 Claude Design 语音生成设计草图。阿里发布快乐生蚝模型支持用户自主探索数字场景。OpenAI 发布 GPT-Rosalind 帮助加速新药研发。OpenAI 推出 GPT-Image-2 提升了图像文字排版能力。阿里开源 Qwen3.6 编程模型且性能媲美超大模型。前沿研究AI 陪审团在医疗诊断方面的表现已经超过了专家。RUMS 记忆技术问世并大幅降低了大模型的算力消耗。字节跳动首创 DisCoGC 架构提升了数据回收效率。Dr. RTL 框架可自主优化电路设计并提升芯片性能。行业展望与社...
前往官网查看完整版 (ai.hubtoday.app)产品与功能更新OpenAI 发布 Codex 桌面版,支持直接操作电脑。Claude 4.7 发布,提升了推理精度与图像识别能力。Meta 发布智能体平台,可自动修复漏洞并降低能耗。Google 推出苹果端 Gemini,支持读取本地文件。阿里发布 Meoo 工具,支持通过对话快速生成网页。OpenAI 发布新模型,用于增强网络安全防护能力。前沿研究GraphScout 框架让模型具备自主图推理能力。UniBlendNet 技术可修复复杂光照并还原图像细节。DelAnyFlow 模型可极速识别全国农地边界。PMG 架构支持在边缘设备上实现极...
1/ 前一阵子一打开候选内容库,满屏的「小龙虾」;最近风向转了,都在明里暗里讨论「蒸馏某人/职能」(尤其今天早上看到 小扎演都不演了)。此情此景,让我很想化用经典,吟诗一首——开始他们蒸馏翻译、运营、程序员、打字员,我没说什么,因为我不是干这行的;后来他们蒸馏产品经理、分析师、设计师、编剧、作家、演员、销冠,我还是没说什么,因为我觉得与我无关;接着他们蒸馏教师、律师、医生、会计、记者,我依然没说什么,因为我暂时还能站着;最后他们来蒸馏我时,环顾四周,已经没有人能替我说话了。—— 只剩下 Agent 对我冷冷嗤笑。2/ 最近基友开发的笔记产品 flomo 迎来了六周年,近期相继推出了(或即将推出...
1/ 一晃这个周更 Newsletter 都写到 EP #52 了。算上中间偶尔停更的那一两期,满打满算也是写满一年了。目前也仍是最大的中文 AI 商业类 Newsletter。期间 AI 光速发展,我的技术栈也迭代了好几版。从最开始希望逐渐全自动完成,到现在坚定了用机器帮我半自动分拣 + 最终人工精拣筛,也算摸出了固定套路。域名注册为 ZengZhang.ai,原本还是想从老本行的「商业增长」视角切入,不采编纯技术向(却没结合实际应用场景落地的)内容。但发现即便是聚焦在商业领域,市面上公开披露的案例,仍会有大量浅薄重复的,观点也不乏空泛的宏大叙事或孱弱的未来预测。所以现在我完全按我主观标准,...
今天推荐一款新产品 —— Vibe Island(官网 https://vibeisland.app ,先不用急着下单,看到最后有福利)。它的作者之一 Edward Luo 是一位曾经搞过艺术、现在在搞产品的设计师,也是这个 Newsletter 的 VIP 成员,因此我必须大力帮忙宣传一波。Vibe Island 的界面,主要就是一个位于 Mac 电脑刘海屏的展示区(电脑没有刘海也能用,会虚拟一个刘海区域出来)。点击刘海屏时,面板会展开,显示当前所有正在运行的 AI Agent 会话及其各种状态(作者推特的演示视频)。你在用 Claude Code / Codex / Gemini / Cu...
最近各家都开始出官方 CLI 了,我也开始陆续把自己常用的CLI(/MCP)整合进我自己的贾维斯了,包括 Podwise、飞书、滴答清单、flomo 等。在此特别推荐 Podwise 新出的 CLI(Github 主页)。以防你不知道:Podwise 是我一直在用的「信息套利」工具,可以专门用来压榨那些有信息量的硬核播客/YouTube 视频的价值。转录文字稿、总结洞察、信息可视化、同步笔记。推荐出去,用了都说好(我之前录制过一期 YouTube 视频来介绍它)。我用它的 CLI 做了几个 skills,譬如直接将常听常看的节目的最新一期的文字稿(包括其他 AI 精炼内容),拉取到本地,经过我...
上周休更了一期。因为几个事情:首先是 Claude Code 最近非常不稳定,我的 Claude 账号池又突然被封了,导致我重构到一半的系统崩了,各种运转难以为继。赶上我要处理公司业务,没时间修,就崩在那里足足一个礼拜。在此期间我还有出差,时间被挤占。筛选出来的内容,又几乎都是各种围绕「龙虾」的玩法和观点,给我看吐了。几件事凑在一起,我想索性趁着春光明媚,鸽一期得了,既弥补一下近期高强度熬夜玩 AI 的身体透支、亲近一下自然,也看看有多少人真的在乎这个 Newsletter。过去两周也走访了一些企业,围绕搭建企业内私有化智能体的话题做了些分享与探讨,并看到了 AI 在组织中落地的几种形式。参观...
最近这一周,围绕「龙虾(OpenClaw)」及其衍生产品的各种新闻、案例、八卦仍在爆火,我检测到的案例,基本都在聊龙虾。想必各位也被轰炸疲劳了,加之上周我也一口气汇总了不少龙虾的资讯和信息源,因此这周,为了降低噪音,「案例」部分我就只放一篇,并不打算凑篇幅。如果你已经折腾过龙虾,判断出还是自己搭建更省钱、可控、安全,不妨购买 我的 DIY 贾维斯课程 看看,本质就是在讲搭建一套自己的龙虾系统。另外,今天跟 flomo 团队的两位创始人交流,在聊到龙虾近期的热度,以及越来越卷的趋势时,Lightory 说了一句堪称点睛之笔:「虾熟了是会卷的」。唔,好冷,建议去开放麦讲程序员脱口秀。Subscri...
▪️PREFACE 卷首语感谢大家支持,本 Newsletter 在没有任何付费投流宣传、仅靠转发和社媒自发传播的情况下,刚刚达成了 14k 的订阅量(依然是简中最大的 AI Newsletter)。通过邮件反馈、社群调查等看来,囊括全球主流 AI/互联网/科技/公司、VC/PE/CVC、孵化器、独立开发者、各行业企业家和决策者。你们都是有眼光的。一年来 PV 突破 30 万,平均每天有 1000 多位真人阅读。虽然跟病毒短视频、传播情绪的大众内容没法比,但作为一个生长在 Substack 平台上、独立域名的、简中内容的 Newsletter 而言,我已经算满意了,今后会继续提供精筛后的、有助...
▪️PREFACE 卷首语这是马年的第一期「增长黑客 AI 周报」,在此祝各位开工大吉、健康富足。《我如何实践打造贾维斯 AI 助手》 课程已在春节前夕正式上线,预购的朋友应该在除夕当天就在邮箱看到了。现在订购的朋友,则会在支付成功后立刻收到邮件。若您尚未收到,请先检查是否被误判进了垃圾箱(因为内含链接较多),仍然没有可联系 xdash@duck.com 出示购买凭证截图,我会手动为您发送。课程是我在一个多月前开始策划的,当时就在课里预判了一些风向,比如 CLI 会成为一种更便捷高效、面向 AI Agent 的软件工具发展趋势。想真正借 AI 提效的朋友,应该稍微看看,掌握一点基本的命令行和编...
如前面预告的,我最近又拿 AI 做了一些好玩的私人玩具,并且愿意把经验深度分享出来。没错,这就是热气腾腾新鲜出炉的《我如何实践打造个人 AI 贾维斯助手》课程。我如约地在马年春节前完成了。赶在了除夕端上来,就是这么卷。春节我得带孩子,你们也甭想闲着了,学起来,卷起来…打造学习型假期……感兴趣的话,可点击下方订购课程现货(会立即自动发货到您的邮箱):https://zerodaybook.mikecrm.com/kctVTes(此前预购过早鸟票的 1000+ 位同学们,请检查你们的邮箱,已经发过去了。如果没看到,可先检查 spam 看看是否误判,如果还没找到可联络我 xdash@duck.com...
▪️PREFACE 卷首语1/ 下周就是春节假期,会停更一期 Newsletter 正刊,专心陪伴家人。这里先预祝各位读者新的一年马到成功,事事顺意~2/ 《我如何实践打造私人 AI 贾维斯助手》 课程正在制作收尾中,会如期在春节前上线,欢迎预购。想在今年的长假里学点东西,不妨看看我亲身实战数月总结出来的落地经验,既适合小白上手,也能启发大牛。现在还是预购阶段,可享受早鸟价。↑ 几页制作中的 PPT 预览,最终交付的是视频课程,提供中外网盘+油管加密链接(已经购买的朋友届时会通过购买时留下的 Email 收到课程链接,我也会在各大社媒、公众号等告知)。Subscribe nowOK,以下是本期...
Anthropic 今天给 Claude Code 终端版本加了一个叫 recap 的小功能:当你把终端切到后台,过一会儿再切回来,Claude Code 会自动在顶部显示一段这个会话刚才干了什么、下一步打算做什么的回顾。功能很小但刀口精准。同时开 5 个 Claude Code 窗口跑 5 个不同任务的人,最大的上下文切换成本不是任务本身,是“我刚回到这个窗口,它刚才在干啥来着”。recap 直接省掉了重新回忆的那几秒钟。几个要点一眼扫完:触发条件:会话至少 3 个 turn + 距离上次完成 turn 过了至少 3 分钟 + 终端当前失焦后台生成:失焦期间就在后台算好,切回来立刻看到,不再...
Google 宣布推出下一代自主研究智能体:Deep Research 和 Deep Research Max,均通过 Gemini API 提供。这是 Google 研究智能体的第二代。去年 12 月已经在 Interactions API 里放过一个预览版,今天直接把能力升了一档,从“写摘要的工具”做成了“能接 MCP、挂私有数据、出完整图表”的工业级底座。驱动模型: 基于 Gemini 3.1 Pro,提供前所未有的控制和透明度。两种模式的对比:Deep Research: 面向速度,降低延迟和成本,适用于需要快速高质量答案的交互式界面。Deep Research Max: 面向深度分析...
昨晚到今早,X 产品负责人 Nikita Bier 连发两条推文,宣布 X 上线了两件互为镜像的新东西。一个管加法:自定义时间线(Custom Timelines),可以把你关心的特定主题置顶到主页 Tab,支持超过 75 个细分话题。一个管减法:主题静音(snooze topics),可以把 For You 里你不想看到的主题调低甚至屏蔽掉,用 Nikita 自己的原话说,“想把 slop 调高调低都可以”。两个工具放在一起看,X 这次给 Premium 订阅用户做的事很简单:把算法推荐从“黑箱喂你”改成“你自己调音”。核心要点:加法工具:自定义时间线支持 75+ 主题置顶到主页 Tab,由...
ChatGPT Images 2.0(OpenAI 最新图像生成模型,内部代号 GPT-Image-2)正式发布,定位从"创意工具"转向"可用输出的视觉工作流平台"。这是 OpenAI 第一次把「会思考」装进图像模型,之前只有 Google 的 Nano Banana Pro 做到了这件事。先让GPT根据它对我的了解生成一张自我介绍… 哈哈哈核心变化:会思考了:先推理再生成,复杂任务可以边想边上网查资料,不是一步出图一次出 8 张连贯图:人物、物体、风格跨图保持一致,多格漫画、故事板、多图系列一次搞定文字不糊了:小字、UI 元素、图标能精确渲染,TechCrunch 实测做餐厅菜单直接能用中日...
月之暗面(Moonshot AI)4 月 20 日开源新版大模型:Kimi K2.6,主攻「代码和 Agent 长时程执行」。在 SWE-Bench Pro 这个测真实代码修改能力的基准上,K2.6 拿到 58.6 分,把 GPT-5.4(57.7)和 Claude Opus 4.6(53.4)都压在身后——这是开源模型第一次挤进闭源旗舰的第一梯队。一句话快速看懂:代码硬跑反超闭源:SWE-Bench Pro 开源第一,Terminal-Bench 2.0 只差 Gemini 3.1 Pro 1.8 分一次指令跑 12 小时不停:4000+ 次工具调用连续执行,Mac 上把一个推理引擎优化到比...
OpenAI 今天给 Codex 加了一个新功能:Chronicle 。让 AI 通过看你最近的屏幕来记住你在干什么。下次你说“帮我改下那个报错”“继续上周那个东西”,它真的知道你指的是什么,不用你再复述一遍。这是上周 Codex 上线的 Memories(记忆)功能的延伸。Memories 只能从历史对话里攒记忆,Chronicle 往前走了一步:直接读屏幕。一眼看完:读屏补上下文:你说“这个报错”“那个文档”,Codex 能从最近的屏幕截图里找到你指的是哪个学你的工作方式:你常用什么工具、在哪个项目来回切、依赖什么流程,它边看边学后台代理生成记忆:不是实时监控,是跑沙盒代理从截图里提炼结构...
Cloudflare Email Service 是 Cloudflare 推出的邮件服务,4 月 16 日进入公测。这次的重点不是给应用发注册邮件、通知邮件这种常规活,而是让 AI 助手能像真人同事一样用邮箱工作:你发邮件给它,它收到、办事、办完了回你。主要变化是这几个:发邮件能力进入公测,所有应用和 AI 助手都能直接调用AI 助手能完整闭环用邮箱了,收到邮件能自己处理几小时再回信给 Claude Code、Cursor 这类 AI 编程工具做了套配套,本地跑的 AI 也能用开源了一个完整的"AI 收件箱"应用,一键部署就能用,新邮件来了 AI 自动起草回信,确认后才发自动帮你配好邮件认证...
核心思路是"写 HTML,渲染出视频",专门为 AI agent 设计。用 HTML + 一些 data-* 属性定义视频,跑个命令就能渲染成 MP4不需要 React,不需要专有的 DSL,不需要拖拽时间轴,agent 已经会写 HTML 了,让它直接生成支持 GSAP、Lottie、CSS、Three.js 等动画运行时,通过 Frame Adapter 模式接入确定性渲染:同样的输入永远产出完全一致的输出,适合 CI 和批量渲染管线自带给 Claude Code、Cursor、Gemini CLI、Codex 用的"skills",把框架的语法规则教给 agentApache 2.0 开...
AI Mode 是谷歌去年在搜索里推出的 AI 对话式搜索模式,你在搜索框里直接问问题,它用 AI 给你生成答案而不是只列一堆蓝色链接。这次它和 Chrome 浏览器深度整合了,主要更新是两个:并排浏览:在 Chrome 桌面端用 AI Mode 搜索,点击结果里的链接,网页会在 AI Mode 旁边打开,不用来回切标签页"+"菜单:搜索框里新增"+"按钮,可以把你当前打开的标签页、图片、PDF 文件一起塞进搜索,让 AI 拿着这些上下文回答你还顺便把 Canvas、AI 图像生成这些 AI Mode 里的工具,也接入了"+"菜单目前美国上线,其他地区陆续开放。并排浏览:搜一下不用切出去以前你...
OpenAI 今天给 Codex 推了一次很大的更新。以前的 Codex 是一个专门写代码的 Agent,你给它一段需求,它帮你写、调试、提 PR,一切都在代码范围里。这次更新之后,它一下子跨出去了。主要更新内容:能操作你 Mac 上的任意 App,看屏幕、点击、打字,后台运行,跟你同时用电脑也不冲突内置图像生成模型 gpt-image-1.5,直接生成 mockup、游戏素材、演示图记住你的偏好、纠正、常用技术栈,不用每次重新铺背景自己给自己排定时任务,可以跨天跨周推进一件事90 多个新 plugins,连 CircleCI、GitLab、Microsoft 套件、Slack、Gmail、N...
文章网址: https://www.bbc.com/news/articles/c9d4zgnqpqeo 评论网址: https://news.ycombinator.com/item?id=47880189 积分: 160 #评论: 122
文章网址: https://joshblais.com/blog/using-the-internet-like-its-1999/ 评论网址: https://news.ycombinator.com/item?id=47881198 积分: 90 #评论: 60
文章网址: https://developers.googleblog.com/torchtpu-running-pytorch-natively-on-tpus-at-google-scale/ 评论网址: https://news.ycombinator.com/item?id=47881786 积分: 19 #评论: 2
你好!我是Luca ,我写了https://refactoring.fm/ ,我为自己构建了Tolaria来管理自己的知识库( 10K笔记, 300多篇文章在超过6年的通讯中编写) ,并与AI很好地合作。Toraria以离线为先,基于文件,对git有一流的支持,对您应该如何组织笔记(类型,关系等)有强烈的意见。让我知道您的想法! Commen...
文章网址: https://www.justice.gov/usao-sdny/pr/us-soldier-charged-using-classified-information-profit-prediction-market-bets?bm-verify=AAQAAAAN_____y6To7sZYZ502biZwIHXlr-7zXZUqV4H0xLTfW__wDA3SjNLqifXRaQwsikyuz6IJknyuL8xfVYRkesxcDk5V10m-HoXl2K93f17rygBphL77WVFoQ_XvlmUo922IwM_DQ66137X6wWMtpdHslcEjpJG7KbBm...
arXiv: 2604.19755v1公告类型:新 摘要:反洗钱( AML )交易监控会产生大量警报,调查人员必须在严格的审计和治理限制下快速分类。 虽然大型语言模型( LLM )可以总结异构证据和草拟原理,但由于幻觉,无约束生成在受监管的工作流程中存在风险,...
arXiv: 2604.19754v1公告类型:新 摘要:学生科学解释的自动评分提供了即时、准确反馈的潜力,但评分标准类别中的课堂不平衡,特别是那些捕捉高级推理的课堂不平衡仍然是一个挑战。 本研究调查了增强策略,以改善基于变压器的学生对物理……的反应的文本分类。
arXiv: 2604.19753v1公告类型:新 摘要:我们提出了一种无特征的算法选择方法,该方法将手工制作的实例特征替换为预训练的文本嵌入。 我们的方法ZeroFolio分为三个步骤:以纯文本形式读取原始实例文件,将其嵌入预训练的嵌入模型,并通过加权k近邻选择算法。 我们AP的关键……
arXiv: 2604.19751v1公告类型:新 摘要:生成式人工智能正在以比当前治理框架更快的速度进入研究、教育和专业工作,可以指定如何在学习密集型环境中判断人工智能辅助输出。 核心问题是代理故障:抛光的文物可能是有用的,而不再是人类理解、判断的可靠证据……
arXiv: 2604.19749v1公告类型:新 摘要:为LLM配备外部工具有效地解决了内部推理的局限性。 然而,它引入了一个关键但未被充分探索的现象:工具过度使用,推理过程中不必要的工具使用。 在本文中,我们首先揭示了这种现象在各种LLM中普遍存在。 然后我们通过实验阐明了它的潜在机制……
提交者/u/MrNewVegas2077 [link] [comments]
今天,我在大约5个小时内完成了所有这些工作,分析了我过去20年的血液测试结果,审查了整个健康行动计划,并根据医生制作的图表进行了审查,这些图表清楚地显示了旅行的方向,并揭示了隐藏在数据中的信息,写了一个小屏幕保护程序,向我展示了Reddit上的顶级人工智能艺术,为我即将推出的一本书建立了整个营销计划...
最近我有幸与Wendell Wallach坐在一起。自从ChatGPT之前,在炒作之前,在大多数技术人员关注之前,他一直致力于人工智能伦理。他撰写了《道德机器》,与Stuart Russell、Yann LeCun和Daniel Kahneman一起工作。他不是评论员,而是几十年来一直在思考这些问题的人。在我们的谈话中,最让我印象深刻的是……
在联邦上诉法院, Anthropic提出了一个引人注目的论点:一旦Claude部署到客户的基础设施(如五角大楼的网络)上,他们就无法更改、更新或召回它。五角大楼希望取消自主致命行动限制,而Anthropic表示,他们没有在部署后强制执行这些限制的机制。这是大型人工智能实验室首次正式统计……
一名联邦法官裁定,您的人工智能对话可以在法庭上被扣押并用于对付您,删除它们无济于事。* * Heppner案( 2026年2月) : * * -前首席执行官布拉德利·赫普纳( Bradley Heppner )利用克劳德( Claude )为他的欺诈辩护做准备-杰德·拉科夫( Jed Rakoff )法官命令他交出31份人工智能生成的文件-裁决:在用户和人工智能平台之间不存在“或可能存在”律师-客户特权*...
嘿,伙计们!在我的公司,我们一直在对STT引擎进行基准测试,并不断遇到同样的问题: WER正在惩罚与实际识别质量无关的格式差异。「50 $」vs「50美元」,「下午3点」vs「下午3点」。两者的转录都很完美,但错误率很低。修复方法是在得分前使双方正常化,但是我们的每个项目都有差异……
一个分享您的想法、祈祷的地方,最重要的是(一旦评价出来,应该很快就会…… ) ,咆哮甚至一些松了一口气的评论。祝大家好运!由/u/WelcomeToFacism提交[link] [comments]
大家好,我一直在针对推理速度和模型大小优化基于变压器的神经网络,但我觉得我已经达到了高原,希望能得到一些指导。到目前为止,我已经将权重转换为FP16 (约减小2倍大小) ,使用ONNX Runtime导出并优化推理速度,并尝试了非结构化和结构化修剪以及ONNX图优化...
好吧,这是我在这里的第一个帖子,潜伏了一段时间。我即将开始我的第一个微调项目,我不想朝着错误的方向前进,所以我想我会问。我的背景:我不是ML背景,自学成才,通过API与LLM合作约一年。在我想做的事情中,及时的工程已经不够了,所以现在我需要采取行动……
TLDR ;我们为OCR支付了过高的费用,因此我们将旗舰机型与更便宜的机型和旧机型进行了比较。全新迷你长凳+排行榜。免费工具,用于测试您自己的文档。开源。我们一直在研究OCR/文档提取工作流程,并一直看到相同的模式:太多的团队要么被困在传统的OCR管道中,要么通过默认为最新/最大的LLM调用而支付过高的费用...
大家好,我一直在研究一个名为guardd的机器学习项目,并希望获得机器学习方面的一些反馈。它基本上是使用Isolation Forest的基于主机的Linux异常检测系统。我正在收集EXEC和网络事件,将它们分组到60秒的窗口中,然后将其转换为由模型评分的特征向量。现在的特点是……
腾讯首席 AI 科学家姚顺雨上任后的首个大语言模型,放弃参数规模竞赛,转向快慢思考融合与低成本实用性。基础设施重建与模型架构腾讯于 2026 年 2 月全面重建预训练与强化学习基础设施。Hy3 preview 是该体系下训练的第一个模型,被官方定义为“迄今最智能的模型”:架构:快慢思考融合的混合专家模型(MoE)。参数量:总参数 295B,激活参数 21B。上下文长度:最大支持 256K。Agent 与核心能力升级研发重心明确转向代码生成与智能体任务的真实可用性,主动规避易被“刷榜”的公开数据集:代码与智能体:在 SWE-Bench(代码)、Terminal-Bench(终端搜索)及 Claw...
距上一代发布仅36天,小米由前 DeepSeek 核心成员主导的新一代多模态大模型落地,主攻百万级上下文、高阶 Agent 自主执行能力,并大幅精简商业 API 定价模型。矩阵构成与开源策略本次公测共释放四款模型:基座模型 MiMo-V2.5、旗舰模型 MiMo-V2.5-Pro,以及语音维度的 V2.5-TTS Series 和 V2.5-ASR。其中,MiMo-V2.5 与 MiMo-V2.5-Pro 确认将于近期向全球开源。该系列研发负责人为前 DeepSeek 核心成员罗福莉。核心演进数据与 Agent 表现MiMo-V2.5-Pro(高阶复杂长程任务):侧重专业生产力场景。官方给出的...
月之暗面正式上线 Kimi K2.6,核心突破在于极高强度的自主编程执行力与最高支持 300 节点并行的 Agent 集群架构,标志着基础模型能力从“代码片段生成”向“系统级工程接管”过渡。超长程自主编码 (Autonomous Coding)基准测试数据:在内部代码评测集 Kimi Code Bench 中,K2.6 较上一代 K2.5 提升约 20%。官方宣称其代码能力基准对标 GPT-5.4。无人值守执行极限:旧系统重构:针对具有 8 年历史的开源金融撮合引擎(exchange-core),K2.6 连续运行 13 小时,发起 1000+ 次工具调用,完成 4000+ 行代码修改,最终将...
Google 调整 AI 开发者工具商业化策略,将 AI Studio 整合至付费订阅体系,通过配额提升与高阶模型绑定加速应用落地。Google AI Studio 正式并入 Google AI Pro 与 Ultra 订阅计划。此举将开发者的工具链与 Google 的高阶订阅服务完成了直接捆绑。核心开发权益更新配额与限制解除:Pro 及 Ultra 订阅开发者获得较基础版本更高的调用限制(具体 QPM/RPM 等扩容数值目前官方尚未在技术文档中明确披露)。高阶模型接入:订阅层用户现已解锁对 Nano Banana Pro(专业级图像生成模型)与 Gemini Pro 模型的全面访问权限。官方...
阿里云上线下一代旗舰大模型早期预览版,通过底层接口支持多轮思维链保留,刷新第三方平台国产大模型评测上限。性能跃升与基准表现Qwen3.6-Max-Preview 定位为千问系列下一代旗舰大模型的早期版本。对比前序释放的 Qwen3.6-Plus 模型,该版本进一步提升了世界知识密度与复杂指令遵循能力。其核心技术突破点在于智能体编程(Agentic Programming),宣称在 6 项相关核心基准测试中取得首位。同时,据第三方基准测试平台 Artificial Analysis 最新追踪数据,该预览版目前的综合性能表现位列国产模型第一。部署与 preserve_thinking 机制该模型当...
Anthropic 推出视觉与长周期推理能力升级的 Opus 4.7 模型,并同步重构 Claude Code 桌面端引入云端并发与自动化任务触发(Routines),标志着 AI 辅助编程从单点对话交互向全自动后台 Agent 工作流实质性演进。Claude Opus 4.7 模型特性与核心数据发版状态与定价:2026年4月16日全量上线。API 计费标准维持 Opus 4.6 水平(输入 $5/M Tokens,输出 $25/M Tokens)。早期内部 API 注册代号为 capybara-v2。视觉解析能力升级:模型可接收长边达 2576 像素(约 3.75 Megapixels)的图...
MiniMax 依托底层 M2.7 模型的代码与推理能力,上线云端 AI 助手 MaxHermes。产品核心在于从“静态工具调用”转向“动态技能自提炼”,并实现 24 小时脱机运行。闭环自主演进机制 (Self-Evolution)MaxHermes 的核心架构基于云端沙箱。有别于单次 Prompt 交互,当其完成复杂长链路任务(如跨组件操作或逻辑推演)后,会自动提炼操作路径,生成可复用的“技能”(Skills)并作为独立文档持久化保存。这些技能在后续触发相同场景时按需动态加载,并通过真实反馈数据不断自我迭代。系统原生支持跨会话记忆(Cross-session memory)和多个子代理(Su...
Google 结束桌面端 AI 的网页依赖,推出基于 Apple Silicon 和 macOS 15 构建的原生 Gemini 客户端,核心通过全局快捷键和“屏幕上下文感知”抢占系统级交互入口。交互重构:纯原生框架与级联唤醒Google 放弃了跨平台 Web 容器套壳方案,采用 100% Swift 进行原生应用开发。客户端引入了系统级唤醒机制(Option + Space 呼出迷你交互对话框,Option + Shift + Space 呼出完整应用界面),对标并试图替代 Spotlight 或传统浏览器的搜索习惯。屏幕上下文感知 (Context-Awareness)客户端的核心差异化能...
谷歌推出横跨 2B 至 31B 的 Gemma 4 模型矩阵,通过强化原生多模态解析、MoE 架构及显式推理控制(Thinking Mode),确立了从端侧设备到云端服务器的开源 Agent 开发基准。架构规格与核心参数发布版本包含四个参数梯队,底层统一采用 Transformer 架构并全系拓展多模态支持:Effective 2B (E2B) & Effective 4B (E4B):专为端侧部署设计,引入单层嵌入(Per-Layer Embeddings, PLE)技术以最大化参数利用率。支持 128K 输入上下文。26B A4B (MoE):混合专家架构,总参数量 260 亿,单次前向传...
抛弃单一的对话框形态,趣丸集团关联团队通过“世界地图+分支剧情”的 RPG 化改造,推动 AI 陪伴从“单点聊天”向“共创冒险”演进。交互范式 RPG 化由“谜境”开发商(上海小煎饼信息科技,系趣丸集团关联实体)研发的“叽伴” App 正在重构 AI 社交玩法。该应用跳出了传统的纯文本对话框架,引入设定世界地图与室内场景扩展。AI 角色具备初步的空间与场景感知逻辑,支持“立绘焕装”(依据所处地图场景自动切换视觉表现)。用户支持自定义地图,将交互场景从扁平的聊天窗口升级为带有环境上下文的角色扮演(TRPG)冒险。记忆实体化与叙事非线性应用底层引入了多智能体(Multi-Agent)协同机制,不仅...