AI DAILY · 2026-04-24 · 周五
AI 日报 / 2026 年 04 月 24 日
今日收录 58 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
GPT-5.5
14 项基准登顶,OpenAI 转向按任务结果收费
DeepSeek V4
1.6T MoE 开源
国产模型集体爆发
腾讯 Hy3、小米 MiMo-V2.5、Kimi K2.6 同日发布
TPU v8
Google 首次拆分训练/推理芯片,TorchTPU 原生支持 PyTorch
30GW
OpenAI 算力规划曝光,或将消耗全美 6% 电力
$2748亿
Q1 全球 AI 融资创历史纪录
大模型
8 条
OpenAI 发布 GPT-5.5:14 项基准测试登顶,重新夺回最强王座
OpenAI 正式发布 GPT-5.5(代号 Spud),融合 GPT 系列生成能力与 o1 结构化推理框架。在保持与 GPT-5.4 几乎相同的每 token 延迟下,14 项基准测试全部达到 SOTA,更少的 token 完成相同 Codex 任务,实现性能和效率双重跃升。模型可稳定自主运行近 10 小时长任务,内测工程师称『失去它像被截肢』。
GPT-5.5OpenAIbenchmarkreasoningagentic
DeepSeek V4 全量发布:1.6T MoE 开源模型,百万上下文成标配
DeepSeek 正式发布 V4 旗舰模型,采用 1.6T 参数混合专家架构(MoE),支持百万 token 上下文窗口。全链路去 CUDA 化,确认运行在华为昇腾处理器上,Apache 2.0 开源协议。API 定价每百万 token 仅 0.3 美元,比 GPT 旗舰便宜十倍。HN 热度 439 分,173 条评论。
DeepSeek V4MoEopen-sourceHuawei Ascendmillion-context
腾讯混元 Hy3 Preview 发布并开源
腾讯混元团队发布 Hy3 Preview 语言模垴并开源,总参数 295B、激活参数 21B 的 MoE 架构,采用快慢思考融合设计,最大支持 256K 上下文。在代码、Agent、通用能力上全面对标头部闭源模型,主攻实用性和性价比。
腾讯混元Hy3MoEopen-source
小米 MiMo-V2.5-Pro 公测:多模态 Agent 模型全面升级
小米正式发布 MiMo-V2.5 系列大模型并开启公测,包含 V2.5、V2.5-Pro、V2.5-TTS 及 V2.5-ASR 四个版本。Pro 版在 Agent 能力和长程连贯性上大幅提升,原生搭载极速视觉与音频解析系统,支持跨模态端到端推理,对标 GPT-5.4。
小米MiMo-V2.5multimodalagentopen-source
Anthropic 发布 Claude 质量事故事后报告,解释 Claude Code 性能下降
Anthropic 发布 4月23日事后分析报告,承认近期 Claude Code 用户反馈的性能下降问题。通过回滚推理策略变更和冗长提示、修复 v2.1.116 版本缓存 bug 来解决。此前 AMD 资深总监在 GitHub 公开声讨 Claude 已退化到无法执行复杂工程的地步,HN 帖子获 636 分。
AnthropicClaude Codepostmortemqualitydegradation
Claude Opus 4.7 杀疯了:视觉能力接近满分,跨界硬刚 Adobe 和 Figma
Anthropic 发布 Claude Opus 4.7,视觉能力从 50% 跃升至接近满分,编程基准分提升至 64.3%。同时推出 Claude Design 产品,支持一句话生成 UI 原型、幻灯片和设计稿T被解读为直接挑战 Adobe 和 Figma。福布斯同期发布的 AI 50 榜单中,Anthropic 累计融资位列第一。
Claude Opus 4.7Claude DesignvisionAdobeFigma
Kimi K2.6 开源发布:13 小时不间断编码,300 个子 Agent 并行
月之暗面正式发布并开源 Kimi K2.6,长程编码能力显著提升——测试中可不间断编码 13 小时、编写或修改超 4000 行代码。增强 Agent 自主执行能力,支持 300 个子 Agent 并行调度。多项基准测试成绩持平或超越 GPT-5.4、Claude Opus 4.6。但上线期间因访问量激增出现排队,已重置全员额度补偿。
Kimi K2.6Moonshotopen-sourcecodingagent
福布斯 AI 50 榜单发布:OpenAI、Anthropic 领衔,20 家新公司上榜
福布斯发布第八届 AI 50 强榜单,OpenAI 和 Anthropic 两家累计融资 2426 亿美元,约占上榜企业总融资额的半数。本届有 20 家新公司上榜,反映了 AI 行业创新生态持续扩张。
Forbes AI 50OpenAIAnthropicfundingstartups
训练推理
6 条
GPT-5.5 推理效率惊人:更少 token 完成同任务,提速 20%
OpenAI 披露 GPT-5.5 的核心工程突破:模型能自我优化推理基础设施,在完成相同 Codex 任务时使用的 token 数显著减少,推理速度提升约 20%。这一进展标志着 AI 推理不再以牺牲延迟为代价换取更高智能。
GPT-5.5inferenceefficiencytokenoptimization
腾讯 Hy3 采用快慢思考融合架构:295B 参数仅 21B 激活
腾讯混元 Hy3 Preview 总参数 295B,但激活参数仅 21B,采用快慢思考融合的 MoE 架构。这种设计在不牺牲推理质量的前提下大幅降低计算成本,是 MoE 架构在推理效率方面的又一实践案侴。
Hy3MoEfast-slow-thinkingefficiencyinference
Claude Code 性能回滚:Anthropic 的工程反思
Anthropic 在事后报告中详细说明了解决 Claude Code 性能下降的过程:回滚推理努力变更、修复缓存 bug、优化提示冗长问题。这份透明的工程报告在开发者社区引发广泛讨论,HN 帖子获 636 分和 493 条评论。
AnthropicClaude Coderollbackengineeringquality
Kimi K2.6 内部代码评测成绩提升约 20%
月之暗面披露,Kimi K2.6 在内部代码评测基准 Kimi Code Bench 中相比上一代 K2.5 成绩提升约 20%。长程编码能力显著增强,可独立完成复杂系统开发与优化,支持连续 13 小时不间断编码。
Kimi K2.6code-benchmarktrainingimprovementlong-horizon
OpenAI 不再卖 Token:GPT-5.5 的商业化新范式
OpenAI 在 GPT-5.5 发布中透露重要商业化转向:不再按 token 收费,而是按任务结果收费。GPT-5.5 以更少 token 完成同等任务的效率,使得按结果定价成为可能,这可能彻底改变 AI API 的商业模式。
GPT-5.5pricingtokenbusiness-modelresult-based
MeshCore 团队因 AI 生成代码分裂:开源治理的新难题
开源项目 MeshCore 开发团队公开分裂。核心成员 Andy Kirby 被发现秘密使用 Claude Code 重写了大部分代码库,随后在未告知团队的情况下申请了商标。HN 帖子获 193 分,104 条评论,引发开源社区对 AI 生成代码知识产权归属的广泛讨论。
MeshCoreAI-codetrademarkopen-sourcegovernance
Agent
7 条
OpenAI 推出 Workspace Agents:从聊天到跨渠道执行
OpenAI 为企业用户推出 Workspace Agents,可从 ChatGPT 创建和访问,用户还能将 Agent 添加到 Slack 等第三方应用中实现跨渠道沟通。这意味着 Agent 从对话工具升级为真正的企业执行系统。
OpenAIWorkspace AgentsSlackenterprisemulti-channel
BAND 推出通用编排器:让不同厂商的 Agent 互相协作
新创业公司 BAND 发布『通用编排器』(Universal Orchestrator),采用确定性路由的 Agentic Mesh 架构,可编排来自不同模型提供商的企业 AI Agent 进行跨平台协作。企业已经在混用多种 Agent 模型,统一编排的需求已经成熟。
BANDorchestratoragentic-meshmulti-agententerprise
斯坦福新研究:单个 Agent 往往优于复杂多 Agent 系统
斯坦福大学最新研究挑战了『更多 Agent 意味着更好 AI』的假设,发现单个 Agent 在多数场景下优于复杂的多 Agent 系统,并提出简单的计算预算修复方案。该研究对 Agent 架构设计有重要指导意义。
Stanfordmulti-agentresearchbenchmarkefficiency
Salesforce Agentforce Vibes 2.0:解决 Agent 上下文过载问题
Salesforce 发布 Agentforce Vibes 2.0,通过新增的『能力』和『技能』两个概念增强 Agent 执行能力——能力定义 Agent 目标,技能则是实现目标的工具。该框架旨在解决 Agent 长期运行中的上下文过载问题。
SalesforceAgentforcecontextenterpriseframework
Infisical 开源 Agent Vault:Agent 的凭证安全代理
安全管理厂商 Infisical 发布 Agent Vault,一个专为 AI Agent 设计的开源凭证代理。Agent 通过该代理使用凭证而永远不直接持有密钥,有效防止提示词注入攻击导致凭证泄露。HN Show HN 帖子获 98 分。
Agent VaultInfisicalsecuritycredentialopen-source
Google 发布企业 Agent 构建工具:向智能体时代操作系统迈进
Google 为企业用户推出新的 Agent 构建工具,被解读为 Google 想要做智能体时代的『企业 Windows』。同时 Google Deep Research 和 Deep Research Max 代理基于 Gemini 3.1 Pro 模型,面向金融、生命科学和市场情报领域。
Googleagent-builderenterpriseGeminiDeep Research
OpenClaw 4 月更新:节点执行重大变更,统一运行时模型
开源 Agent 框架 OpenClaw 发布 4 月更新,带来节点执行的重大变更、OpenAI 兼容性修复,以及面向生产环境的统一运行时模型。Agent 框架之争持续升温,LangGraph、CrewAI、AutoGen 等 8 大框架全面进入工业级应用阶段。
OpenClawagent-frameworkruntimeproductionopen-source
基础设施
6 条
Google 发布第八代 TPU:训练和推理芯片首次分道扬镳
Google 在 Cloud Next 大会上发布第八代 TPU,首次将训练和推理拆分为两款独立芯片:TPU 8t 专攻前沿训练,TPU 8i 优化代理推理和高并发场景。训练芯片算力是上代的 3 倍,推理芯片专注于后训练优化。采用 Broadcom 负责训练芯片、MediaTek 负责推理芯片的分工策略。
Google TPU v8TPU 8tTPU 8itraininginference
OpenAI 30GW 算力规划曝光:或吃掉全美 6% 电力
泄露的投资人备忘录显示,OpenAI 计划到 2030 年实现 30GW 算力规模,当前已锁定 8GW 资源。这一规模或将消耗美国 6% 的电力,硅谷 AI 战争已从实验室打到发电厂。CNN 同日报道指出 AI 算力增长正在与有限能源产生正面碰撞。
OpenAI30GWelectricitydata-centerpower-grid
Google 发布 TorchTPU:让 PyTorch 在 TPU 上原生运行
Google 正式发布 TorchTPU 工程栈,实现 PyTorch 框架在 TPU 上的原生高效运行,只需极少代码修改。此举打破 TPU 与 TensorFlow 深度绑定的生态局限,直接挑战 NVIDIA CUDA 在 AI 开发者社区的垄断地位。HN 帖子获 105 分。
TorchTPUPyTorchGoogleTPUCUDA
Google Gemini 可在单机隔离服务器运行
Google 将 Gemini 打包在 Dell 制造的硬件设备中,配备 8 块 NVIDIA GPU,带有机密计算保护,可完全脱离互联网部署。这一产品面向对数据隐私有极高要求的政府和企业客户,标志着 AI 模型部署方式的新选项。
Google Geminiair-gappedon-premiseDellprivacy
AI 银河猎手加剧全球 GPU 短缺
TechCrunch 报道,使用 AI 寻找星系的天文学家正在加剧全球 GPU 短缺问题。科学研究对 GPU 的需求增长与 AI 商业应用形成竞争,凸显了算力资源分配的深层矛盾。
GPUshortagecomputeastronomyresearch
硅谷 AI 数据中心建设暗涌:影子电网引发污染担忧
科技公司正在硅谷悄然建设并行电力基础设施,为 AI 数据中心建造私人发电厂。这些『影子电网』在满足巨大算力需求的同时,也引发了空气污染和环保方面的担忧。
Silicon Valleydata-centerpower-gridpollutioninfrastructure
机器人
5 条
北京人形机器人半马落幕:液冷散热成制胜关键
2026 年北京人形机器人半程马拉松正式落幕,相比 2025 年赛事,本届在规模和技术上均有显著提升。荣耀机器人借助液冷散热技术夺得冠军,展现了散热技术在机器人长时间运动中的关键作用。
humanoidmarathonliquid-coolingcompetitionBeijing
智谱机器人携宇树亮相:第三代人形机器人年中发布
消息称特斯拉将在年中发布第三代人形机器人,同时宇树科技展示了轮足人形机器人。多家企业正在加速将具身智能从概念推向商业落地,AGIBOT 在合作伙伴大会上公布了激进的 2027 年增长计划。
Tesla宇树科技AGIBOThumanoidembodied-AI
中汉诺威工业展:中联重科全球首发 Robot Ops 具身智能操作系统
在 2026 年汉诺威工业展(4月20-24日)上,中联重科全球首发 Robot Ops 具身智能操作系统,面向工业场景的智能机器人调度管理。中国企业在具身智能商业化方面正在加速国际布局。
Hannover MesseRobot Ops中联重科embodied-AIindustrial
AGIBOT 发布新一代具身 AI 机器人和模型
全球领先的具身智能机器人公司 AGIBOT 发布新一代具身 AI 机器人和模型,加速物理 AI 的实际部署。该公司正在从概念验证阶段转向商业化落地,通过与多家制造企业的合作推动具身智能在工业场景的应用。
AGIBOTembodied-AIphysical-AIrobotmanufacturing
中国具身 AI 融资创新高:Spirit AI 30 天融 30 亿元
2026 年 4 月成为具身 AI 融资最火热的一月。Spirit AI 在 30 天内完成 30 亿元人民币融资,Aheadform 完成A轮融资。具身智能正成为 VC 最拥挤的赛道之一。
embodied-AIfundingSpirit AIventure-capitalChina
多模态
5 条
GPT Image 2 发布:99% 文字渲染准确率,LM Arena 登顶
OpenAI 发布 GPT Image 2(ChatGPT Images 2.0),实现约 99% 的文字渲染准确率、4K 分辨率输出,支持推理驱动的生成架构。支持中英文等多语言文字排版、网页截图模拟、社交媒体模板等。Sam Altman 称其为『从 GPT-3 到 GPT-5 级别的飞跃』。LM Arena ELO 1512 登顶。
GPT Image 2text-rendering4Kimage-generationLM-Arena
蔡浩宇新视频模型 LPM 1.0 发布:给游戏行业造新引擎
米哈游创始人蔡浩宇推出的新视频生成模型 LPM 1.0 只是冰山一角,真正在造的是下一个时代的游戏引擎。该模型被视为将改变游戏资产生产流程的革命性工具,极客公园深度报道引发行业热议。
LPM 1.0蔡浩宇video-generationgame-enginemiHoYo
胡渊鸣的 Meshy ARR 突破 4000 万美元:3D AI 生成进入快车道
清华姚班出身的胡渊鸣创办的 Meshy,已成为全球 3D 生成式 AI 领域的领军企业,ARR 突破 4000 万美元。从文字、图像到视频,3D 很可能是生成式 AI 重写的下一个领域。
Meshy3D-generationARRHu Yuanminggame-assets
Buzzy 融资 2000 万美元:推出视频版 Photoshop
ARR 同为 2000 万美元的 AI 公司 Buzzy 完成新一轮 2000 万美元融资,推出被称为『视频版 Photoshop』的产品。用户只需对话即可编辑和生成视频,告别 AE、PR 等传统工具。
Buzzyvideo-editingAIfundingPhotoshop
OpenAI GPT-Image 2 引发伦理争议:有图无真相时代来临
GPT Image 2 的超逼真能力引发伦理担忧,中文排版准确率 99% 意味着 AI 生图已可用于制造高度逼真的假新闻图片。36Kr 评论称『伦理失守比技术突破更可怕』,需要建立图片真实性验证机制。
GPT Image 2ethicsdeepfakemisinformationAI-safety
投融资
6 条
奥明星程完成超亿元 A 轮融资:三位哈佛博士联手打造 AI4S 基建
AI for Science 公司奥明星程完成超亿元 A 轮战略融资,由深创投与复星医药(复健资本)联合领投。三位哈佛博士创立,构建基于大模型的个体健康趋势预测及疾病干预系统,已与超 50 家三甲医院及百余家体检机构合作。一年内融资规模超 5 倍增长。
奥明星程AI4SA-roundhealthcareHarvard
NeoCognition 完成 4000 万美元种子轮融资:构建类人学习 Agent
AI 研究实验室 NeoCognition 走出隐身模式,完成 4000 万美元种子轮融资,Cambium Capital 和 Walden Catalyst 联合领投,英特尔 CEO Pat Gelsinger 参投。公司专注于构建能像人类一样学习的自学习 AI Agent,提升企业级 AI 可靠性。
NeoCognitionseed-funding$40Mself-learningagents
ERA 融资 1100 万美元:构建 AI 小工具软件平台
初创公司 ERA 完成 1100 万美元融资,用于构建面向 AI 小工具(AI Gadgets)的软件平台。随着 AI 硬件设备越来越多,统一的管理和开发平台需求日益迫切。
ERA$11MAI-gadgetsplatformfunding
Sierra 收购 YC 背景的 AI 初创 Fragment
Bret Taylor 创办的 AI 公司 Sierra 收购了 Y Combinator 支持的 AI 初创公司 Fragment。Sierra 致力于为企业提供 AI 客户服务解决方案,此次收购将进一步增强其技术实力。
SierraFragmentacquisitionYCenterprise-AI
Buzzy 完成 2000 万美元融资:AI 视频编辑赛道持续火热
AI 视频编辑公司 Buzzy 完成 2000 万美元融资,ARR 同为 2000 万美元。当 AI 生成视频技术足够成熟后,应用层的机会集中在内容生成之前和内容生成之后两个环节。
Buzzy$20Mvideo-editingARRfunding
Q1 2026 全球 AI 创业融资 2748 亿美元创历史纪录
数据显示,2026 年 Q1 全球 AI 初创融资达 2748 亿美元,涉及 807 起融资事件,平均每天有近 9 起融资发生。单季融资额创历史纪录,OpenAI 单轮 1220 亿美元独占鳌头。Series B 轮平均融资额达 1.05 亿美元。
Q1-2026VC-funding$274.8BrecordAI-startups
行业
11 条
Meta 宣布裁员 10%:约 8000 名员工
Meta 宣布将裁减约 10% 的员工(约 8000 人),以提高运营效率。Meta 还表示将记录员工按键操作用于训练 AI 模型,引发隐私争议。HN 帖子获 521 分和 496 条评论。
Metalayoffs10%AI-trainingprivacy
甲骨文全球裁员 30000 人:为 560 亿美元 AI 数据中心计划融资
甲骨文 3 月裁员约 30000 人(占员工总数 18%),是公司 48 年历史上最大规模裁员。此举旨在为 560 亿美元的 AI 数据中心扩张计划融资。一封五行邮件在清晨 6 点通知员工被裁,引发广泛关注。
Oraclelayoffs30000AI-data-center$56B
OpenAI 与 Infosys 合作,将 AI 工具推广到更多企业
OpenAI 与印度 IT 巨头 Infosys 达成合作,共同将 AI 工具推广给更多企业客户。这是 OpenAI 企业化扩张的重要一步,借助 Infosys 的全球客户网络加速 AI 在传统行业的渗透。
OpenAIInfosysenterprisepartnershipglobal
Anthropic 与 Thinking Machines Lab 达成数十亿美元合作
独家报道:Google 通过一项新的数十亿美元交易加深了与 Thinking Machines Lab 的联系。该实验室由前 Google 研究员创办,专注于 AI 安全和可解释性研究。
AnthropicThinking Machines LabGooglepartnership$billions
Bitwarden CLI 在供应链攻击中被植入恶意代码
密码管理器 Bitwarden 的 CLI 工具在持续的 Checkmarx 供应链攻击中被植入恶意代码。HN 帖子获 709 分,引发开源软件供应链安全问题的广泛讨论。
Bitwardensupply-chainsecuritymalwareopen-source
X 推出 AI 驱动的自定义信息流
X(原 Twitter)推出由 AI 驱动的新自定义信息流功能,可根据用户兴趣自动筛选和排序内容。TechCrunch 上手体验后认为,这是社交平台全面 AI 化的最新案例。
XTwitterAI-feedpersonalizationsocial-media
Google Workspace 大更新:AI 成为办公室新实习生
Google 全面更新 Workspace 办公套件,将 AI 深度整合进 Gmail、Docs 等核心产品。AI 概览功能进入 Gmail 工作场景,Google Maps 也即将迎来大规模 AI 功能整合。
Google WorkspaceGmailAI-overviewproductivityenterprise
Mythos 遭未经授权访问:Anthropic 专有网络工具有关
报道称一个未经授权的组织已获取 Anthropic 专有 AI 网络工具 Mythos 的访问权限。HN 上有开发者测试 Mythos 在 Firefox 上的表现后认为『炒作过多』。Anthropic 对此事件尚未正式回应。
MythosAnthropicunauthorizedcyber-toolsecurity
NoScroll:一个替你刷手机负面新闻的 AI 机器人
TechCrunch 介绍了一款名为 NoScroll 的 AI 机器人,可以代替用户进行『末日刷屏』——自动浏览和筛选负面新闻。这款产品反映了 AI 在信息消费领域的创意应用。
NoScrollAI-botnewsinformation-dietwellness
AI 药物发现新突破:如何从海量 AI 生成分子中筛选真正有价值的
AI 正在生成比以往更多的潜在药物分子,但如何从中筛选出真正有临床价值的候选药物成为新挑战。TechCrunch 报道了一家初创公司正在解决这个问题,AI 药物发现从『生成』进入『筛选』阶段。
drug-discoveryAIpharmamoleculesscreening
一年烧掉 1850 亿美元的 AI 行业:智能体时代的操作系统之争
极客公园深度分析指出,AI 行业一年烧掉 1850 亿美元,Google、OpenAI、Anthropic 等巴头都在争夺智能体时代操作系统的位置。企业 Agent、编排工具和基础设施成为新的竞争焦点。
AI-industry$185Bagent-OScompetitionecosystem