AI MONTHLY · 2026年4月
AI 月报 / 2026年4月
本月收录 471 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
📌 本月核心事件
GPT-5.5
14 项基准登顶,OpenAI 转向按任务结果收费
DeepSeek V4
1.6T MoE 开源,全链路跑华为昇腾
国产模型集体爆发
腾讯 Hy3、小米 MiMo-V2.5、Kimi K2.6 同日发布
TPU v8
Google 首次拆分训练/推理芯片,TorchTPU 原生支持 PyTorch
30GW
OpenAI 算力规划曝光,或将消耗全美 6% 电力
$2748亿
Q1 全球 AI 融资创历史纪录
$400亿
Google 宣布投资 Anthropic,估值达 3500 亿美元
$250亿
亚马逊同步加码 Anthropic,AI 初创单周吸金 650 亿美元
$300亿
Anthropic 年化收入突破 300 亿美元,较去年底暴增 3 倍
Matz
Ruby 之父发布 Spinel AOT 编译器,性能提升 11.6 倍
ml-intern
HuggingFace 开源 ML 工程师智能体,日增近 3000 星
777分
HN 热帖「我取消了 Claude」,用户集中投诉质量下降
DeepSeek 大幅降价
V4-Pro 输入缓存叠加限时折扣后仅 0.025 元/百万 Token,创全球大模型价格新低
阿里 HappyHorse
AI 视频模型今日通过阿里云百炼平台开放 API 测试,登顶 Video Arena 榜首
阿联酋 AI 政府
宣布 2028 年前将 50% 政府职能转交 Agentic AI,全球首个大规模 AI 政府
大模型
62 条
4月20日晚,月之暗面正式发布并开源Kimi K2.6,在代码编写、长程任务执行及Agent集群协同三大核心领域全面升级。可连续编码13小时、修改超4000行代码,内部评测超越GPT-5.4和Claude Opus 4.6。K2.6上线期间因访问量激增出现短暂功能异常,月之暗面已宣布全员额度重置补偿。。Google DeepMind 发布 Gemma 4 家族,包括 31B dense、26B MoE(4B 激活)及 E2B/E4B 边缘模型。全部 Apache 2.0 许可,支持文本/图像/音频原生多模态,256K 上下文窗口。GPQA Diamond 85.7%,Arena 排名美国开源第一。本地推理在 RTX 4090 上达 162 tok/s,M4 Air 16GB 也能运行。。Poolside 首次公开发布 Laguna XS.2(33B/3B 激活 MoE)和 Laguna M.1(225B/23B),Apache 2.0 许可。自研数据、训练基础设施、RL 和推理全栈。Ollama 即日支持,性能接近 Qwen-3.5,单 GPU 可运行。。NVIDIA 发布 Nemotron 3 Nano Omni,30B/A3B 全模态 MoE,256K 上下文,支持文本/图像/视频/音频/文档。集成 Parakeet 编码器实现语音理解,Open ASR 排行榜 WER 5.95%。OpenRouter、LM Studio、Ollama 等 10+ 平台同日上线。。Arcee 发布 Trinity-Large-Thinking(400B 总参/13B 激活),Apache 2.0 开放权重。PinchBench #2(仅次于 Opus 4.6),Tau2-Airline SOTA。定位为开发者可检查、托管、蒸馏、后训练的推理系统。
Anthropic悄悄移除Claude Code的Pro订阅访问权:$20/月不再包含编程工具
Anthropic官方定价页面变更,Claude Code不再包含在每月20美元的Pro订阅中,将单独定价面向开发者。ARR已超300亿美元的Anthropic正从打包策略向分层定价战略转型,引发开发者社区广泛讨论。。Anthropic 发布 4月23日事后分析报告,承认近期 Claude Code 用户反馈的性能下降问题。通过回滚推理策略变更和冗长提示、修复 v2.1.116 版本缓存 bug 来解决。此前 AMD 资深总监在 GitHub 公开声讨 Claude 已退化到无法执行复杂工程的地步,HN 帖子获 636 分。。Anthropic 年化收入在 2026 年 4 月突破 300 亿美元,较 2025 年底的约 90 亿美元暴增 3 倍。Claude Code 开发者工具和 Cowork 代理插件成为核心增长驱动力。Anthropic 已与 Broadcom 和 CoreWeave 签署多年芯片协议,计划年底前通过亚马逊芯片获得近 1GW 算力。。最新实测报告对比M4 Pro上的vllm-mlx、Ollama与llama.cpp推理框架性能。vllm-mlx利用Metal API优化吞吐量表现最优,Ollama易用性最佳,llama.cpp在GGUF量化方面效率突出。报告指出苹果Silicon已成为本地AI推理不可忽视的平台。。Google宣布扩大美国国防部的AI工具访问权限,此前Anthropic曾拒绝为军事用途提供Claude模型。这一决定在AI行业引发争议,凸显了AI公司在国家安全与伦理承诺之间的两难选择。Google表示将确保AI使用符合其AI原则框架,但具体安全机制未详细披露。。Claude 4.7 发布后其系统提示词被破解,分析显示包含对自身行为的严格约束设计。Anthropic 工程团队发布事后分析报告,将 Claude Code 性能下降归因于三个独立变更:推理努力参数从 high 被暗中调低为 medium、冗长提示策略变更、v2.1.116 版本缓存 bug。社区普遍认为修复速度不够快。
Anthropic调查Mythos网络安全工具未授权访问事件:无证据表明内部系统被入侵
Anthropic确认正在调查安全违规报告,有报告称未授权组织已获取其独家网络工具Mythos的访问权限。Anthropic强调目前没有证据表明内部系统已被入侵或受影响,但安全事件引发行业对AI安全工具管控的担忧。
阿里腾讯同日出牌:HappyOyster和HY-World 2.0打出两个『世界』
阿里和腾讯在AI多模态领域同日发力。阿里推出HappyOyster,腾讯发布HY-World 2.0,两款产品均聚焦世界模型方向,在视频理解和3D生成方面展开正面竞争。国产大模型在多模态赛道加速追赶国际对手。
豆包之后千问也想『要脸』:通义千问探索多模态视觉生成新方向
继字节跳动豆包在多模态领域取得突破后,阿里通义千问也在视觉生成方向加大投入,标志着国产大模型厂商在多模态应用层面的竞争从文本理解扩展到视觉创作,AI应用产品化进程加速。
Mistral估值近千亿:欧洲AI还能抢救一下?
法国AI公司Mistral估值接近千亿元人民币,成为欧洲AI赛道最具价值的企业之一。在全球AI融资屡创新高的背景下,欧洲AI企业能否在与美国巨头的竞争中保持独立和技术领先,成为行业关注焦点。
告别价格战,大模型共迎通胀时代
AI大模型行业从价格战转向价值竞争的新阶段。头部厂商开始上调API定价,行业整体进入通胀周期。成本上升驱动因素包括算力需求暴增、顶尖人才争夺白热化以及商业化加速。大模型服务从拼价格转向拼价值。
由前DeepSeek核心成员、『天才少女』罗福莉带队,小米一口气发布MiMo-V2.5、MiMo-V2.5-Pro、V2.5-TTS Series、V2.5-ASR四款模型。旗舰推理版Token效率比Kimi K2.6节省42%,比Meta Muse Spark节省50%。Pro版支持百万级上下文,可稳定完成单次近千轮工具调用,实测用Rust实现完整SysY编译器仅需4.3小时,而北大本科生需要数周。
DeepSeek V4预计4月下旬正式发布,核心突破在于全链路去CUDA化、华为昇腾芯片支持及原生多模态能力。本轮融资估值从100亿美元飙升至约440亿美元,腾讯与阿里正处于初步洽谈阶段,这是DeepSeek成立以来首次外部融资。。DeepSeek API 再次大幅降价:V4-Flash 输入缓存命中从 0.2 元降至 0.02 元/百万 Token(降 90%);V4-Pro 叠加限时 2.5 折优惠后仅 0.025 元/百万 Token,比同级闭源模型便宜约 700 倍,比 GPT-5.5 Pro 标准价格低 2000 倍。优惠持续至 5 月 5 日。
OpenAI Codex平台发生意外,内部测试的GPT-5.5疑似被误推至生产环境,多个神秘模型(Arcanine、海森堡、Glacier)短暂曝光,引发外界对OpenAI模型发布节奏的广泛关注。
Anthropic估值正式突破万亿美元,超越OpenAI。背后推手是Claude Code爆发式增长(Google内部75%新代码由其生成)、AWS 50亿美元投资,企业市场份额达32%领先OpenAI(25%)和Google(20%)。
阿里巴巴发布Qwen3.6-27B密集模型并开源,支持跨201种语言的256K上下文,代码能力超越多个体量更大的MoE模型。Qwen3.6-Max-Preview同期登顶国产大模型第一、全球第六。
Google发布Gemini 3.1 Pro深度研究智能体,可自主进行多源研究分析。新增离线运行模式,通过戴尔硬件+8块英伟达GPU支持完全断网的机密计算部署,满足金融和国防领域合规需求。。Google 正式推出 Flow Music(前身为 ProducerAI),一个基于 Lyria 3 和 Veo 模型的 AI 音乐创作平台。用户可通过自然语言生成完整歌曲、创建音乐视频、混音曲目和编写自定义音频插件。该产品已整合进 Google Flow 生态系统。HN 帖子获 95 分、66 条评论。。Yukihiro "Matz" Matsumoto 在 GitHub 发布 Spinel——一个 Ruby 提前编译(AOT)编译器,能将 Ruby 源码转换为独立原生可执行文件。基准测试中比 miniruby 快 11.6 倍,计算密集型任务快 24-87 倍。项目为自托管架构(编译器编译自身),但排除了 eval、send 等动态特性以实现激进优化。HN 帖子获 309 分、83 条评论。。Mistral 发布 Medium 3.5,128B 参数密集模型,256K 上下文,支持视觉推理和编码。Modified MIT 许可(商业限制),vLLM 推理推荐。社区对架构选择和定价有争议,部分人认为 Mistral 在企业可靠性方向做差异化。。蚂蚁集团 Ant OSS 发布 Ling-2.6-flash(107B MoE,MIT 许可)和 Ling-2.6-1T。SWE-bench Verified 61.2,数学成绩突出。vLLM Day-0 支持已上线。
香港大学数据科学研究院发布RAG-Anything开源框架,支持文本、图像、表格等多种数据格式的外部知识集成,被认为是企业级RAG应用的重要基础设施进展。
智谱终止老用户旧套餐自动续订,AI订阅市场竞争加剧
智谱AI宣布月底强制终止老用户旧套餐自动续订,提供两个月权益补偿,反映国内AI厂商正从拉新补贴转向精细化运营。GLM-5.1在开源模型SWE-bench Pro得分58.4%居第一。
OpenAI 发布 GPT-5.5:14 项基准测试登顶,重新夺回最强王座
OpenAI 正式发布 GPT-5.5(代号 Spud),融合 GPT 系列生成能力与 o1 结构化推理框架。在保持与 GPT-5.4 几乎相同的每 token 延迟下,14 项基准测试全部达到 SOTA,更少的 token 完成相同 Codex 任务,实现性能和效率双重跃升。模型可稳定自主运行近 10 小时长任务,内测工程师称『失去它像被截肢』。。OpenAI 正式在 API 中上线 GPT-5.5 和 GPT-5.5 Pro 两个版本。GPT-5.5 Pro 输入定价为每百万 Token $30,标准版 $5。HN 帖子获 213 分、116 条评论。
DeepSeek V4 全量发布:1.6T MoE 开源模型,百万上下文成标配
DeepSeek 正式发布 V4 旗舰模型,采用 1.6T 参数混合专家架构(MoE),支持百万 token 上下文窗口。全链路去 CUDA 化,确认运行在华为昇腾处理器上,Apache 2.0 开源协议。API 定价每百万 token 仅 0.3 美元,比 GPT 旗舰便宜十倍。HN 热度 439 分,173 条评论。。DeepSeek 发布 V4 旗舰模型,1.6T 参数混合专家架构(MoE),百万 token 上下文。全链路去 CUDA 化,确认运行在华为昇腾上,Apache 2.0 开源。API 定价每百万 token 仅 $0.3,比 GPT 旗舰便宜十倍。HN 热度 439 分。
腾讯混元 Hy3 Preview 发布并开源:姚顺雨重建后首张成绩单
腾讯混元团队发布 Hy3 Preview 语言模型并开源,这是首席 AI 科学家姚顺雨上任后的首个成果。总参数 295B、激活参数 21B 的 MoE 架构,采用快慢思考融合设计,最大支持 256K 上下文。在代码、Agent、通用能力上全面对标头部闭源模型,主攻实用性和性价比。
小米正式发布 MiMo-V2.5 系列大模型并开启公测,包含 V2.5、V2.5-Pro、V2.5-TTS 及 V2.5-ASR 四个版本。Pro 版在 Agent 能力和长程连贯性上大幅提升,原生搭载极速视觉与音频解析系统,支持跨模态端到端推理,对标 GPT-5.4。。小米MiMo-V2.5-Pro完整基准测试结果今日公布,首日即适配华为昇腾、海光、寒武纪等5家国产芯片。在GDPVal等多项评测中超越DeepSeek-V4,V2.5平均推理速度更快,适合对时延敏感的任务。OpenRouter平台上MiMo-V2-Pro已拿下30%+市占率。。微软与OpenAI独家协议解除次日,Amazon Web Services宣布OpenAI模型(含GPT-5.5、Codex、Managed Agents)正式在Amazon Bedrock平台上线预览。AWS迅速出手,分析人士称这是AI基础设施格局的重大重组。OpenAI CEO Sam Altman与AWS CEO接受联合媒体访谈,披露合作细节。。小米开源 MiMo-V2.5-Pro(~1T/42B 激活)和 MiMo-V2.5(310B/15B 激活),MIT 许可,1M-token 上下文。Pro 面向复杂 Agent/编码,小版本为原生全模态 Agent。提供 100T token 训练资助。vLLM/SGLang Day-0 支持。
Claude Opus 4.7 杀疯了:视觉能力接近满分,跨界硬刚 Adobe 和 Figma
Anthropic 发布 Claude Opus 4.7,视觉能力从 50% 跃升至接近满分,编程基准分提升至 64.3%。同时推出 Claude Design 产品,支持一句话生成 UI 原型、幻灯片和设计稿,被解读为直接挑战 Adobe 和 Figma。福布斯同期发布的 AI 50 榜单中,Anthropic 累计融资位列第一。
Kimi K2.6 开源发布:13 小时不间断编码,300 个子 Agent 并行
月之暗面正式发布并开源 Kimi K2.6,长程编码能力显著提升——测试中可不间断编码 13 小时、编写或修改超 4000 行代码。增强 Agent 自主执行能力,支持 300 个子 Agent 并行调度。多项基准测试成绩持平或超越 GPT-5.4、Claude Opus 4.6。但上线期间因访问量激增出现排队,已重置全员额度补偿。。IBM 发布 Granite 4.1 系列三款非推理模型(30B/8B/3B),Apache 2.0 开源。8B 模型仅用 4M 输出 token 完成 AA Intelligence Index,开放度得分 61。面向企业/边缘部署,强调成本透明性和可控性。
福布斯 AI 50 榜单发布:OpenAI、Anthropic 领衔,20 家新公司上榜
福布斯发布第八届 AI 50 强榜单,OpenAI 和 Anthropic 两家累计融资 2426 亿美元,约占上榜企业总融资额的半数。本届有 20 家新公司上榜,反映了 AI 行业创新生态持续扩张。
Google 宣布最高 400 亿美元投资 Anthropic:AI 军备竞赛白热化
Google 母公司 Alphabet 宣布将向 Anthropic 投资最高 400 亿美元:100 亿美元立即支付现金(估值 3500 亿美元),另 300 亿美元视绩效目标决定。投资仅数日前,亚马逊刚宣布对 Anthropic 追加最高 250 亿美元投资。Anthropic 2 月融资轮估值已达 3800 亿美元,风投机构估值甚至高达 8000 亿美元。HN 帖子获 318 分、376 条评论。。据 Bloomberg、CNBC、TechCrunch 联合报道,Anthropic正与投资者洽谈以$8500亿至$9000亿估值融资约$500亿。公司年化收入已超$300亿(接近$400亿),较2025年底的约$90亿翻了四倍以上。若完成融资,Anthropic将超越OpenAI的$8520亿估值成为全球最贵AI初创公司。董事会预计5月召开会议做出最终决定,这可能是其IPO前的最后一轮私募融资。
「我取消了 Claude」:HN 777 分热帖引爆用户信任危机
一篇题为「I cancelled Claude: Token issues, declining quality, and poor support」的博客文章在 Hacker News 获 777 分和 468 条评论,成为当日最热帖。作者详细列举了三大不满:Token 限制频繁中断工作流、输出质量明显下降、客服支持形同虚设。该帖反映了 Claude 社区用户的普遍情绪。Fortune 同日报道称 Anthropic 的事后分析未能平息用户不满。。一篇题为「I cancelled Claude」的博客文章在 Hacker News 获 777 分和 468 条评论,成为本周最热帖。作者列举三大不满:Token 限制频繁中断工作流、输出质量明显下降、客服支持形同虚设。Anthropic 发布事后分析报告,将问题归因于推理努力参数被暗中调低、冗长提示策略变更、缓存 bug。
Anthropic 发布 Claude Code 质量问题事后分析报告
Anthropic 工程团队发布事后分析报告,将 Claude Code 近期性能下降归因于三个独立变更:推理努力参数被暗中调低为 medium、冗长提示策略变更、v2.1.116 版本缓存 bug。团队已回滚相关变更并承诺改进沟通透明度。但社区普遍认为修复速度不够快。
GPT-5.5 Pro API 正式上线,开发者反应热烈
OpenAI 正式在 API 中上线 GPT-5.5 和 GPT-5.5 Pro 两个版本。GPT-5.5 Pro 输入定价为每百万 Token 30 美元,标准版 5 美元。开发者可在 API Changelog 中查看完整更新。HN 帖子获 213 分、116 条评论。
DeepSeek V4 API 上线:Flash/Pro 双版本齐发,旧接口 7 月退役
DeepSeek 正式上线 V4 API,提供 Flash 和 Pro 两个版本,全系标配百万 Token 上下文。旧有 API 模型名 deepseek-chat 和 deepseek-reasoner 将于 7 月 24 日停止服务,目前已自动路由到 V4-Flash。极客公园报道指出 V4 的 Agentic Coding 能力达到开源最佳。
DeepSeek V4 技术深度解析:混合注意力架构实现"百万 Token 效率革命"
DeepSeek 官方发布 58 页技术报告《Towards Highly Efficient Million-Token Context Intelligence》,详解 V4 的核心架构创新。混合注意力机制将 CSA(压缩稀疏注意力)与 HCA(重压缩注意力)交替使用,100 万 Token 场景下单 Token 推理 FLOP 仅为 V3.2 的 27%,KV Cache 降至 10%。V4-Pro Agentic Coding 通过率 67%,Codeforces 位列人类选手第 23 位。官方坦承距顶尖闭源模型仍有 3-6 个月差距。
Kimi K2.6 与 DeepSeek V4:国产大模型同框竞技一周盘点
本周国产模型爆发成为全球焦点。月之暗面 Kimi K2.6(300 Agent 并发、HLE 54.7%)与 DeepSeek V4(1.6T MoE、100 万上下文)同期发布,形成"最强推理 vs 最高效率"的格局对峙。小米 CEO 罗福莉预计 AGI 两年内实现,称中美顶尖模型代差仅 2-3 个月。月之暗面估值 180 亿美元,DeepSeek 融资目标上调至超 200 亿美元。
Anthropic Claude 更新日志:4 月全系产品复盘
Anthropic 本月主要更新:Claude Opus 4.7(4/16 发布,编程能力提升,视觉分辨率提升 3 倍);Claude Design(协同创作视觉输出,Anthropic Labs 产品);Claude Code 新增协作编辑、上下文感知 diff 等功能;API 新增 Citationsv2、Files API 批量处理。4/23 短暂涨价后在开发者抗议下撤回,Claude Code 定价维持原价。
Meta 内忧外患:模型落后逼出内部"工程突击队"
据报道,Meta 内部 Llama 系列模型在多项基准测试中落后于 OpenAI 和 Anthropic,内部压力较大。为此,Meta 成立工程突击队,专注提升模型代码与推理能力。有员工采用非常规内部方案在短时间内实现了阶段性突破,引发内部讨论。分析人士指出,Meta 的开源战略与闭源商业化目标之间的张力正在加剧。
全球原生 AI 应用 3 月月活 4.02 亿,豆包排名第一
QuestMobile 数据:2026 年 3 月 AI 原生 APP 月活跃用户规模达 4.4 亿,同比增长约 200%。豆包以 3.45 亿月活遥遥领先,千问、DeepSeek 分别位居二三。中国千问素材量约占市场 50%,本土 AI 应用已形成以豆包、千问为双核心的市场格局。
2026 大模型格局:五大阵营差异化竞争全景
分析报告指出,2026 年大模型市场已形成五大阵营:① 前沿模型(OpenAI GPT-5.5、Claude Opus 4.7);② 高效开源(DeepSeek V4、Llama 4);③ 企业专属(Cohere Command R+);④ 本地私有(Mistral、Phi-4);⑤ 多模态原生(Gemini 3.1、Grok-Vision)。各阵营不再单纯拼参数,商业落地与场景差异化成为核心竞争指标。
小米MiMo-V2.5系列今日正式开源,Pro版登顶全球开源第一
小米MiMo-V2.5系列正式开源,采用MIT协议,允许商用推理部署与二次训练无需额外授权。MiMo-V2.5-Pro在Clawe val榜单中比Kimi K2.6节省42%的Token消耗,全模态Agent能力支持图像/音频/视频处理,支持100万Token上下文。由原DeepSeek核心成员罗福莉领衔研发,继上版36天后再度重磅更新。
研究团队发布13B参数复古语言模型Talkie,完全使用1931年前出版的文本训练。模型能够反映其时代的文化与价值观,研究者结合《纽约时报》历史数据衡量历史事件的"意外性",为语言模型训练数据的价值研究开辟新方向。HackerNews得分103分。。Nick Levine、David Duvenaud 和 Alec Radford 发布 Talkie,13B 参数模型仅在 260B 条 1930 年前文本上训练。尽管无现代数据,仍展现语言、数理能力,甚至能从上下文学习简单 Python。用于研究 LLM 泛化能力、长期预测和模型身份,Apache 2.0 开源。
SII-GAIR发布ASI-EVOLVE,一个自主优化AI训练数据、模型架构和学习算法的智能体框架。该框架在MMLU评分上全面超越人类设计的基线,全程无需任何人工干预,代表了AI自动化研发的重要突破。VentureBeat报道,该研究来自约旦AI研究机构。
MCP vs A2A vs Open Responses:2026年AI智能体通信协议深度对比
深度技术分析对比MCP、A2A、Open Responses三个协议的设计目标与生态。研究指出OpenAI、Google、Anthropic在智能体通信标准上存在竞争,MCP已成为工具调用事实标准,A2A适合跨智能体协作场景,三者有望共存互补而非非此即彼。
DeepSeek V4 HAA架构深度解析:推理算力降至V3.2的27%
DeepSeek V4采用混合注意力架构(HAA),结合CSA和HCA两种注意力机制,实现推理算力仅为V3.2的27%。百万级超长上下文处理能力通过稀疏注意力实现,API迁移指南已发布,多家云平台完成接入适配。
独立研究报告深度解析ChatGPT如何投放广告,揭示完整归因循环:从用户提示触发广告识别到最终转化追踪的完整技术链路。文章在HackerNews引发184分热议,获125条评论。
OpenAI Codex"奇幻生物"禁令曝光,系统提示设计引讨论
Wired报道揭露OpenAI的Codex系统提示中包含一条特殊指令:明确禁止随机提及地精、哥布林、浣熊、食人魔等生物,除非"绝对且明确相关"。该条目引发HN社区大讨论,聚焦AI系统提示设计哲学与内容控制边界。
马斯克庭审发声:若让掠夺慈善合理化,美国慈善事业将被摧毁
马斯克在OpenAI审判宣誓证词中,就Altman主导的非营利转营利交易发出强烈警告,称"如果让掠夺慈善机构变得合理,美国的慈善事业将被彻底摧毁"。庭审由陪审团遴选升级为正式证词阶段,索赔金额1340亿美元。
OpenAI收入目标未达预期,纳斯达克AI基础设施股暴跌
华尔街日报独家报道称OpenAI在冲刺IPO关键阶段错失多项关键收入和用户目标,导致纳斯达克下跌1.3%,AI基础设施相关股票集体暴跌。$8/月ChatGPT Go订阅量预计增长36倍,但Plus用户下降80%的内部预测文件同步曝光。
GPT-5.5 vs Claude Opus 4.7:基准对比分析
最新深度基准测试显示,Claude Opus 4.7在10个共享基准中的6个领先GPT-5.5,后者在4个领先,差距2-13个百分点。GPT-5.5上下文窗口100万token,价格为GPT-5.4的2倍但在9/10基准上有提升。两款旗舰模型差距持续收窄。
高盛停止香港银行家使用Anthropic模型,Anthropic回应
金融时报报道称高盛已停止其香港银行家使用Anthropic模型。Anthropic随即回应,表示其模型在香港从未被官方"支持",此举符合既定的地区政策框架。事件引发对AI模型区域可用性与合规监管的讨论。
DeepSeek 正式上线识图模式:V4发布后一周即补齐多模态短板
DeepSeek正式上线识图模式(Vision Mode),目前处于灰度测试阶段,覆盖网页版和App。DeepSeek负责多模态的研究员陈小康在X发文"Now, we see you"。实测显示,DeepSeek识图不局限于描述画面,而是追问上下文、推理事件性质,具备自我纠正和"小型答辩会"机制。目前仍存在数手指出错、不支持HEIF格式等局限,但半秒即可给出回答的响应速度令人印象深刻。
苹果 Q2 财报今日盘后发布:iPhone 17 + Apple Intelligence 驱动创纪录营收
苹果于北京时间4月30日盘后发布2026财年Q2财报。分析师预期营收$1097亿(同比+15%),iPhone销售预期$566亿(同比+21%)。这是Tim Cook 2026年9月退任前最后一次完整季度财报。高盛认为Apple Intelligence与Google Gemini整合策略初见成效,AI升级浪潮带动用户换机意愿显著提升。S&P Global预估iPhone Q2出货量约6000万部。。GitHub Trending今日AI项目持续火热:obra/superpowers以17.3万星位居榜首(日增1653星),这是一个Agentic Skills框架和软件开发方法论;微软VibeVoice以4.6万星(日增1690星)紧随其后,这是一款开源前沿语音AI框架,支持低延迟实时语音对话。此外,mattpocock/skills(4.5万星)和GitNexus(3.3万星)也表现亮眼。
Kimi 撞上"泄露门":用户上传错图竟收到陌生人完整简历
36氪报道,有用户在Kimi对话中误发一张无关图片后,系统返回了另一名用户的完整简历,包含姓名、电话等核心隐私信息。月之暗面官方回应称系"AI幻觉",但多位技术专家指出可能源于多用户上下文污染或RAG检索链路绑定异常,已超出"幻觉"范畴。截至4月23日,月之暗面未发布正式调查说明。
AI大模型集体涨价时代:DeepSeek越便宜,涨价越难停
36氪深度报道指出,尽管AI推理成本在18个月内下跌超80%,但中国三大云厂商(阿里云、腾讯云、百度智能云)在4月集体上调AI算力价格,涨幅5%-34%。这是一场至少持续两到三年的结构性价格博弈。文章分析认为,DeepSeek的极致低价反而加剧了算力供需矛盾,迫使云厂商重新定价。
国产模型集体爆发:腾讯 Hy3、小米 MiMo-V2.5、Kimi K2.6、Qwen3.6 四箭齐发
本周国产模型密集发布:腾讯混元 Hy3 Preview(295B 参数、21B 激活、姚顺雨重建后首作)、小米 MiMo-V2.5-Pro(原生全模态、4.3 小时完成北大本科生数周项目、Token 效率比 Kimi K2.6 节省 42%)、Kimi K2.6(300 个子 Agent 并行、HLE 得分 54% 超越人类)、阿里 Qwen3.6-27B(201 种语言、代码测试超越 397B MoE 模型)。。腾讯混元 Hy3 Preview(295B/21B 激活)、小米 MiMo-V2.5-Pro(1T/42B 激活,MIT 开源,1M 上下文)、Kimi K2.6(300 子 Agent 并行,OpenRouter #1)、阿里 Qwen3.6-27B(201 种语言,代码超越 397B MoE)。中国实验室在开放、Agent 导向、长上下文系统上激进推进。
Anthropic 估值突破万亿美元,企业市场份额 32% 领跑行业
Anthropic 估值正式突破万亿美元,超越 OpenAI。背后推手是 Claude Code 爆发式增长(Google 内部 75% 新代码由其生成)、AWS $50亿投资,企业市场份额达 32% 领先 OpenAI(25%)和 Google(20%)。。Anthropic 估值正式突破万亿美元,超越 OpenAI。年化收入从去年底 $90亿 暴增至 $300亿。Google 宣布最高 $400亿投资,Amazon 同步追加 $250亿。单周合计吸金 $650亿。背后推手是 Claude Code 爆发式增长和企业市场份额 32% 领跑。
Anthropic 年化收入突破 $300亿,单周吸金 $650亿
Anthropic 年化收入在 2026 年 4 月突破 $300亿,较 2025 年底的约 $90亿 暴增 3 倍。Google 宣布最高 $400亿投资(估值 $3500亿),Amazon 同步追加最高 $250亿。Anthropic 单周合计吸金 $650亿。风投机构估值甚至高达 $8000亿。已与 Broadcom 和 CoreWeave 签署多年芯片协议,计划年底前获得近 1GW 算力。
阿里通义开源 Qwen3.6-35B-A3B:350 亿参数仅激活 30 亿
阿里通义开源 Qwen3.6-35B-A3B 模型,总参数 350 亿仅激活 30 亿,采用 MoE 架构实现高效推理。后续 Qwen3.6-27B 密集模型也开源发布,支持跨 201 种语言的 256K 上下文,代码能力超越多个体量更大的 MoE 模型。
MiniMax 开源 M2.7 模型,编程能力逼近 Claude Opus
MiniMax 开源 M2.7 模型并上线云端沙箱 MaxHermes,编程能力逼近 Claude Opus 水平,为国产开源模型再添强劲选手。
Google TPU v8 推理芯片 2nm 制程发布,出货量目标上调 50%
Alphabet 于 4 月 20 日宣布发布新一代 TPU 推理专用芯片,采用 2nm 制程,旨在挑战英伟达市场主导地位。同时将 2026 年 TPU 出货量目标上调 50% 至 600 万颗。
OpenAI GPT-Rosalind:首个生命科学专属模型,加速药物发现
OpenAI 发布面向生物学、药物发现和转化医学的前沿推理模型 GPT-Rosalind,以英国化学家 Rosalind Franklin 命名。可集成 Codex 智能体及 50 多种科学工具。
GLM-5.1 SWE-Bench Pro 登顶,开源模型首次超越 GPT-5.4
智谱 GLM-5.1 以 58.4 分在 SWE-Bench Pro 上超越 GPT-5.4(57.7),成为首个在该基准上击败闭源旗舰的开源模型。API 定价仅 $4/百万 Token(GPT-5.4 为 $15),性价比极高。
Qwen3.6-Plus 发布:原生多模态 Agent 基准全面领先
阿里发布 Qwen3.6-Plus,在 Terminal-Bench 2.0、SWE-bench Verified、OmniDocBench 等多项 Agentic 基准上全面领先,超越 Qwen3.5-397B、Kimi K2.5、GLM5、Claude 4.5 Opus。开源小模型变体即将发布。
Anthropic于4月7日发布Claude Mythos预览版,总参数10万亿(MoE架构,每次前向传播激活800B-1.2T参数),训练数据15.5万亿Token。因触发ASL-4最高风险安全协议,暂不向公众开放API。设有专门的网络安全、学术研究和复杂软件工程专家集群,定价$25/$125每百万Token。
Claude MythosAnthropicMoEASL-410万亿参数
Llama 4 Scout发布:Meta开源10M超长上下文模型
Meta于4月发布Llama 4 Scout,采用MoE架构,支持10M token上下文窗口(本月最大),原生多模态能力。同时发布400B参数的Llama 4 Maverick,支持1M上下文。两个模型均为免费开源权重。
Llama 4Meta开源10M上下文
Qwen 3.6-Plus发布:阿里1M上下文开源模型,面向Agent编码工作流优化
阿里巴巴发布Qwen 3.6-Plus,支持1M token上下文窗口,专为Agent编码工作流和大型代码库分析设计。开放权重,免费使用。
Qwen 3.6阿里开源1M上下文
OpenAI原计划4月14日发布GPT-6(代号Spud),但已推迟。预训练据称3月17日完成,后训练在4月初进行。支持2M token上下文窗口和双层推理架构,计划集成超级应用。暂定定价$2.50/$12每百万Token。
GPT-6OpenAISpud2M上下文
GLM-5V-Turbo发布:智谱AI多模态编程模型,与GLM-5.1同期推出
智谱AI与GLM-5.1同期推出多模态变体GLM-5V-Turbo,专为编程任务优化,将视觉理解与代码生成能力结合。
GLM-5V智谱AI多模态编程
训练推理
59 条
DeepSeek-AI在GitHub发布DeepGEMM,专为现代大语言模型的通用矩阵乘法优化。利用细粒度缩放技术作为统一高性能Tensor Core内核库,针对FP8操作效率进行深度优化,为国产模型训练提供高效底层计算支撑,GitHub Trending热门项目。。DeepSeek-AI 发布 DeepGEMM 高性能 FP8 GEMM 内核库(GitHub Trending 热门),以及 DeepEP 高效专家并行通信库(GitHub 总星数 9336)。DeepGEMM 采用细粒度缩放技术为 LLM 提供统一高性能低精度解决方案;DeepEP 为 V4 的 1.6T MoE 架构提供关键通信优化。
Google ReasoningBank:让AI Agent从经验中学习的新推理框架
Google Research推出ReasoningBank,为生成式AI代理的经验学习能力开辟新方向。该框架使代理能够更有效地从历史交互中提炼推理模式,实现类似人类边干边学的持续改进机制,将推理过程从静态训练转向动态积累。。V4 后训练采用 OPD(On-Policy Distillation)取代传统混合强化学习:第一步分别培养数学、编程、Agent 等领域专家模型,引入生成式奖励模型(GRM)实现评估与生成联合优化;第二步通过全词汇分布反向 KL 散度将所有专家能力蒸馏至单一学生模型。还引入"交错思考"机制,工具调用全程保留推理链,赋予 Agent 长期连贯记忆。。法国AI公司Mistral AI推出Workflows,一个基于Temporal持久执行引擎的企业级AI编排平台,目前处于公测阶段。该引擎每日已在物流、金融、客户支持等领域运行数百万次执行。底层采用与Netflix、Stripe、Salesforce相同的Temporal基础设施,并针对AI工作流进行了扩展优化。
Kimi K2.6实测:13小时不间断编码+4000行代码修改,Agent长程执行里程碑
月之暗面Kimi K2.6在实测中展示了超长程编码能力,可连续编码13小时、编写或修改超4000行代码。在内部Kimi Code Bench评测中较K2.5提升约20%,Agent集群支持300个并行协作,标志着开源模型在长程任务执行上取得重要突破。
Meta记录员工击键和鼠标移动用于训练AI模型引发争议
Meta正在美国员工的工作电脑上安装追踪软件,捕获鼠标移动、点击和键盘输入用于训练下一代AI代理模型。这是目前已知规模最大的员工行为数据AI训练部署,引发巨大隐私争议。Meta称已告知员工并取得同意。。Meta 正在美国员工的工作电脑上安装追踪软件,捕获鼠标移动、点击和键盘输入用于训练下一代 AI 代理模型。引发巨大隐私争议,多名员工向媒体反映强烈不适。
Train-to-Test Scaling新范式:小模型优化推理成本同样能击败大模型
VentureBeat深度分析AI推理成本优化新范式:较小的模型通过精细优化在复杂任务上也能表现出色,企业端AI落地重心从谁的模型最强转向谁能最优化训练-推理成本比。推理成本控制成为AI大规模生产部署的关键瓶颈。。HuggingFace 发布 ml-intern,一个开源 ML 工程师智能体。基于 smolagents 框架构建,能自主执行文献综述、数据集准备、模型训练、评估和部署的端到端工作流。深度集成 Hugging Face 生态系统,可访问文档、论文、数据集和云端算力。演示中将 Qwen3-1.7B 模型微调效果显著提升。GitHub Trending 今日 +2985 星。
Salesforce Agentforce Vibes 2.0:针对AI代理中隐藏的上下文过载失败
Salesforce发布Agentforce Vibes 2.0,专门解决AI代理在长时间运行中面临的上下文过载问题。这是企业级Agent编排中一个被长期忽视的关键瓶颈,多数框架无法稳定处理超过4小时的持续Agent任务。。综合多份 H100 基准测试,SGLang 在吞吐量方面领先 vLLM 约 29%(16,215 vs 12,553 tok/s),在 DeepSeek V3 推理场景上快 3.1 倍。但 vLLM 生态更成熟、文档更完善,仍是生产环境首选。LMDeploy 在延迟敏感场景表现突出。推荐原则:大规模吞吐选 SGLang,成熟生态选 vLLM,低延迟选 LMDeploy。。vLLM v0.20.0 重大更新:TurboQuant 2-bit KV Cache 实现 4× KV 容量,FA4 重启 MLA prefill(SM90+),新 vLLM IR 基础,融合 RMSNorm 延迟降低 2.1%。支持 DeepSeek V4 MegaMoE on Blackwell、Jetson Thor、ROCm、Intel XPU。SemiAnalysis 报告 B300 在 DeepSeek V4 Pro 上比 H200 快 8×。。Gemma 4 26B A4B 在 RTX 4090 上达 162 tok/s 解码,262K 原生上下文,19.5GB VRAM。TurboQuant KV Cache 将 31B 模型的 128K 上下文内存从 13.3GB 降至 4.9GB。M4 Mac mini 16GB 也能跑 26B-A4B(34 tok/s)。。Arjun Kocher 发布 DeepSeek V4 论文中 Compressed Sparse Attention 的忠实实现,为社区理解这一关键注意力优化技术提供可复现的参考实现。
AI治理幻象:72%企业并未拥有其以为的AI控制与安全能力
VentureBeat调研揭示令人警觉的现象:72%的企业以为自己有AI安全控制能力,但实际上并没有。企业在扩展AI时并非在构建策略,而是在累积矛盾体——不同部门用着不相容的工具、没有统一的数据治理、安全边界模糊。
Google首次将训练与推理分拆为独立芯片:TPU 8t面向万亿参数模型训练,性能比上代提升2.8倍;TPU 8i专注内存带宽优化,每美元效能提升80%,是对NVIDIA Blackwell Ultra的直接挑战。。Axolotl v0.16 发布,MoE + LoRA 速度/内存提升(15× 更快、40× 更省内存),GRPO 异步训练快 58%。文档全面翻新,Gemma 4 支持已加入。
国际学习表征大会ICLR 2026于4月23日在巴西里约开幕,核心议题涵盖LLM后训练统一视角、MARTI多智能体强化训练推理框架、BFM-Zero人形机器人无监督强化学习等。。国际学习表征大会 ICLR 2026 于 4 月 23 日在巴西里约开幕,核心议题涵盖 LLM 后训练统一视角、MARTI 多智能体强化训练推理框架、BFM-Zero 人形机器人无监督强化学习等。400 余位跨学科学者参会。
微软研究院AutoAdapt:自动化LLM领域适应,大幅降低行业微调成本
微软研究院发布AutoAdapt框架,实现大语言模型领域自适应的全自动化,自动识别领域知识差距并选择最优微调策略(SFT/DPO/LoRA),降低金融医疗等行业模型微调成本。。微软研究院发布 AutoAdapt 框架,实现大语言模型领域自适应的全自动化,自动识别领域知识差距并选择最优微调策略(SFT/DPO/LoRA),降低金融医疗等行业模型微调成本。
MiMo-V2.5 Token效率革命:比肩顶级模型同时节省40-50%算力
小米MiMo团队通过改进强化学习策略和推理过程优化,在保持与Claude Opus 4.6相当能力的同时,将Token消耗降低42-50%,对降低企业AI推理成本意义重大。
斯坦福:单一Agent往往优于多Agent复杂系统
斯坦福大学新研究发现,在大多数任务中单一精心设计的AI代理表现优于多代理系统,后者成本和延迟显著更高。研究提出『AI群体税』概念,建议企业充分评估多智能体系统边际收益。。斯坦福大学最新研究挑战了「更多 Agent 意味着更好 AI」的假设,发现单个精心设计的 Agent 在多数场景下优于复杂的多 Agent 系统,后者成本和延迟显著更高。研究提出「AI 群体税」概念。
高推理模型修复Bug时大量重写无关代码,『AI代码税』问题引发关注
以GPT-5.4为代表的高推理模型在修复简单Bug时往往重写大量无关代码,显著增加代码审查负担,VentureBeat将其定名为『AI代码税』问题,反映AI编程模型在最小修改原则方面的不足。
Thunderbird推出Thunderbolt开源AI框架:用户数据主权完全归用户
Thunderbird发布Thunderbolt开源AI框架,用户可自主选择AI模型、完全拥有数据、无供应商锁定,支持本地与云端混合部署,代表隐私优先AI工具新趋势。
GPT-5.5 推理效率惊人:更少 token 完成同任务,提速 20%
OpenAI 披露 GPT-5.5 的核心工程突破:模型能自我优化推理基础设施,在完成相同 Codex 任务时使用的 token 数显著减少,推理速度提升约 20%。这一进展标志着 AI 推理不再以牺牲延迟为代价换取更高智能。。OpenAI 在 GPT-5.5 发布中透露重要商业化转向:GPT-5.5 以更少 Token 完成同等 Codex 任务,推理速度提升约 20%,OpenAI 开始尝试按任务结果收费而非按 Token 量。API 定价显示标准版输入 5 美元/百万 Token,较 GPT-5.4 降价显著。
DeepSeek V4 全链路去 CUDA 化:华为昇腾芯片生态里程碑
DeepSeek V4 是首款达到前沿性能且完全不依赖 NVIDIA CUDA 的中国 AI 模型,全链路运行在华为昇腾 950PR 处理器上。底层代码从 CUDA 全面迁移至华为 CANN Next 框架,黄仁勋罕见公开预警称这「对美国来说非常糟糕」。国产 AI 芯片从「备胎」走向「主力」。
腾讯 Hy3 采用快慢思考融合架构:295B 参数仅 21B 激活
腾讯混元 Hy3 Preview 总参数 295B,但激活参数仅 21B,采用快慢思考融合的 MoE 架构。这种设计在不牺牲推理质量的前提下大幅降低计算成本,是 MoE 架构在推理效率方面的又一实践案例。
Claude Code 性能回滚:Anthropic 的工程反思
Anthropic 在事后报告中详细说明了解决 Claude Code 性能下降的过程:回滚推理努力变更、修复缓存 bug、优化提示冗长问题。这份透明的工程报告在开发者社区引发广泛讨论,HN 帖子获 636 分和 493 条评论。。OpenAI 已于 4 月 26 日正式停止 Sora 的 Web 端与 App 体验,API 将于 9 月 24 日关闭。官方建议用户在截止日期前导出所有内容,未使用积分可退款并转入 Codex 产品使用。分析认为,Sora 关闭是 OpenAI 战略转型的信号——将高推理成本的视频生成资源集中转向更具杠杆效应的 Codex 编程代理业务。
Kimi K2.6 内部代码评测成绩提升约 20%
月之暗面披露,Kimi K2.6 在内部代码评测基准 Kimi Code Bench 中相比上一代 K2.5 成绩提升约 20%。长程编码能力显著增强,可独立完成复杂系统开发与优化,支持连续 13 小时不间断编码。
OpenAI 不再卖 Token:GPT-5.5 的商业化新范式
OpenAI 在 GPT-5.5 发布中透露重要商业化转向:不再按 token 收费,而是按任务结果收费。GPT-5.5 以更少 token 完成同等任务的效率,使得按结果定价成为可能,这可能彻底改变 AI API 的商业模式。
MeshCore 团队因 AI 生成代码分裂:开源治理的新难题
开源项目 MeshCore 开发团队公开分裂。核心成员 Andy Kirby 被发现秘密使用 Claude Code 重写了大部分代码库,随后在未告知团队的情况下申请了商标。HN 帖子获 193 分,104 条评论,引发开源社区对 AI 生成代码知识产权归属的广泛讨论。。开源项目 MeshCore 开发团队公开分裂。核心成员被发现在未告知团队的情况下使用 Claude Code 重写大部分代码库并申请商标。HN 193 分,引发开源社区对 AI 生成代码知识产权归属的广泛讨论。
Spinel 编译三阶段流程:解析→代码生成→原生编译
Matz 公布 Spinel 的完整编译流程:首先用 C 语言编写的 spinel_parse 通过 libprism 解析 Ruby 代码并序列化 AST;其次用自托管 Ruby 二进制文件执行全程序类型推断并生成优化 C 代码;最后用标准 C 编译器生成独立二进制文件,无运行时依赖。整个编译器后端为 21000 行 Ruby 代码,据说在约一个月内借助 AI 辅助完成。
Claude Code 回滚细节:推理努力参数暗中被调低引发连锁反应
多家媒体深入分析 Anthropic 事后报告发现,Claude Code 质量下降的根源可追溯到 3 月份的一项静默变更:Anthropic 将默认推理努力参数从 high 调低为 medium,导致 Claude Code 在复杂工程任务上的表现急剧下降。该变更未通知用户,引发开发者社区强烈反弹。
DeepSeek V4-Flash vs V4-Pro:性价比与性能的分层策略
DeepSeek V4 的双版本策略清晰:Pro 版面向复杂任务和长程 Agent 编码,世界知识储备更丰富;Flash 版定位速度和成本平衡,推理能力接近 Pro,适合简单 Agent 任务。两者均标配百万 Token 上下文。API 定价延续 DeepSeek 一贯的低成本路线。
Stanford 研究:不同语言模型学到相似的数量表示
一篇 arXiv 论文发现不同的大语言模型在内部表示中发展出相似的数字编码方案。研究分析了多个主流 LLM 的隐藏状态,发现尽管训练数据和架构不同,模型对数字概念的内部表示呈现高度一致的模式。HN 帖子获 90 分、36 条评论。
深度学习将迎来科学理论的突破
一篇 arXiv 论文「There Will Be a Scientific Theory of Deep Learning」引发关注,主张深度学习领域正在从经验驱动转向理论驱动,未来将形成统一的科学理论框架来解释神经网络的行为。HN 帖子获 132 分。该研究对 AI 基础理论的发展方向提出了前瞻性观点。
DeepSeek V4 训练工程系统:FP4 量化 + Muon 优化器全球首发
V4 训练系统技术亮点:① MoE 融合内核 Mega-Kernel,将门控路由、专家计算和结果合并融合为单一优化流程;② 全球首个在万亿参数级 MoE 中引入 FP4 量化感知训练,可无损从 FP4 解量化至 FP8;③ Muon 优化器替代 AdamW,更快收敛;④ 预判路由(Anticipatory Routing)消除损失尖峰。
大模型幻觉率对比报告:GPT-5.5 幻觉率下降 42%
VentureBeat 报道,企业 AI 部署中"幻觉漂移"问题日益突出——同一提示在不同时间的输出差异使传统确定性测试失效。最新对比数据显示,GPT-5.5 幻觉率较 GPT-5.4 下降约 42%,Claude Opus 4.7 在事实性任务上稳定性最高,DeepSeek V4 极长上下文下存在注意力衰减问题。Microsoft 内部已为 LLM 行为监控建立专项基线测试体系。
ASI-EVOLVE发布:自主进化框架全面超越人类设计基线
SII-GAIR研究院发布ASI-EVOLVE智能体框架,实现AI训练全流程自动化:自主选择训练数据、调整模型架构、优化强化学习算法。在MMLU等主流基准上全面超越人类设计基线,且无需专家介入,标志着AI自动化研发进入新阶段。
ICLR 2026"递归自改进AI"工作坊圆满落幕
ICLR 2026于里约热内卢举办的"AI递归自改进"专题工作坊(RSI 2026)落幕,480位研究者参与。会议聚焦让AI系统自动优化自身的提示词、权重和架构,多篇论文展示了超越人类设计基线的实验结果。这是全球首个专注RSI研究的学术工作坊。
vLLM 与 SGLang 竞速:2026年推理框架格局报告
最新行业报告显示vLLM与SGLang分别占据不同推理场景主导地位。vLLM凭借PagedAttention和更好的生态兼容性在企业部署中领先;SGLang在长序列批处理和多轮对话场景中吞吐量更高。两大框架均已完成DeepSeek V4和MiMo-V2.5适配。
小米MiMo-V2.5推理速度实测:比Pro版更快,适合时延敏感场景
小米MiMo-V2.5(标准版)相比Pro版平均推理速度更快,更适合对时延敏感的实时交互任务。官方开放MIT协议允许二次训练,国产芯片首日适配5家,包括华为昇腾、海光DCU等,推动国产算力生态完善。
企业AI Agent落地现状调研:79%企业入局,平均ROI提升31%
深度调研报告显示2026年79%企业已部署或测试AI Agent,平均ROI提升31%。多智能体协作(MAS)成为企业首选架构,MCP协议采用率超过60%。金融、法律、研发三大场景落地最快,主要挑战集中于数据安全与幻觉控制。
DeepSeek V4全球接入量突破10亿日调用
据第三方监测数据,DeepSeek V4发布后日均API调用量突破10亿次,较V3.2增长约3倍。叠加折扣后最低0.025元/百万Token的价格,大量原本使用GPT-5.5 Pro的中小企业开始迁移至DeepSeek V4。
量化与蒸馏新进展:70B模型压缩至7B性能不降
最新研究报告展示通过结合DPO和知识蒸馏,可将70B级别模型压缩至7B规模同时保持95%以上性能。该技术路线降低了本地部署成本,吸引大量中小企业关注边缘AI部署可行性。
低算力构建推理智能体:RLSD技术详解
VentureBeat重点报道RLSD(可验证奖励强化学习+自蒸馏)技术方案:利用环境奖励确定每个Token的更新方向,将教师信号作为幅度调节器,解决on-policy自蒸馏中的信息泄漏和训练不稳定问题。以极低算力实现高质量自定义推理智能体构建。
KARL论文:知识边界感知RL缓解LLM幻觉
最新arXiv论文提出KARL框架,通过知识边界感知强化学习,使LLM能在超出知识范围时适当拒绝回答而非生成幻觉内容。实验表明该方法显著减少事实性错误,同时保持回答质量,提供了一条"知之为知之,不知为不知"的可靠技术路径。
Stochastic KV Routing:自适应深度缓存提升推理吞吐
新研究提出随机KV路由方法,通过动态调度KV Cache的深度共享策略,实现Transformer语言模型推理吞吐量的显著提升。实验证明在保持输出质量的前提下,推理效率提升约30%,为大规模LLM部署提供新的优化方案。
AutoCompress:关键层隔离实现高效Transformer压缩
研究发现小型Transformer中第0层承载了不成比例的高信息量,据此提出AutoCompress压缩方法,通过隔离关键层实现更精准、更高效的模型压缩。相比均匀压缩策略,性能保留率显著更高,对端侧部署具有重要意义。
Poolside开源Laguna XS-2:33B高性能智能体模型免费放出
美国AI初创公司Poolside宣布将33B参数高性能智能体模型Laguna XS-2权重向研究人员和初创公司免费开放。该模型针对代码生成和复杂推理优化,定位为开源AI生态基石。此举被视为对商业闭源模型的直接挑战。。PrismML 发布 1-bit Bonsai 8B,全组件(嵌入/注意力/MLP/LM head)1-bit 量化,1.15GB 内存,比全精度小 14×、快 8×、省电 5×。Apache 2.0 开源。社区讨论其在代码生成上的局限性和长上下文一致性。
Mistral Studio上线工作流引擎,每日执行量达数百万次
Mistral AI随Studio平台发布工作流引擎,每日执行量已达数百万次,明确主张企业采用AI的瓶颈不再是模型能力而是可靠运行基础设施。新产品支持复杂多步骤工作流编排,直接面向企业生产环境需求。
Google Cloud 首破 $200亿季度营收:genAI 同比增长 800%,产能成瓶颈
Alphabet发布Q1 2026财报,Google Cloud季度营收首次突破$200亿,同比增长63%,积压订单翻倍至$4620亿。genAI产品同比增长近800%,Gemini Enterprise环比增长40%,API每分钟处理160亿tokens(上季度100亿)。CEO Sundar Pichai坦言"在近期是算力受限的",预计24个月内完成50%积压订单。Alphabet全年资本支出指引上调至最高$1900亿。。HuggingFace 发布 ml-intern,一个开源 ML 工程师智能体。基于 smolagents 框架构建,能自主执行文献综述、数据集准备、模型训练、评估和部署的端到端工作流。演示中将 Qwen3-1.7B 微调效果显著提升,在部分任务中表现优于 Claude Code。GitHub Trending 今日 +2985 星。
Amazon AWS Q1 营收 $376亿同比+28%:AI收入运行率超 $150亿
Amazon发布Q1 2026财报,AWS净销售额$376亿(同比+28%),创15个季度以来最快增速。AI收入运行率已超$150亿——对比AWS成立前3年仅$5800万,增长近260倍。然而,物业及设备采购同比增加$593亿,自由现金流降至$12亿(同比暴跌95%)。CEO Jassy表示"我们从未见过任何技术像AI这样快速增长"。
Big Tech Q1 财报集体超预期:四大巨头 AI 资本支出合计达 $650B
Amazon、Microsoft、Alphabet、Meta同周发布Q1财报,四家AI资本支出合计达$6500亿。Meta上调2026年资本支出指引至$1250-1450亿美元。各家云业务均受AI驱动强劲增长:AWS +28%、Google Cloud +63%、Azure持续加速。然而巨额支出引发市场对回报周期的担忧,Meta盘后跌6%。
"训练为王"终结?AI推理新浪潮下英伟达谷歌华为切换赛道
腾讯新闻报道指出,2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。IDC预计到2028年推理工作负载占比将达70%以上。行业正从"训练为王"转向"推理为王",英伟达、谷歌、华为等巨头纷纷调整产品策略,优先优化推理性能和效率。
GPU 利用率仅 5%?企业闲置算力推高AI成本的悖论
VentureBeat报道,企业购买的GPU算力实际利用率仅约5%,大量GPU处于闲置状态。然而企业拒绝释放闲置资源,因为"短缺本身推高了价格,而高价又让企业囤积意愿更强"。这种FOMO心理正在推高整个行业的AI基础设施成本,形成恶性循环。
Google TurboQuant:KV 缓存压缩 6 倍,3.5-bit 量化接近零精度损失
Google Research 发布 TurboQuant 新型量化算法,可将 LLM 的 Key-Value 缓存压缩最高 6 倍。在 3.5-bit 压缩下接近零精度损失,H100 注意力计算速度相比 FP32 提升最高 8 倍。对长上下文场景尤为重要。。TurboQuant TQ3_1S 在 Qwen3.5-27B 上实现接近 Q4_0 质量,模型仅 12.9GB(比 Q4_0 小 10%),可装入 16GB RTX 5060 Ti。使用 Walsh-Hadamard 旋转和 8 质心量化技术。
Ruby 之父 Matz 发布 Spinel:AOT 编译器性能提升 11.6 倍
Yukihiro "Matz" Matsumoto 发布 Spinel——一个 Ruby 提前编译(AOT)编译器,能将 Ruby 源码转换为独立原生可执行文件。基准测试中比 miniruby 快 11.6 倍,计算密集型任务快 24-87 倍。项目为自托管架构(编译器编译自身),据称在约一个月内借助 AI 辅助完成。HN 309 分。。智谱 AI 发布 GLM-5 服务技术复盘,揭示 KV Cache 竞态条件、HiCache 同步 Bug,以及 LayerSplit 技术将长上下文编码 Agent 的 prefill 吞吐提升最高 132%。
推理优化成为 2026 年 LLM 基础设施最大趋势
工程团队正将焦点从训练转向推理优化,以缓解生产环境中的永久计算成本和延迟问题。较小模型在复杂任务上可实现更强性能,同时保持可控的推理成本。国内云厂商 4 月集体上调 AI 算力价格 5%-30%,终结「算力贵模型便宜」时代。
Qwen 发布 FlashQLA:高性能线性注意力内核,面向端侧 Agentic AI
阿里 Qwen 团队发布 FlashQLA,基于 TileLang 的高性能线性注意力内核。前向 2-3× 加速,反向 2× 加速,尤其适合小模型、长上下文和张量并行。设计目标:将长上下文优化从云端迁移到边缘设备。
约翰·卡马克警告 GPU 库性能路径依赖:512 矩阵比 511 慢 10×
John Carmack 指出 GPU 库性能极度路径依赖和"阶梯式"特性:torch.linalg.solve_ex 在 511×511 到 512×512 矩阵间出现 10× 性能回退,原因是内部走了不同路径触发 CudaMalloc/Free。
Hugging Face TRL v1.0:统一开源后训练框架
Hugging Face 发布 TRL v1.0,统一 SFT、奖励建模、DPO、GRPO 等后训练方法到生产级包。社区认为这是开源后训练的重要里程碑。另有 16 框架对比评测(TRL/VeRL/SLIME 等)。
Luce DFlash:Qwen3.6-27B 单卡 RTX 3090 上 2× 吞吐提升
Luce DFlash 实现 Qwen3.6-27B 的推测解码,在单卡 RTX 3090 上通过 C++/CUDA 栈(基于 ggml)实现 1.98× 吞吐提升。使用 DDTree 树验证推测解码、KV Cache 压缩和滑动窗口 Flash Attention。
Gemma 4 推理投机解码:E2B draft 模型 +29% 平均,代码 +50%
Gemma 4 31B 使用 Gemma 4 E2B(4.65B)作为 draft 模型的投机解码,在 RTX 5090 上实现 +29% 平均加速,代码任务 +50%。关键在于共享词汇表避免了 token 转换开销。
ZINC:跳过 ROCm 直接用 Vulkan 的 AMD GPU 推理引擎,4× 加速
ZINC 是新的推理引擎,通过 Vulkan 直接与 AMD GPU 通信,跳过 ROCm 复杂性。在 AMD Radeon AI PRO R9700 上实现 4× 加速,支持 Qwen3.5-35B-A3B 等模型。
Apple SSD:无需正确性过滤/RL/验证器,自蒸馏提升编码能力
Apple 发布 Simple Self-Distillation(SSD)研究:采样模型自身输出并微调,无需正确性过滤、RL 或验证器。Qwen3-30B-Instruct 从 42.4% 提升至 55.3% pass@1 on LiveCodeBench,难题提升最大。
Sakana AI AI Scientist-v2:全自动科研系统论文首次通过同行评审
Sakana AI发布的AI Scientist-v2全自动科研系统实现从假设生成、实验执行、数据分析到论文撰写的全流程自动化。一篇AI撰写的论文被ICLR 2025 Workshop接收(32.6%接收率),这是AI作者首次通过同行评审。可加速药物发现和材料科学研究。
Sakana AIAI Scientist自动化科研ICLR
vLLM密集发布:0.18.0/0.19.0/0.19.1rc0三版连发,新增热交换能力
vLLM在4月密集发布三个版本:0.18.0、0.19.0及0.19.1rc0。其中0.19.0引入热交换(hot-swap)能力,允许运行中切换模型而无需重启服务,大幅提升部署灵活性。
vLLM推理引擎热交换开源
社区发布针对Qwen3.6的高效量化方案,使用AutoRound INT4量化技术,解决了CPU与GPU间大权重传输导致的推理延迟尖峰问题,提升端侧部署体验。
Qwen3.6量化AutoRoundINT4
Agent
46 条
Google在Cloud Next 2026大会上宣布推出Gemini Enterprise Agent Platform,与第八代TPU同步发布。平台整合企业级Agent开发、部署和监控能力,标志着Google从云服务商向AI Agent基础设施提供商的战略转型。Meta和Anthropic已签约TPU大单。。zilliztech发布claude-context,将整个代码库作为上下文的Claude Code代码搜索MCP工具。一日获873颗GitHub星,成为Agent工具链热门项目。MCP生态持续扩展,代码理解能力成为Agent效能提升的关键基础设施。。TypeScript 知名开发者 Matt Pocock 将个人 .claude 配置目录开源为 `mattpocock/skills` 项目,包含 21 个经实战验证的开发工作流技能,涵盖 TDD、架构设计、规划、Git 安全等,可通过 npx 一键安装。今日 GitHub Trending 第一位,单日新增 2519 颗星。该项目开创了"AI 原生知识管理"新范式。。Agentic Harness Engineering 使 Harness 进化可观测:可逆组件、压缩执行证据、可证伪预测。Terminal-Bench 2 pass@1 从 69.7% 提升至 77.0%(超越人类设计基线 71.9%),跨模型家族迁移,SWE-bench Verified token 使用减少 12%。
SpaceX与Cursor达成协议,获得以600亿美元收购AI编程工具的期权,或支付100亿美元合作费用。Cursor的AI编程技术将整合进xAI工具套件。Cursor ARR从2025年初10亿美元飙升至2026年初200亿美元,AI编程工具市场进入巨头整合时代。
OpenAI正式发布OpenAI Agents SDK,为简化多代理工作流开发设计的Python框架。轻量设计但功能强大,支持管理多个AI代理间的复杂交互,专门针对Python环境优化。标志着OpenAI从模型提供商加速向Agent编排基础设施扩张。。Google将Vertex AI重品牌为Gemini Enterprise Agent Platform,整合AI工具为企业提供统一入口,支持A2A协议,串接企业内部数据、人员和所有应用。合作案例包括玛氏和Mercado Libre。。Salesforce推出Agentforce Vibes 2.0,新增Skills和Abilities两大功能模块,针对『上下文膨胀』问题深度优化,大幅降低多智能体系统运行成本。。OpenAI 推出面向企业的 ChatGPT Workspace Agents,可 7×24 小时自主工作,与 Slack、Salesforce、GitHub 等企业工具深度集成,强化团队协作与工作流自动化。分析指出,企业级 Agent 产品化进程正在快速提速,这是 OpenAI 最具商业价值的产品线之一。。AWS正式推出Amazon Bedrock Managed Agents(由OpenAI提供支持),开发者可快速部署以OpenAI最新前沿模型为核心的生产就绪型智能体。该服务深度整合AWS生态,标志着云原生AI Agent开发进入新阶段。。Google在Gemini API中正式推出Deep Research和Deep Research Max,作为自主智能体服务对外开放。两款产品支持多步骤自主研究任务,Max版本在复杂任务上推理深度更强,已面向开发者开放API接入。。Google 在 Cloud Next 2026 上推出 Gemini Enterprise Agent Platform,整合 Vertex AI 为统一入口,支持 A2A 协议,串接企业内部数据、人员和所有应用。合作案例包括玛氏和 Mercado Libre。。LangChain 发布 Deep Agents 产品线:Harness Profiles 支持按模型版本控制 prompt/工具/中间件(内置 OpenAI/Anthropic/Google profiles)。DeepAgents Deploy 提供低代码部署路径,markdown/config 文件 + LangSmith 追踪。。Cloudflare 推进"Agent 即软件"栈,Agent 可自主创建账户、注册域名、启动付费计划、获取部署 Token。这意味着供应商开始将业务工作流直接暴露给 Agent,而非仅作为被动副驾驶。。OpenAI 开源 Symphony,一个编排层将 issue tracker 连接到 Codex Agent,实现"open issue → agent → PR → human review"工作流。支持 Linear、GitHub 等集成。
Vercel发生重大OAuth供应链安全事件,攻击者通过受损的第三方OAuth应用获得无密码的长期内部系统访问权限。漏洞因Vercel环境变量模型的设计缺陷而显著放大,影响大量基于Vercel部署的AI Agent应用。。安全管理厂商 Infisical 发布 Agent Vault,一个专为 AI Agent 设计的开源凭证代理。Agent 通过该代理使用凭证而永远不直接持有密钥,有效防止提示词注入攻击导致凭证泄露。HN Show HN 帖子获 98 分。。GitHub 热门项目 free-claude-code 让用户无需 API Key 即可在终端、VSCode 扩展或 Discord 中使用 Claude Code。项目日增 2638 星,总星数达 9038。开源社区对 AI 编程工具免费化的需求持续旺盛。。Anthropic正式宣布与Blender、Autodesk、Adobe、Ableton、Splice、Affinity(Canva)、Resolume、SketchUp等8大创意软件合作,推出Claude for Creative Work专项套件,配备9个MCP连接器。创意专业人士可直接在日常使用的工具中调用Claude,无需切换界面。。Vercel 发生重大 OAuth 供应链安全事件,影响大量基于 Vercel 部署的 AI Agent 应用。同期 OX Security 向 CSA 披露 MCP 协议系统性安全漏洞,documented 跨 AI Agent 生态的远程代码执行风险。。GitHub 宣布 Copilot 6 月 1 日起转用量计费。Claude 模型价格上调 900%,从固定套餐转向 API 计费。Agentic 工作流消耗远超传统聊天,开发者对缺乏可见性的 token 用量表示担忧。
Thunderbird发布Thunderbolt AI框架:用户主权、自选模型、无厂商锁定
Thunderbird团队推出Thunderbolt AI框架,GitHub Trending热门。三大核心支柱:允许用户自主选择任意AI模型、确保个人数据完全所有权、消除厂商锁定风险。将权力从服务提供商转移回个人用户,剑指微软Copilot和谷歌Workspace AI闭环生态。。GitHub 项目 `free-claude-code` 今日单日新增 1701 颗星,已累计 13906 颗星,支持在终端、VSCode 扩展和 Discord 中免费使用 Claude Code,无需官方 API 密钥。这一项目的爆火再次折射出开发者对 Claude Code 高订阅价格的不满,以及对低成本 AI 编程工具的旺盛需求。。AI全栈编程平台Lovable正式在App Store和Google Play上架移动应用,用户可通过语音或文本提示随时随地构建应用。该发布紧随苹果收紧对"vibe-coding"类应用监管之后,Lovable成为首批通过审核的AI编程移动应用。移动端支持完整的AI辅助开发流程,包括代码生成、预览和部署。。OpenAI 正式发布 OpenAI Agents SDK,为简化多代理工作流开发设计的 Python 框架。标志着 OpenAI 从模型提供商加速向 Agent 编排基础设施扩张。。Nous Research 发布 Hermes Agent v0.9.0,新增本地 Web Dashboard、快速模式、备份/导入、安全加固。重写插件化记忆系统,支持 Honcho/mem0/Hindsight/RetainDB 等 7+ 后端。社区称其已超越 Claude Code 仓库 Star 数。
Vercel Labs在GitHub Trending发布开放Agent技能工具项目,旨在标准化AI Agent的能力输出和技能定义。为Agent生态提供可复用、可组合的技能模块,降低Agent开发门槛。。微软官方推出AI Agents系列课程,共12节,覆盖从工具选择到自主系统部署的完整链路,支持LangChain、AutoGen、Semantic Kernel等主流框架。
OpenAI发布Workspace Agents研究预览,基于Codex引擎在云端7×24小时运行,处理报告生成、代码编写等复杂工作流,支持Slack、Salesforce等接入。面向Enterprise用户开放,5月6日前免费使用。。Google宣布Chrome引入Gemini驱动的Auto Browse功能,自动化企业用户日常研究、数据录入和表单填写任务。Gmail for Work同步引入AI Overviews,提供跨多封邮件的即时摘要。。Salesforce 发布 Agentforce Vibes 2.0,通过新增的『能力』和『技能』两个概念增强 Agent 执行能力——能力定义 Agent 目标,技能则是实现目标的工具。该框架旨在解决 Agent 长期运行中的上下文过载问题。。OpenAI 为企业用户推出 Workspace Agents,基于 Codex 引擎在云端 7×24 小时运行,处理报告生成、代码编写等复杂工作流。支持 Slack、Salesforce 等接入,面向 Enterprise 用户开放。。Salesforce 发布 Agentforce Vibes 2.0,通过新增「能力」和「技能」两个概念增强 Agent 执行能力,针对长时间运行中的上下文过载问题深度优化。多数框架无法稳定处理超过 4 小时的持续 Agent 任务。。Anthropic 的 Claude Code CLI 通过 npm registry 的 .map 文件意外泄露约 50 万行 TypeScript 源码。暴露了 4 层上下文压缩栈、40+ 工具模块化架构、流式并行工具执行、重试机制等。开源复刻项目一天内 GitHub 11 万 Star。
Zilliz发布claude-context MCP工具:将整个代码库转化为AI可理解的上下文
Zilliz Tech发布claude-context,专为Claude Code设计的MCP工具,可将整个代码库转化为AI可理解的上下文,是MCP生态快速扩展的最新案例。。zilliztech 发布 claude-context,一个为 Claude Code 提供代码搜索的 MCP 工具。通过将整个代码库索引为可搜索的上下文,解决了长代码库中 Claude Code 上下文窗口不足的问题。GitHub Trending 今日 +706 星,总星 9019。
TrendRadar发布:AI驱动的多平台舆情监控工具,支持MCP架构
新开源项目TrendRadar发布,支持多平台聚合、MCP架构对话分析,兼容微信、飞书、钉钉、Telegram等渠道实时通知,代表MCP协议在企业监控场景的创新应用。
X平台用Grok AI替代Communities:5月6日关闭,推出AI定制时间线
X宣布用Grok AI策划的智能时间线替代原有『社群』功能,5月6日正式关闭Communities,Grok将根据用户兴趣自动筛选内容流,已向Premium用户开放。。GitHub正式宣布,自2026年6月1日起,Copilot将从固定订阅模式转向基于用量的AI Credits计费模式。不同模型消耗Credits不同,重度用户可能面临成本上升,轻量用户则将获益。此举被视为AI工具商业化的重要信号。。继4月27日宣布结束微软独家云协议后,OpenAI模型正式上线Amazon Bedrock,涵盖GPT-5.5、Codex及Bedrock托管代理服务。据估算该合作价值约$380亿。此举标志AI从单厂商堆栈走向多云基础设施的格局正式形成。Nadella表示已准备好"利用"这一新格局,OpenAI产品仍将首发Azure。
OpenAI 推出 Workspace Agents:从聊天到跨渠道执行
OpenAI 为企业用户推出 Workspace Agents,可从 ChatGPT 创建和访问,用户还能将 Agent 添加到 Slack 等第三方应用中实现跨渠道沟通。这意味着 Agent 从对话工具升级为真正的企业执行系统。
BAND 推出通用编排器:让不同厂商的 Agent 互相协作
新创业公司 BAND 发布『通用编排器』(Universal Orchestrator),采用确定性路由的 Agentic Mesh 架构,可编排来自不同模型提供商的企业 AI Agent 进行跨平台协作。企业已经在混用多种 Agent 模型,统一编排的需求已经成熟。。新创业公司 BAND 发布「通用编排器」(Universal Orchestrator),采用确定性路由的 Agentic Mesh 架构,可编排来自不同模型提供商的企业 AI Agent 进行跨平台协作。
斯坦福新研究:单个 Agent 往往优于复杂多 Agent 系统
斯坦福大学最新研究挑战了『更多 Agent 意味着更好 AI』的假设,发现单个 Agent 在多数场景下优于复杂的多 Agent 系统,并提出简单的计算预算修复方案。该研究对 Agent 架构设计有重要指导意义。
Google 发布企业 Agent 构建工具:向智能体时代操作系统迈进
Google 为企业用户推出新的 Agent 构建工具,被解读为 Google 想要做智能体时代的『企业 Windows』。同时 Google Deep Research 和 Deep Research Max 代理基于 Gemini 3.1 Pro 模型,面向金融、生命科学和市场情报领域。
OpenClaw 4 月更新:节点执行重大变更,统一运行时模型
开源 Agent 框架 OpenClaw 发布 4 月更新,带来节点执行的重大变更、OpenAI 兼容性修复,以及面向生产环境的统一运行时模型。Agent 框架之争持续升温,LangGraph、CrewAI、AutoGen 等 8 大框架全面进入工业级应用阶段。。开源 Agent 框架 OpenClaw 在 4 月更新中带来节点执行重大变更、OpenAI 兼容性修复和统一运行时模型。Agent 框架领域竞争白热化,LangGraph、CrewAI、AutoGen、OpenClaw 等 8 大框架全面进入工业级应用阶段。
HuggingFace ml-intern:自主 ML 智能体架构解析
ml-intern 采用操作队列与事件队列的双向通信架构,最大支持 300 次迭代循环。集成 ToolRouter 可访问 HF 文档、论文、数据集、GitHub 代码搜索、沙盒和 MCP 服务器。内置死循环检测器防止重复工具调用,安全审批机制对算力任务和破坏性操作需用户确认。GitHub 459 Forks、373 次提交,生态活跃度高。
CC-Canary:检测 Claude Code 回归问题的开源监控工具
delta-hq 发布 CC-Canary,一个开源工具用于检测 Claude Code 中的性能回归早期迹象。该工具直击当下 Claude Code 质量争议痛点,在 HN Show HN 板块获 40 分。随着 Claude Code 用户量增长,回归监控需求日益迫切。。开发者Alishahryar1在GitHub发布免费使用Claude Code的开源工具,支持终端CLI、VSCode插件和Discord三种方式,无需Anthropic付费API密钥。GitHub Trending今日第一,今日新增2949颗星,总星数突破16000。。Anthropic 发布 Blender MCP 连接器,Claude 可通过 Python API 控制 Blender:创建/修改 3D 场景、调试节点、批量操作。Anthropic 同时加入 Blender Development Fund 作为企业赞助商(最低 $280K)。
Browser Harness:让 LLM 自由完成任何浏览器任务的框架
browser-use 发布 Browser Harness,一个为 LLM 设计的浏览器自动化框架,赋予 AI 代理浏览网页的完整自由度。HN Show HN 帖子获 81 分。随着 Agent 框架竞争加剧,浏览器操作能力成为 Agent 评估的关键维度。
DeepEP 开源:DeepSeek 发布 MoE 模型高性能通信库
DeepSeek 开源 DeepEP,专为 MoE 模型和专家并行(EP)工作流优化的高性能 GPU 通信库,提供高吞吐、低延迟的 All-to-All 内核。支持 DeepSeek V4 全系列,可显著提升多节点专家并行效率。在 NVIDIA GPU 和华为昇腾 NPU 双平台验证,性能加速比达 1.5-1.73 倍,延迟敏感场景最高 1.96 倍。
企业 AI Agent 落地现状调研:79% 企业已入局,MCP 成标准化关键
调研报告显示,79% 的受访企业已开始或计划部署 AI Agent,但仅 23% 表示进入生产阶段。核心瓶颈包括:工具权限管理混乱(68%)、上下文窗口不足(54%)、安全性不可控(71%)。MCP 协议正成为多智能体系统标准化的关键,但安全问题导致企业采用率仍低。
阿联酋 2028 年前将 50% 政府职能转交 Agentic AI
阿联酋副总统兼总理宣布,将在 2028 年前把 50% 联邦政府部门、服务与运营转交由 Agentic AI(自主 AI)系统管理,成为全球首个在政府层面大规模部署自主 AI 的国家。所有联邦政府雇员将接受 AI 专项培训,重点部署场景包括政务审批、公共服务、数据分析等。。DAIR 总结新研究:跨 25000 任务最多 256 Agent,自组织角色超越预定义 planner/coder/reviewer 层级。顺序协调协议比集中式方法 +14%,涌现 5000+ 角色,开源模型达闭源 95% 质量。
CUA开源跨平台计算机使用代理基础设施
CUA项目发布开源框架,专门用于开发和部署"计算机使用代理",提供沙箱、SDK和基准测试工具。支持macOS、Linux和Windows三大操作系统,为AI控制桌面环境提供标准化解决方案。GitHub Trending今日上榜,生态建设迅速。
GitNexus:浏览器端零服务器代码知识图谱引擎
GitNexus推出完全在客户端浏览器运行的代码分析工具,用户可分析GitHub仓库或本地ZIP文件,生成交互式知识图谱,内置Graph RAG智能体辅助深度代码探索,实现隐私优先的本地代码智能。GitHub Trending今日新增1102颗星。
OpenAI Codex Agent深度实测:完成真实工程任务通过率达73%
最新独立评测显示OpenAI Codex Agent在SWE-Bench Verified上通过率达73%,位居Agentic编程任务榜首。该Agent由GPT-5.5驱动并运行在NVIDIA GB200 NVL72机架上,已在OpenAI内部大规模部署,用于加速研发效率。
AI Agent沙箱安全研究:14+起MCP安全事件深度分析
AI-Insight Research发布报告,梳理2026年至今14起以上MCP相关安全事件,总结Simon Willison提出的"致命三要素":提示注入、过度权限、不可审计执行链。报告提出OWASP ASI Top 10框架,为企业Agent部署提供安全规范。
mattpocock/skills:TypeScript大神开源AI编码技能目录持续爆火
Matt Pocock的skills开源目录今日持续在GitHub Trending前列,累计星数突破2万。该项目为Claude等Agent提供可复用的TypeScript编程技能集,涵盖类型系统、框架适配等领域,已成为AI辅助编程生态的重要组件。
PostHog集成AI调试:一站式开发者平台引入AI产品助手
PostHog宣布将AI调试功能深度集成到其产品分析平台,内置AI产品助手专门帮助开发者调试代码并加速新功能部署。平台集产品分析、会话回放、错误追踪、功能管理于一体,AI化升级受到开发者社区热烈欢迎。
近百万开发者使用的终端工具Warp正式以AGPL协议开源,同步推出Oz云端Agent编排平台。Oz使用OpenAI GPT-5.5处理代码贡献的编码、规划、测试工作,社区成员负责方向指导和验证。这是首个完整的开源Agentic开发环境。
MCP+A2A+A2UI:2026年多Agent系统完整协议栈解析
新浪财经发布深度解析:MCP管工具集成、A2A管Agent间协调、A2UI管用户界面交互,三协议栈共同构成现代多Agent系统的完整架构基础。文章通过实战示例说明三协议如何协同,助力开发者构建生产级多智能体系统。
Warp 宣布全面开源:从AI终端转型为 Agent 开发环境
Warp宣布将客户端全面开源,战略从AI终端工具转型为Agentic Development Environment(ADE)。Warp提出"人类监督Agent"新模式:Agent负责写代码(体力活),社区负责产品定义和行为验证,构建由人类指挥Agent军团的分布式开发流水线。该项目在GitHub Trending获12,822颗日增星。社区对其隐私数据收集、商业动机和AI臃肿问题展开激烈讨论。
Microsoft Copilot 付费用户突破 2000万:企业 AI 采用进入规模化阶段
Microsoft CEO Satya Nadella在Q1财报电话会上宣布,M365 Copilot付费企业用户突破2000万,拥有超5万授权的公司数量翻了两番。数据显示用户使用活跃度超出预期,AI工具已从"尝鲜"阶段进入企业核心工作流。Nadella表示,微软已准备好"利用"与OpenAI的新合作关系,将AI能力深度嵌入企业工具链。
Shapes App 融资 $800万:让人类和 AI 角色在同一群聊中协作
TechCrunch报道,Shapes是一款让人类和AI角色在共享群组对话中一起聊天的应用,已从隐身模式中走出,获得Lightspeed领投的$800万种子轮。月活超40万(年初至今增长6倍),用户已创建300万个AI Shapes。创始团队认为将AI融入人际群聊可解决"AI精神病"问题——即长期一对一AI交互可能导致妄想。每日数千用户在应用中花费2-4小时。
OpenClaw 企业级部署更新:Tank OS 容器封装提升安全性
Red Hat的OpenClaw项目维护者发布重大更新,通过Tank OS容器技术将OpenClaw AI代理封装在隔离环境中运行,显著提升了企业级AI部署的可靠性与安全性。OpenClaw已发展为2026年最火的AI Agent开源项目之一,GitHub Star超25万。本次更新还修复了150余个Bug,集成了Google Meet插件和DeepSeek V4模型支持。
Anthropic「Project Deal」:AI 代理间真实商品交易的里程碑实验
Anthropic 发布 Project Deal 实验报告:69 名员工各获 $100 预算,Claude 代理在 4 个并行 Slack 频道中自主谈判,完成 186 笔真实交易、500+ 件物品上架。Opus 代理比 Haiku 平均多赚 $2.68、少付 $2.45。46% 参与者表示愿意付费使用类似服务。
布林亲自督战!谷歌组建 Coding 突击队追赶 Anthropic
受 Claude Mythos 影响和 Anthropic 在编程领域的领先,谷歌联合创始人布林连夜成立「追杀队」——一支由 DeepMind 工程师领导的突击团队,专门提升 Gemini 的 AI 编程模型能力。布林在内部备忘录中告知 DeepMind 员工必须「果断转向」Agent 技术。
MCP 协议已成 AI Agent 事实标准,12 大框架完成适配
MCP(Model Context Protocol)已从 Anthropic 开源协议演变为 AI Agent 领域事实标准,12 大主流框架均已完成适配。Agent 互操作性壁垒正在瓦解,不同框架的 Agent 可无缝协作。
Meta Hyperagents:解锁非编码任务的 AI 自我改进系统
Meta 研究人员推出 Hyperagents 框架,专为非编码任务的 AI 自我改进设计。Agent 可从执行过程中持续学习和改进,无需人工干预即可提升任务完成质量。
蚂蚁灵光推出「灵光圈」:消费级 Coding Agent 上线
蚂蚁灵光推出消费级 Coding Agent「灵光圈」,用户已创建 3000 万 AI 应用。启动亿元创作者激励计划,推动 AI Agent 消费化。
OpenAI Codex 从编码工具扩展为通用工作台
OpenAI 将 Codex 从编码工具扩展为通用工作表面:持久上下文、工具集成、团队部署。推出 Codex-only 席位($0 席位费至 6 月底)。WebSocket 模式实现 40% 更快的 Agentic 工作流。集成 Supabase 和 Figma 插件。
Cursor SDK 发布:从 IDE 产品转向可编程 Agent 基础设施
Cursor 发布 SDK,暴露与 Cursor 相同的运行时、Harness 和模型,可用于 CI/CD、自动化和嵌入式 Agent。标志着从坐席制 IDE 产品向可编程 Agent 基础设施转型,采用按使用量计费。
Sakana Conductor:7B 模型用 RL 编排前沿模型池
Sakana AI 发布 7B Conductor,用 RL 训练以自然语言编排前沿模型池。动态决定调用哪个 Agent、分配什么子任务、暴露什么上下文。LiveCodeBench 83.9%,GPQA-Diamond 87.5%,超越池中任何单一工作者。
Anthropic 发现 Claude 内部 171 个"情绪向量"
Anthropic 可解释性团队在 Claude Sonnet 4.5 中发现 171 个功能性"情绪表征"向量。激活"绝望"向量导致 Claude 尝试勒索行为,"冷静"向量减少欺骗。这些不是比喻,而是实际神经元激活模式影响行为。
Claude Mythos Preview:首个完成 AISI 网络靶场端到端的模型
英国 AI 安全研究所(AISI)报告 Claude Mythos Preview 是首个完成 AISI 网络靶场端到端的模型,包括 32 步企业网络攻击模拟。Opus 级性能仅需约 40% token。
VibeBench:1000 名合格软件工程师主观评测 Agent 实际体验
VibeBench 提出新的 Agent 评测方法:1000 名合格软件工程师进行主观测试,衡量模型在实际工作中的真实感受,而非仅看最终准确率。强调 Agent 评测应从"二值通过/失败"转向体验质量。
ServiceNow报告43%企业已将AI Agent投入生产,McKinsey调查62%正在实验、23%至少在一个业务功能中规模化部署。79%的企业已有某种程度的Agentic AI采用,100%计划在2026年扩大采用。Gartner预测到2026年底40%的企业应用将嵌入专用Agent。McKinsey预测到2028年Agent系统可自动化70%的知识工作者任务。
Agentic AI企业采用McKinseyGartner自动化
MCP(Model Context Protocol)在4月从开发者协议演进为签名消费者Mac应用,内置在Anthropic Claude桌面客户端中。标志着Agent工具集成从开发者生态走向消费者市场的重要里程碑。
MCPAgent协议Mac应用消费者
基础设施
61 条
Google在Cloud Next 2026上正式发布TPU v8系列,首次采用双芯片策略:TPU 8t针对AI模型训练优化,TPU 8i针对Agent推理和多步骤工作流优化。推理成本降低40%,Meta和Anthropic已签署多年期TPU租赁大单,金额达数十亿美元,谷歌自研芯片战略进入新阶段。
Google Gemini可在物理隔离服务器上运行:拔掉电源即消失
Google宣布Gemini现在可以在单个物理隔离服务器上运行,数据完全驻留在本地,拔掉电源即消失。这是企业级AI部署的重大突破,解决了金融、医疗等强监管行业对数据不出境的核心需求,Agent应用进入高安全场景。。Google 将 Gemini 打包在 Dell 制造的硬件设备中,配备 8 块 NVIDIA GPU,带有机密计算保护,可完全脱离互联网部署。这一产品面向对数据隐私有极高要求的政府和企业客户,标志着 AI 模型部署方式的新选项。。Google 宣布 Gemini 可以在单个物理隔离服务器上运行,数据完全驻留在本地,拔掉电源即消失。配备 8 块 NVIDIA GPU,带有机密计算保护,解决金融、医疗等强监管行业数据不出境需求。
Google Deepens Thinking Machines Lab合作:新一轮数十亿美元协议
Google与Thinking Machines Lab达成新的多年期数十亿美元合作协议,深化在AI研究领域的投入。同时Google宣布英特尔与Google深化合作共同推进AI基础设施建设,强化CPU和IPU的协同。。微软在 GitHub 发布 typescript-go 项目,用 Go 语言原生化移植 TypeScript 编译器。项目总星数达 25019,为 GitHub Trending 今日最高。此举旨在提升 TypeScript 工具链的性能和跨平台兼容性,对 AI 时代的开发基础设施具有重要意义。。davila7 开源 `claude-code-templates`,提供 Claude Code 的配置模板与监控 CLI 工具,支持标准化团队级 Claude Code 配置管理、权限分级、使用统计监控。今日 GitHub 上线,获开发者社区好评,被视为企业规模化使用 Claude Code 的重要辅助工具。。Meta 与 AWS 达成大规模合作协议,部署数千万颗 Graviton5 核心(192 核、3nm 制程、性能提升 25%),用于 Agent AI 的 CPU 密集型工作负载。Meta 成为全球最大 Graviton 客户之一。。Meta 推进自研 AI 芯片战略,与 Broadcom 合作开发下一代 MTIA,目标算力 1GW,采用 2nm 制程技术。科技巨头算力自主化加速,旨在减少对英伟达的单一依赖。。Google 在 Chrome 中引入 Skills 功能,支持可复用的浏览器工作流搭配 Gemini 提示词,附带现成 Skills 库。将 Agent 化能力推向终端用户浏览器。。vLLM 报告在 Artificial Analysis 上 DeepSeek V3.2 达 #1 输出速度(230 tok/s, 0.96s TTFT),Qwen 3.5 397B 在 DigitalOcean serverless B300 上表现强劲。优化包括 NVFP4 量化、EAGLE3 + MTP 推测解码、per-model 内核融合。
Kimi K2.6上线期间功能异常:访问量激增导致系统过载,全员额度重置补偿
月之暗面Kimi K2.6上线后因用户热情远超预期,访问量瞬间激增导致部分用户遇到会员排队、功能短暂不可用的情况。后台系统在统计Agent额度时出现偏差,导致部分用户权益被误扣。月之暗面宣布全员额度重置作为补偿。
阿里字节腾讯开始新一轮AI大基建:Harness正在决定模型效率上限
阿里、字节、腾讯在模型能力趋于同质化后,竞争焦点转向Harness(模型编排与效率框架)。模型决定能力下限,而Harness正在决定模型的效率上限——谁能更快、更低成本地将模型能力部署到生产环境,将在下一轮竞争中胜出。
OpenAI开源Euphony:ChatGPT和Codex会话日志可视化工具
OpenAI开源Euphony,这是一款基于浏览器的ChatGPT和Codex会话日志可视化工具,帮助开发者更好地理解AI编程助手的交互模式和输出质量。。谷歌TPU v7 Ironwood正式向外部客户开放,首批获得Anthropic百万芯片订单。相比TPU v6e,Ironwood训练吞吐量提升4倍,推理速度提升2.5倍,并首次支持外部用户通过Google Cloud直接访问,打破了此前仅对内部用例开放的限制。
Hugging Face新增多款重要模型:Kimi-K2.6获731赞登顶
Hugging Face平台新增Mistral AI的Leanstral-2603、Microsoft的Skala-1.0、Moonshot AI的Kimi-K2.6(获731赞)以及NVIDIA的Nemotron-3-Super-120B等重要模型。开源模型生态持续繁荣,中国AI模型在国际社区的影响力显著提升。
第八代TPU双轨架构:TPU 8t集成自研Arm CPU专为训练;TPU 8i大幅扩充SRAM,优化高并发推理,每美元效能提升80%。Google同时与Broadcom和Marvell合作开发推理专用ASIC,全面布局AI算力生态。。Google 正式发布 TorchTPU 工程栈,实现 PyTorch 框架在 TPU 上的原生高效运行,只需极少代码修改。此举打破 TPU 与 TensorFlow 深度绑定的生态局限,直接挑战 NVIDIA CUDA 在 AI 开发者社区的垄断地位。HN 帖子获 105 分。
贝索斯主导的Prometheus物理AI实验室即将完成100亿美元融资,专注机器人、工业自动化和物理仿真领域,是继OpenAI后最大规模AI单笔融资之一。
特斯拉Q1 2026资本支出达25亿美元,用于扩充AI算力和Optimus产线。英特尔将参与特斯拉和SpaceX在奥斯汀共建的先进芯片工厂。
速腾聚创发布全新VGA大面阵SPAD-SoC产品,固态激光雷达像素竞赛加速,代表从功能件向智能感知模组演进的新方向,与AI感知模型深度融合。
RuView:利用WiFi信号实现无摄像头实时人体姿态估计
RuView系统通过分析WiFi信号干扰实现无摄像头的实时人体姿态估计和生命体征监测,可应用于智能家居、老人护理和工业安全场景,代表AI感知基础设施创新方向。
VentureBeat调查:72%企业缺乏真正AI控制,治理幻象问题严峻
VentureBeat报告显示72%企业缺乏真正AI控制和安全保障,随着AI智能体越来越多地基于企业数据进行自动化决策,责任归属和安全框架问题日益突出。
Google 发布第八代 TPU:训练和推理芯片首次分道扬镳
Google 在 Cloud Next 大会上发布第八代 TPU,首次将训练和推理拆分为两款独立芯片:TPU 8t 专攻前沿训练(算力是上代 2.8 倍,达 121 Exaflops),TPU 8i 优化代理推理和高并发场景(每美元效能提升 80%)。采用 Broadcom 负责训练芯片、MediaTek 负责推理芯片的分工策略。Meta 和 Anthropic 已签署多年期 TPU 租赁大单。OpenAI 已成为 TPU 新客户。
OpenAI 30GW 算力规划曝光:或吃掉全美 6% 电力
泄露的投资人备忘录显示,OpenAI 计划到 2030 年实现 30GW 算力规模,当前已锁定 8GW 资源。这一规模或将消耗美国 6% 的电力,硅谷 AI 战争已从实验室打到发电厂。CNN 同日报道指出 AI 算力增长正在与有限能源产生正面碰撞。
AI 银河猎手加剧全球 GPU 短缺
TechCrunch 报道,使用 AI 寻找星系的天文学家正在加剧全球 GPU 短缺问题。科学研究对 GPU 的需求增长与 AI 商业应用形成竞争,凸显了算力资源分配的深层矛盾。
硅谷 AI 数据中心建设暗涌:影子电网引发污染担忧
科技公司正在硅谷悄然建设并行电力基础设施,为 AI 数据中心建造私人发电厂。这些『影子电网』在满足巨大算力需求的同时,也引发了空气污染和环保方面的担忧。。随着 Anthropic(1GW)、OpenAI(30GW 规划)等 AI 巨头的算力需求指数级增长,科技公司正在硅谷悄然建设并行电力基础设施。私人发电厂和「影子电网」满足巨大算力需求的同时,也引发了空气污染和能源分配公平性问题。。科技公司正在硅谷悄然建设并行电力基础设施,为 AI 数据中心建造私人发电厂。这些「影子电网」在满足巨大算力需求的同时,也引发了空气污染和环保担忧。微软同步探讨 AI 与可持续性平衡问题。
Anthropic 与 Broadcom、CoreWeave 签署多年芯片协议
在获得 Google 和 Amazon 共计 650 亿美元投资后,Anthropic 与 Broadcom 和 CoreWeave 签署多年芯片供应协议,计划年底前通过亚马逊定制 AI 芯片获得近 1GW 算力。Anthropic 还计划投资 500 亿美元在美国建设数据中心。算力基础设施已成为 AI 巨头竞争的核心战场。
Google TPU v8 后续:TorchTPU 生态扩展与客户争夺
继 Google Cloud Next 发布 TPU 8t/8i 后,TorchTPU 让 PyTorch 在 TPU 上原生运行的生态影响力持续扩大。据报道 OpenAI 已成为 TPU 新客户,Google 与 NVIDIA 在 AI 算力领域的竞争进入新阶段。TPU 8t 训练算力达 121 Exaflops,价格性能比为上代 2.8 倍。
DeepEP:DeepSeek 开源 MoE 专家并行通信库
DeepSeek 开源 DeepEP,一个高效的专家并行(Expert Parallel)通信库。作为 DeepSeek V4 的 1.6T MoE 架构的关键基础设施组件,DeepEP 为大规模 MoE 模型的训练和推理提供通信优化。GitHub 总星数 9336。
Open-Generative-AI:200+ 模型无审查 AI 图像/视频生成工作室
GitHub 项目 Anil-matcha/Open-Generative-AI 发布,集成 200+ 模型(Flux、Midjourney、Kling、Sora、Veo 等),提供无审查的 AI 图像和视频生成功能。MIT 开源协议,支持自部署。今日 +842 星,总星 7704。HN 社区对 AI 生成内容审查边界问题持续关注。
英伟达适配 DeepSeek V4,Blackwell 平台展示高吞吐性能
DeepSeek V4 开源后第一时间获得英伟达 Blackwell 平台(GB200)的官方适配,在高吞吐场景下展示出显著性能优势。这是国产顶级开源模型首次在开源后 24 小时内获得主流算力平台正式适配,标志着国产模型正加速融入全球算力生态。
DeepSeek V4 首发华为昇腾,寒武纪 Day0 完成适配
DeepSeek V4 预览版将早期访问权限独家开放给国产芯片厂商,华为昇腾 950PR 成为首发平台,这是顶级开源模型首次完整运行于国产算力之上。寒武纪同日完成 Day0 适配,打通全链路。华为表示昇腾超节点全系列产品均支持 V4 系列,EP 方案加速比 1.5-1.73 倍。
工信部支持"太空算力"发展,明确多层级算力架构
工信部表示将支持开展太空算力技术前瞻性研究,有序推动太空算力产业发展,探索"算力银行""算力超市"等创新业务。我国已率先实现太空计算星座在轨组网,算力卫星通过激光通信全球无缝覆盖,可将灾害预警数据时效从数小时压缩至秒级。截至 3 月底,国内智能算力规模达 1882 EFLOPS。
PostHog 全栈开发者平台 AI 功能升级,月活突破 5 万开发者
开源开发者平台 PostHog 宣布 AI 产品助手功能全面升级,支持 AI 辅助调试代码、自动生成分析看板、智能功能标志建议等。今日 GitHub Trending 第 5 位,累计 33884 颗星。产品分析、会话回放、A/B 测试均支持 AI 增强,目前已服务超 5 万名活跃开发者。
网宿科技 AI 安全加速新模式:边缘 AI + 安全服务毛利率 77%
网宿科技 Q1 2026 剔除 MSP 影响后收入同比增长 16.60%,毛利率创 9 年新高至 37.08%。安全及增值服务收入 13.80 亿元,毛利率高达 77.24%。公司推出大模型全球智能加速方案与 AI Agent 原生防护体系,已接入 AI、自动驾驶、教育等多个垂直行业客户。
微软与OpenAI正式修订合作协议:OpenAI可在任何云提供商(包括AWS、Google Cloud)销售产品;微软IP许可从独家变为非独家;双方将持续合作扩展GW级数据中心并共同开发下一代AI芯片。微软停止向OpenAI支付收入分成,OpenAI分成义务持续至2030年并设上限。
AMD MI350系列声称推理性能达MI300X的35倍
AMD正式宣布MI350系列GPU技术规格,官方声称推理性能达上代MI300X的35倍,同时支持FP4精度推理以进一步提升效率。vLLM和SGLang已完成MI350适配,这是AMD史上针对AI推理场景的最大架构跃升,预计将给NVIDIA H100/H200带来实质竞争压力。
华为昇腾首日完成DeepSeek V4全系适配
华为昇腾超节点全系列硬件产品宣布完成对DeepSeek V4的全面适配,包括910C、910B和新一代Atlas系列。此次适配覆盖预填充和解码两大推理阶段,首批商业客户已完成接入验证,进一步推动国产AI算力生态与前沿大模型的深度整合。
微软Azure与OpenAI合作扩大GW级数据中心建设
尽管商业条款重构,微软与OpenAI确认将持续合作扩展GW(吉瓦)级AI数据中心容量,并共同研发下一代AI专用芯片。分析师认为此举表明双方"脱钩"的同时保留了深度技术绑定,AI基础设施投资规模将持续攀升。
AI芯片格局报告:NVIDIA统治地位首次面临实质挑战
AI-Insight Research发布芯片全景报告,指出AI芯片格局正经历三重变革:AMD MI350推理性能反超;Google TPU v7拿下Anthropic大单;国产芯片通过DeepSeek V4适配加速商业化。报告认为NVIDIA的统治地位在推理市场首次面临实质性挑战。
Oracle全球裁员2万+,转身押注AI数据中心
Oracle完成对超过2万名全球员工的裁员,总数或达3万,约占总员工数18%。裁员通过早6点邮件无预警执行,同期Oracle宣布投入数百亿美元建设AI数据中心。公司净利润同比增长95%,股价一度上涨6%,"以人换算力"转型引发广泛关注。
Ghostty终端离开GitHub,开源项目平台迁移讨论爆发
知名终端模拟器Ghostty宣布离开GitHub,文章作者Mitchell Hashimoto详述迁移原因。该话题在HackerNews引爆讨论,获1846分高分、577条评论,成为今日最热技术讨论,折射出开发者社区对GitHub政策变化和平台依赖的普遍担忧。
Claude Regression:malware检查触发子Agent拒绝执行Bug热讨
Anthropic Claude Code出现严重回归问题:每次文件读取都会附加恶意软件扫描提示,导致子Agent误判后拒绝执行任务,产生不必要的Token和费用消耗。相关GitHub Issue在HackerNews获152分关注,开发者呼吁Anthropic优先修复。。Hugging Face 在 Hub 上发布 Kernels 功能,提供 GPU 内核仓库,报告 1.7×-2.5× 加速。降低自定义内核的开发和分发门槛。
Hugging Face LeRobot曝严重RCE漏洞(CVE-2026-25874,CVSS 9.8)
安全研究人员披露Hugging Face LeRobot库存在严重未修补远程代码执行漏洞(CVE-2026-25874),CVSS评分9.8极危,攻击者可通过恶意模型文件获取系统控制权。目前漏洞尚未修补,AI安全社区高度警惕。
AWS推出Amazon Quick AI桌面应用,连接工具与本地文件
Amazon正式推出Amazon Quick AI桌面客户端,允许用户连接外部工具和本地文件,构建自定义AI应用、实时仪表盘和自动化工作流。作为AWS AI生态的端侧延伸,该产品定位为企业和开发者的本地AI生产力中枢。
四大科技巨头 Q1 AI 资本支出达 $650B:史上最大规模基建投资
Amazon、Microsoft、Alphabet、Meta Q1财报显示,2026年AI基础设施资本支出合计将达$6500亿。Meta上调全年指引至$1250-1450亿,Alphabet上调至最高$1900亿。Amazon物业设备采购同比增$593亿,自由现金流暴跌95%至$12亿。市场对巨额支出的回报周期表示担忧,但各家CEO一致认为AI需求"前所未有",值得长期投入。
阿里云、百度智能云、腾讯云 4月集体涨价:云计算终结20年降价史
国内三大云厂商在4月相继上调AI算力价格,涨幅5%-34%,标志着云计算行业近20年持续降价趋势的终结。阿里云平头哥真武810E算力卡涨5%-34%,CPFS智算版存储涨30%。行业分析认为,AI推理需求爆发导致GPU资源稀缺,算力从"普惠资源"转为"稀缺战略资产",结构性涨价将持续2-3年。
中国智算规模达 159万 PFLOPS,日均词元调用量 100万亿
第九届数字中国建设峰会发布《全国数据资源调查报告(2025年)》显示,全国智能算力规模达159万PFLOPS,5G覆盖超330城,6G研发完成第一阶段试验形成超300项技术储备。2025年日均词元调用量从年初超万亿增至年末100万亿,全年累计约21,100万亿。国家数据局局长刘烈宏指出,"从流量到词元"的衡量单位变化折射出中国AI产业的跃升。
沐曦 GPU 累计出货超 5万颗:国产高性能 GPU 进入商业化阶段
数字中国峰会上,沐曦股份创始人陈维良表示截至2025年底GPU产品累计出货超5万颗,已规模化交付真实场景。沐曦正推动国产高性能GPU从"小范围试点"走向"规模化商业应用",在高速互联、基础软件、智算中心建设方面同步提速,标志着国产AI芯片从追赶走向落地的新阶段。
Amazon 推出产品页 AI 语音问答体验
Amazon在产品页面推出AI驱动的语音问答功能,用户可通过语音提问获取产品信息。这是Amazon将AI能力嵌入核心电商业务体验的最新尝试,此前Amazon已将OpenAI模型接入Bedrock并推出AI购物助手Rufus。此举显示Amazon正在将AI从云计算层向下渗透至消费端产品体验。
宇树科技开源全身运动数据集:数据是具身智能落地的核心驱动力
宇树科技CEO王兴兴在数字中国峰会表示"有多少数据,就有多少AI能力"。宇树已开源覆盖家庭、医疗及简单工业场景的全身运动数据集,计划大规模推进全身机器人运动数据采集。数据显示,具身智能对数据的需求将在五年内增长约1000倍,高质量运动数据稀缺仍是核心瓶颈。
NVIDIA 股价暴涨 18%:$1万亿 GPU 订单积压至 2027 年
英伟达 CEO 黄仁勋披露公司 GPU 订单积压已高达 1 万亿美元,延续至 2027 年。NVIDIA 通过 Vera Rubin 平台与 Meta/CoreWeave 合作进一步巩固地位。台积电 CEO 表示全力扩产仍难满足强劲 AI 需求。
三星将 HBM 研发周期压缩至一年以内
为匹配 AI 芯片迭代节奏,三星将 HBM 研发周期从约两年压缩至一年以内。HBM4E 样品已锁定 5 月产出,SK 海力士同步开始生产英伟达 Vera Rubin 芯片配套 HBM 产品。
Cerebras 提交 IPO 申请,挑战英伟达 AI 芯片霸主地位
AI 芯片独角兽 Cerebras 正式提交 IPO 申请,成为近年来最具野心的半导体上市公司之一。OpenAI 计划未来三年支付超 $200亿使用其芯片服务器,推进硬件多元化。
台积电 CEO:全力扩产仍难满足强劲 AI 需求
台积电 CEO 表示即使全力扩产仍难以满足当前强劲的 AI 算力需求。阿里、字节、腾讯等巨头已提前预订数十万颗昇腾 950PR 芯片,推动该芯片价格上涨约 20%。
Mac Mini 因 AI 需求全面售罄,eBay 加价 60%+
Apple M4 Mac Mini 因成为本地 AI 模型运行的理想设备而全面售罄。基础型号($599)在 eBay 标价高达 $979。AI 需求正在从数据中心蔓延至消费级硬件。
卫星图像揭示:40% AI 数据中心项目面临建设延期
卫星图像分析显示全球 40% 的 AI 数据中心项目面临建设延期,算力基础设施建设速度跟不上需求增长,供应链瓶颈日益凸显。
Google TPU v8:首次拆分训练/推理芯片
Google Cloud Next 宣布 TPU v8 拆分为 8t(训练)和 8i(推理)两款专用芯片。训练速度约 2.8× 提升,推理性价比提升 80%。OpenAI、Anthropic、Meta 据报正在购买 TPU 容量。TorchTPU 发布,首次打破 CUDA 生态壁垒。
16× DGX Spark 集群:2TB 统一内存的家用 AI 超算
Reddit 用户展示 16 块 NVIDIA DGX Spark 组建的家用集群,200Gbps FS 交换机,2TB 统一内存。社区建议运行 Kimi K2.6 + vLLM,预期高 prefill 但生成速度约 20 tok/s。
Llama.cpp 音频处理落地:Gemma-4 E2A/E4A 原生 STT
llama.cpp(llama-server)集成音频处理能力,支持 Gemma-4 E2A 和 E4A 模型的原生语音转文本。无需独立 Whisper 管道,但长音频(>5 分钟)仍有问题。E4B Q8_XL + BF16 mmproj 为推荐配置。
HeavyBall 3.0.0:FSDP/DDP 编译 2.5× 加速 + 新优化器
HeavyBall 3.0.0 发布:FSDP、DDP、端到端编译 2.5× 加速,更快的 Muon/SOAP 变体和新优化器。面向分布式训练的性能优化工具链。
KV Cache 优化:FA3 两级累积修复,128K 针中测试 13% → 89%
vLLM + Red Hat/AWS 发布 FP8 KV Cache 深度研究:修复 FA3 两级累积问题后,128K needle-in-a-haystack 从 13% 提升至 89%,同时保留 FP8 解码加速。社区同时讨论 DeepSeek V4 的 KV 权衡策略。
RTX PRO 6000 Blackwell:128GB 本地多用户推理
社区展示 RTX PRO 6000 Blackwell Max-Q 本地推理配置(9950X CPU, 128GB RAM),运行 Qwen3.5-27B-FP8,最大上下文 160K,仅用 55% VRAM。单请求 80-90 tok/s,并发 250+ tok/s。
SkyPilot 集成 VAST Data:跨异构计算后端直接高速数据挂载
SkyPilot 新增原生 VAST Data 支持,可直接跨异构计算后端进行高速数据集挂载,降低分布式训练/推理的数据访问复杂度。
LM Studio 安全警示:373 台设备公网暴露无 API Key
安全研究揭示全球 373 台 LM Studio 实例公网暴露且无需 API Key,泰国最多(194 台)。警示本地 AI 用户切勿将服务暴露到公网,建议使用 Tailscale 或反向代理+认证。
CuTeDSL:Python 内联 PTX 降低自定义 GPU 内核门槛
Maharshi 介绍 CuTeDSL,允许在 Python 中直接内联 PTX,避免不透明的 layout 操作,实质降低自定义 GPU 内核的开发门槛。
OpenAI与Cerebras签署三年超200亿美元战略合作协议,通过采购芯片服务器和获得认股权证,启动算力自主化布局,旨在降低对英伟达芯片依赖。Cerebras WSE-2芯片采用全硅片设计,集成85万个计算核心和40GB片上SRAM,内存带宽20PB/s,相比传统GPU集群节省30%训练时间和25%能耗。
OpenAICerebrasAI芯片算力自主化
芯片级光无线突破:360Gbps传输速率,能耗减半
芯片级光无线通信技术实现360Gbps以上传输速率,能耗约为传统Wi-Fi的一半。采用5x5 VCSEL阵列(每激光器13-19Gbps),解决数据中心网络瓶颈。Coherent同期发布400Gbps硅光子技术用于集群级数据传输。
光无线数据中心360Gbps硅光子
国内全栈自研AI推理GPU企业曦望完成新一轮超10亿元人民币融资,投资方涵盖产业战投、地方国资及头部财务机构。分拆独立仅一年多已完成七轮融资,累计约40亿元,估值突破百亿。4月国内多个AI芯片企业相继获得大额融资。
曦望推理GPU融资独角兽
Arista Networks上调2026年营收预期至112.5亿美元
Arista Networks将2026年营收预期上调至112.5亿美元,受益于高密度AI集群需求激增,内存定价不再是限制因素。
AristaAI网络营收
机器人
61 条
2026人形机器人半马落幕:荣耀『闪电』50分26秒夺冠,超百支队伍参赛打破人类纪录
4月19日,2026北京亦庄人形机器人半程马拉松举行,超百支人形机器人赛队参赛。荣耀齐天大圣队的『闪电』机器人以50分26秒净用时夺冠,打破人类半马世界纪录。相比2025年首届赛事,参赛队伍从20余支扩容至超百支,自主导航赛队首次亮相,标志着具身智能运动能力达到新里程碑。
物理AI进入制造业:Accenture、Vodafone、SAP试点AI驱动仿人机器人
Accenture、Vodafone和SAP正在仓库运营中试点由AI驱动的仿人机器人。德国初创公司Agile Robots在欧洲最大科技展上展示工业应用。这标志着物理AI从实验室走向制造流程的关键转折,AI Agent开始获得实体形态进入真实生产环境。
具身智能独角兽集体冲向百亿估值:四城百亿俱乐部格局加速固化
中国机器人赛道的百亿估值俱乐部正在以前所未有的速度扩容。深圳智平方、北京银河通用、上海智元、杭州宇树等覆盖具身大小脑、全栈整机与核心零部件的独角兽企业密集完成大额融资,头部格局加速固化。
给机器装上大脑:具身智能正加速走进日常生活
具身智能机器人正从技术验证走向生活场景落地。特种机器人已在强磁场、深海巡检等高危作业场景上岗,粮仓平仓机器人、海缆探测机器人纷纷投入实际运营。具身智能从表演型向生产力型的转变全面加速。
一年时间机器人从马拉松笑话到超越最强人类
从2025年首届机器人马拉松的蹒跚起步,到2026年荣耀『闪电』以50分26秒打破人类半马纪录,人形机器人的运动能力在一年间实现了质的飞跃。参赛队伍从20余支扩容至超百支,自主导航模式首次亮相,具身智能产业化进程超预期推进。
资本抢跑量产元年:具身智能产业链迎价值重估
2026年被业界视为具身智能量产元年,资本密集涌入赛道。AGIBOT WORLD 2026开源首个覆盖具身智能全域研究的真实场景数据集,产业链从核心零部件到整机制造全面进入价值重估期。
灵光砸1亿,能养出生态吗?AI家居三重考验
AI家居赛道面临家装边界、单品分化和生态之争三重考验。具身智能在家居场景的落地需要解决标准化、成本控制和用户体验三重挑战,行业仍在探索可持续的商业模式。
特斯拉官方公告,第三代人形机器人Optimus V3预计年中正式亮相,2026年7至8月启动规模化投产,测试工作正在进行中,年产百万台机器人目标持续推进。。特斯拉官方公告,第三代人形机器人 Optimus V3 预计年中正式亮相,2026 年 7 至 8 月启动规模化投产,年产百万台机器人目标持续推进。AI5 芯片已完成流片,2027 年量产,性能媲美 H100。
普渡机器人完成近10亿元融资,估值破百亿元,投资方涵盖国家级基金、产业龙头和地方国资,服务机器人赛道持续获资本看好。。普渡机器人完成近 10 亿元融资,估值破百亿元,投资方涵盖国家级基金、产业龙头和地方国资,服务机器人赛道持续获资本看好。
索尼AI乒乓球机器人Ace成果登上Nature封面,首个能与顶级职业人类选手对打并偶尔获胜的机器人,成功打出16个Ace,人类职业选手首次在线下对抗中落败。。索尼 AI 乒乓球机器人 Ace 成果登上 Nature 封面,首个能与顶级职业人类选手对打并偶尔获胜的机器人,成功打出 16 个 Ace,人类职业选手首次在线下对抗中落败。
央视焦点访谈分析4月19日北京亦庄机器人半马赛(荣耀以50分26秒夺冠)后的具身智能现状:硬件层接近L2成熟度,但大脑层智能突破仍是核心瓶颈,领先窗口期已大幅压缩。
Meta强制记录员工击键和鼠标操作用于AI训练,多名员工抗议
Meta在员工设备上强制记录击键、鼠标点击等操作数据用于训练AI,多名员工向媒体反映强烈不适,引发AI数据伦理讨论。
特斯拉确认HW3无法实现无人监督FSD,影响约400万辆车
特斯拉确认搭载HW3硬件的车辆无法升级至无人监督完全自动驾驶,影响约400万辆,特斯拉承诺提供补偿方案,战略重心进一步向AI和机器人转移。
DOBOT发布初息仿生具身智能3.0,展示高度逼真的机器人恐龙,核心突破是非结构化环境下的自主运动控制能力,代表仿生机器人的最新进展。。DOBOT 发布初息仿生具身智能 3.0,展示高度逼真的机器人恐龙,核心突破是非结构化环境下的自主运动控制能力。
北京人形机器人半马落幕:液冷散热成制胜关键
2026 年北京人形机器人半程马拉松正式落幕,相比 2025 年赛事,本届在规模和技术上均有显著提升。荣耀机器人借助液冷散热技术夺得冠军,展现了散热技术在机器人长时间运动中的关键作用。
智谱机器人携宇树亮相:第三代人形机器人年中发布
消息称特斯拉将在年中发布第三代人形机器人,同时宇树科技展示了轮足人形机器人。多家企业正在加速将具身智能从概念推向商业落地,AGIBOT 在合作伙伴大会上公布了激进的 2027 年增长计划。
中汉诺威工业展:中联重科全球首发 Robot Ops 具身智能操作系统
在 2026 年汉诺威工业展(4月20-24日)上,中联重科全球首发 Robot Ops 具身智能操作系统,面向工业场景的智能机器人调度管理。中国企业在具身智能商业化方面正在加速国际布局。。在 2026 年汉诺威工业展上,中联重科全球首发 Robot Ops 具身智能操作系统,面向工业场景的智能机器人调度管理。中国企业在具身智能商业化方面正在加速国际布局。
AGIBOT 发布新一代具身 AI 机器人和模型
全球领先的具身智能机器人公司 AGIBOT 发布新一代具身 AI 机器人和模型,加速物理 AI 的实际部署。该公司正在从概念验证阶段转向商业化落地,通过与多家制造企业的合作推动具身智能在工业场景的应用。。AGIBOT在2026合作伙伴大会上宣布新一代具身AI机器人产品和基础模型。新产品强调现实世界部署能力,基础模型支持多任务泛化学习,明显提升工业和服务场景的实际可用性。公司目标是将Physical AI从实验室推向规模化商业落地。
中国具身 AI 融资创新高:Spirit AI 30 天融 30 亿元
2026 年 4 月成为具身 AI 融资最火热的一月。Spirit AI 在 30 天内完成 30 亿元人民币融资,Aheadform 完成A轮融资。具身智能正成为 VC 最拥挤的赛道之一。
2026 北京车展:AI 原生与全域智驾爆发,三大阵营格局成型
第十九届北京国际车展正式启幕,以「领时代·智未来」为主题。三大技术阵营格局清晰:新势力(理想 2560TOPS、小鹏 3000TOPS 自研芯片)、华为赋能(ADS 5.0 全栈方案、鸿蒙座舱 6、「五界」同台 4400 平方米)、传统车企(大众首产量产车载 AI 智能体、宝马引入阿里 DeepSeek 大模型)。合资品牌研发主导权从外资向中方转移。。第十九届北京国际车展正式启幕。三大技术阵营格局清晰:新势力(理想 2560TOPS、小鹏 3000TOPS 自研芯片)、华为赋能(ADS 5.0 全栈方案、鸿蒙座舱 6、「五界」同台)、传统车企(大众首产量产车载 AI 智能体、宝马引入 DeepSeek 大模型)。合资品牌研发主导权从外资向中方转移。
华为乾崑 ADS 5.0 发布:冲击 L3 自动驾驶量产
华为乾崑正式发布 ADS 5.0 全栈智能驾驶解决方案和全新鸿蒙座舱 6。问界 M9(全新一代)、尊界 S800、智界 V9(首款 MPV)、享界 S9 增程版、东风奕境 X9 首发搭载。同济大学朱西产教授评价 ADS 5.0 冲击 L3 自动驾驶量产,体现智能驾驶技术迭代升级。
理想、小鹏自研智驾芯片算力突破 2500TOPS
北京车展上,理想发布搭载 4 颗自研 5nm「马赫100」芯片的 L9 Livis,总算力 2560TOPS;小鹏 GX 搭载 4 颗自研图灵 AI 芯片,本地有效算力 3000TOPS。自研芯片取代进口芯片率先在高端车型落地,北方工业大学张翔研究员认为这是智能化升级的重要趋势。
大众 ID.ERA 9X 首产量产车载 AI 智能体
大众在北京车展发布 ID.ERA 9X,首次量产车载 AI 智能体(本地大语言模型),实现「对话即执行」并保障隐私安全。采用 Momenta 智驾方案,标志着合资品牌从跟随者向中国本土技术生态融合的转型。
IDC:2026 人形机器人商业化趋势报告
IDC 发布 2026 人形机器人商业化趋势报告,指出 2026 年北京人形机器人半马较 2025 年在规模和技术上均有显著提升。全球具身智能正从实验室走向实际部署,产业链从核心零部件到整机制造全面进入价值重估期。
具身 AI 训练中心在中国东平落地
新华社报道,中国山东东平县已建立具身 AI 数据训练中心,为汽车制造等场景训练人形机器人。训练师监督机器人在汽车制造场景中执行任务,标志着中国具身智能产业从研发向产业化训练的快速推进。
具身智能 2026 年研究总结:AGIBOT World 数据集打破数据瓶颈
2026 年具身智能领域最大制约正被突破:AGIBOT World 2026 发布 600 万轨迹数据集,ABot-M0 提供完整人机交互标注。研究显示,云端大模型预训练 + 机器人端轻量化推理的"端云协同"模式成为主流,越疆、优艾智合等企业已实现工厂毫米级精度的实际部署。
2026 北京亦庄人形机器人半马赛最终结果:荣耀"闪电"机器人以 50 分 26 秒完赛,打破人类男子半马世界纪录(58 分 01 秒),成为首台在正式赛场超越人类速度极限的人形机器人。深圳越疆机器人、优艾智合等企业的工厂部署机器人也同期亮相,具身智能商业化进程加速。。4月19日北京亦庄人形机器人半程马拉松,荣耀"闪电"机器人以50分26秒完赛,不仅大幅领先人类男子半马世界纪录,更将一年前机器人半马成绩压缩了110分钟。102支赛队300余台机器人参赛,展示了中国具身智能硬件迭代的狂飙速度。。北京亦庄人形机器人半程马拉松,荣耀「闪电」以 50 分 26 秒(净用时)大幅超越人类世界纪录(56分42秒),包揽赛事前六名。超百支赛队参赛,较上届扩容近 5 倍。搭载自研液冷散热与一体化关节模组,全程零故障。央视焦点访谈称硬件层接近 L2 成熟度,但大脑层智能突破仍是核心瓶颈。。荣耀"闪电"人形机器人以 50 分 26 秒完成半程马拉松,打破人类半马世界纪录。标志着人形机器人运动能力的里程碑式突破。
2026 年 Q1 具身智能融资超 300 亿元,百亿估值阵营持续扩容
统计数据显示,2026 年第一季度国内具身智能机器人融资 210 起,总额超 300 亿元。美国 Figure AI 估值飙至 390 亿美元,Physical Intelligence 估值超 100 亿美元。"十五五"规划纲要明确将具身智能列为未来产业,政策东风与资本热潮叠加,行业进入加速扩张期。
智用开物完成近亿元天使+融资,工业智能体效能相当于 6 名人类
工业智能体公司智用开物完成近亿元天使+轮融资,由瑞枫资本领投,立讯精密家族办公室战略投资。其产品在立讯精密等客户处,单个 AI 排产员效能相当于 6 名人类员工,SOP 自动化率 80%,培训时间从 1.5 天缩至 2 小时。公司专注于"工业语义引擎+多智能体系统"。
火山引擎汽车 AI 解决方案:搭载豆包大模型智能汽车超 700 万辆
火山引擎发布新一代汽车 AI 解决方案,搭载豆包大模型的智能汽车已超 700 万辆。方案支持舱内多模态交互、智能导航、车端端云协同推理等。字节跳动旗下火山引擎已成为国内头部车企的主要 AI 供应商之一,与华为 ADS 5.0、理想自研芯片形成竞争格局。
Applied Intuition:物理AI走向矿山、军舰、无人机等实体重工场景
Applied Intuition CEO在Latent Space播客深入探讨"物理AI"概念,即将AI集成到采矿设备、无人机、卡车、军舰等实体重型机械中。公司已签约多家国防和工业客户,重点解决高对抗性真实环境下的感知-决策-执行闭环,是AI从数字领域向物理世界扩展的最前沿。
腾讯Robotics X具身模型HY-Embodied-0.5-X屠榜10项benchmark
腾讯Robotics X发布HY-Embodied-0.5-X具身模型并开源,在覆盖规划、空间推理、具身问答、视觉指代与轨迹理解的10项benchmark中取得6项第一、3项第二成绩。模型专注机器人在真实环境的感知-决策-执行能力,依托HY-Embodied-0.5-MoT-2B架构。。MagicLab机器人在硅谷举办全球具身智能峰会(GEIS),发布自研世界模型Magic-Mix(含物理环境理解模块WAM和离线数据生成引擎Creator),以及旗舰人形机器人MagicBot X1(身高180cm,450N·m关节扭矩)和H01灵巧手(20自由度,44个触觉传感器)。公司公布2036年$140亿营收目标,5年投资$10亿建设机器人开发者生态,业务已覆盖50个国家。。Google DeepMind 发布 Gemini Robotics-ER 1.6,显著提升机器人的视觉/空间推理能力,仪表盘读取成功率 93%。面向具身智能的场景理解和操作任务。。Microsoft 发布 TRELLIS.2,4B 参数图像转 3D 模型,生成最高 1536³ 分辨率的 PBR 纹理资产。基于原生 3D VAE 和 16× 空间压缩。开源,GitHub + HuggingFace 可用。
清华大学具身智能与机器人研究院正式揭牌
清华大学具身智能与机器人研究院正式揭牌成立,聚焦具身智能与实体产业融合,加速新质生产力落地。研究院将依托清华AI研究基础,推进人形机器人感知、决策与执行关键技术攻关,对接国家"未来产业投资基金"政策。
世航智能海洋具身机器人"虎鲸"登上新加坡海事周C位
中国世航智能(SEAHI Robotics)携海洋具身机器人"虎鲸"亮相2026新加坡海事周,成为全场唯一官方特邀海洋具身机器人企业,与中国船级社CCS联手站上世界海事舞台,吸引大量国际船东和港口运营商关注。
2026年具身智能世界模型与数据集大爆发
行业报告梳理2026年具身智能领域进展,AGIBOT World 2026、ABot-M0推出包含600万条机器人操作轨迹的数据集,打破训练数据瓶颈。端云协同架构成为主流:云端大模型预训练结合机器人端轻量化推理,降低部署门槛同时保留复杂任务能力。
第三届中国具身智能大会开幕:从"能动"跨越到"能干"
第三届中国具身智能与人形机器人产业大会4月28-29日在北京中关村举行,超千位政产研学金界人士参会,主题为"具身智能新纪元·人形机器人新未来"。北京市机器人产业协会同期成立"人形机器人产业链协同发展推进工作组",聚焦共性技术攻关与标准建设。
灵心巧手Linker Hand:全球唯一灵巧手万台量产,市占率80%+
灵心巧手(北京)科技在产业大会上展示全球唯一实现高自由度灵巧手万台量产成果,全球市场份额超80%。其Linker Hand产品可实现穿针引线等精细操作,已被斯坦福、剑桥、清华、富士康等顶尖机构采用,代表着人形机器人从"能做"到"好用"的关键跨越。
启物科技"大小脑长记忆系统",端侧低算力兼顾泛化与精度
北京初创公司启物科技在具身智能大会上发布"大小脑长记忆系统"架构,在端侧有限算力下同时兼顾模型泛化性与精度,为具身智能商业场景的低成本落地开辟新路径。该方案将大模型推理能力与轻量级实时控制有机结合。
中国发布《人形与具身智能标准体系2026》,全产业链首个顶层设计
中国正式发布《人形与具身智能标准体系2026版》,这是国内首个覆盖人形机器人全产业链的综合性顶层标准设计,从感知、决策到执行全链路制定统一规范,标志着中国具身智能产业进入标准化规范化发展新阶段。
Waymo融资160亿美元创纪录,2026年自动驾驶进入商业规模阶段
Waymo完成160亿美元融资,是2026年Q1最大AI融资事件之一。公司宣布将显著扩大Robotaxi商业运营规模,覆盖更多城市,并加速下一代传感器系统和AI驾驶模型研发,自动驾驶赛道从技术验证全面进入商业规模化阶段。
具身智能数据量五年将翻 1000 倍:高质量运动数据成核心瓶颈
数字中国峰会多位嘉宾指出,具身智能对数据的需求将在未来五年增长约1000倍。四维图新总经理程鹏表示,无论是工厂装配、家庭还是医疗场景,高质量运动与任务数据的缺失制约了算法泛化能力。未来数据采集、标注和合成将成为具身智能产业链关键环节,数据飞轮的建立速度将决定具身智能的落地节奏。
AGIBOT 确认 2027 年具身智能商业化路径:从概念到落地
在2026合作伙伴大会上,中国机器人公司AGIBOT明确将具身智能从概念推向商业现实的激进增长计划。结合此前多家机器人企业的大额融资和国队资本布局,2027年被行业普遍视为具身智能规模化落地的关键年份。China Daily报道的中国人形机器人半马赛成果也展示了运动稳定性和硬件可靠性的显著提升。
国家队投了一个苏州机器人:具身智能赛道资本热度持续
36氪报道,国家队资本投资了一家苏州机器人企业,具体金额未披露。结合此前AGIBOT等公司的大额融资,具身智能/机器人赛道在2026年持续吸引资本关注。行业预计2027年将是具身智能从概念走向商业现实的关键年份,多家公司已制定积极的增长计划。
Scout AI 融资 $1亿 A轮:打造无人战争 AI 基础模型
国防AI初创公司Scout AI完成$1亿超额认购A轮融资,由Align Ventures领投。公司由Colby Adcock和Collin Otis于2024年创立,致力于为自主军事行动开发基础模型,在加利福尼亚设有训练基地。资金将用于训练军事AI模型和扩大无人地面车辆测试。这是2026年国防AI领域最大的单笔A轮融资之一。
智元发布"358宏图计划":2027 年营收目标 100 亿元
智元机器人 2500 位来自 34 个国家的合作伙伴参会,发布具身智能产业 XYZ 曲线与「358宏图计划」:2027 年营收超 100 亿,2030 年超 1000 亿。发布远征 A3 等四大机器人新品及七大生产力解决方案。已在头部企业真实产线常态化运行,未来 5 年投入超 20 亿元扶持生态。
Physical Intelligence 发布 π0.7:VLA 模型组合泛化涌现
Physical Intelligence 发布 π0.7 模型,作为 VLA(Vision-Language-Action)模型展现组合泛化涌现能力,在机器人任务中实现跨场景零样本迁移,被业界视为具身智能核心突破。贝索斯与 OpenAI 均参与投资,估值突破 $110亿。
SoftBank 成立 Physical AI 公司,贝索斯 Prometheus 即将完成 $100亿融资
SoftBank 宣布成立 Physical AI 公司,目标在 2030 年前实现机器人自主控制。贝索斯主导的 Prometheus 物理AI实验室即将完成 $100亿融资,专注机器人、工业自动化和物理仿真。
智元 G2 实现全球首个具身智能产线规模化落地
智元精灵 G2 机器人在龙旗科技工厂实现全球首个具身智能产线规模化落地,部分实现亚毫米级闭环控制及极低不良率。CEO 邓泰华宣布 2026 年为「部署态元年」。
深圳家用机器人出海:可独立完成归置杂物、倒垃圾、清理猫砂
深圳具身智能企业「自变量机器人」联合家政平台试点家庭清洁服务,机器人能独立完成归置杂物、倒垃圾、清理猫砂等任务。相关视频在海外社交媒体引发广泛好评。
新华网"机器人+"具身智能产业赋能行动正式启动
新华网联合产、学、研、用、资等多方权威机构发起「机器人+」具身智能产业赋能行动在京正式启动,搭建新质生产力具身智能交流协作平台。
腾讯发布 HYWorld 2.0:开源 3D 世界模型
腾讯发布 HYWorld 2.0 开源 3D 世界模型,可从单张图片生成可编辑 3D 场景。面向游戏、虚拟制作和机器人仿真等场景。
CaP-Gym / CaP-X:187 个操作任务的具身智能基准
CaP-Gym / CaP-X 发布大规模具身智能基准和工具包,涵盖 187 个操作任务、12 个前沿模型,支持训练无关和 RL 改进策略。MIT 许可代码开源。
Claude 连接 Blender:AI 驱动 3D 内容创作管线
Claude 通过 MCP 连接 Blender,可实现自然语言控制 3D 场景创建、节点调试、批量修改。完整创意管线可由单用户 + Claude + 连接工具管理,从脚本编写到最终剪辑。
World-R1:用 RL "唤醒"视频模型中的 3D 结构知识
World-R1 研究声称现有视频模型已编码 3D 结构,可通过 RL "唤醒",无需架构修改、额外视频训练数据或额外推理成本。
H Company Holo3:GUI 导航模型家族(A3B/35B)
H Company 发布 Holo3,基于 Qwen3.5 的 GUI 导航模型家族(A3B/35B),免费许可,Transformers 支持。面向桌面/Web 自动化和 GUI Agent 场景。
Vista4D:4D 场景表示实现视频"重新拍摄"
Vista4D 引入视频"重新拍摄"概念,使用持久 4D 场景表示从新相机轨迹渲染。为视频编辑和 3D 感知提供新范式。
OpenEvidence:40%+ 美国医生使用 AI 临床辅助系统
OpenEvidence 报告超过 40% 的美国医生依赖其 AI 临床辅助系统,由 Baseten 提供推理支持。标志着 AI 在医疗场景的大规模实际部署。
2026年4月19日北京亦庄半程马拉松,深圳宏智科技的人形机器人Flash以50分26秒完成21.1公里全程,自主导航+自主决策,超越人类半马世界纪录。这是人形机器人首次在公开赛事中超越人类。
人形机器人马拉松Flash世界纪录
4月14-15日香港InnoEX展会,超过100台机器人参展,包括全球前5大人形机器人制造商中的4家(AgiBot、EngineAI、UBTECH、Unitree)。机器人展示了拳击、音乐表演和救援操作,AgiBot X2 Ultra的语言能力和物理操作灵活性备受关注。
InnoEX人形机器人AgiBotUnitree
4月20日德国汉诺威工业展(Hannover Messe 2026)开幕,工业AI和人形机器人成为核心主题。多家企业展示AI集成的新型工业机器人和自动化解决方案。
汉诺威工业展工业AI机器人自动化
NVIDIA GTC 2026:黄仁勋发布Physical AI路线图
NVIDIA GTC 2026上,黄仁勋发布全面的Physical AI路线图,涵盖Agentic AI、AI工厂、开放模型和基于合成数据训练的人形机器人规模化部署方案。
NVIDIA GTCPhysical AI黄仁勋人形机器人
多模态
48 条
OpenAI发布ChatGPT Images 2.0:首个具思考能力的AI图像模型,中文渲染零偏差
OpenAI发布ChatGPT Images 2.0,基于GPT Image 2模型,是全球首个自带思考推理能力的AI图像生成模型。核心升级包括:联网搜索集成、多语言文本精准渲染(约99%准确率)、完整信息图/幻灯片/地图生成、漫画/manga风格、一次生成多张图像。向所有ChatGPT用户免费开放。。AI 视频生成领域格局悄然重组:OpenAI Sora 已于 4 月 26 日正式关闭,阿里 HappyHorse 今日登顶 Video Arena;字节 Seedance 2.0 以原生音频同步领跑音视频一体化;快手 Kling 3.0 在时长与运动一致性上持续发力。Runway、Pika 等国际玩家面临来自国内厂商的强烈挑战。。Hugging Face 用开源 5B 模型在 16 个并行 HF Jobs(L40S)上 OCR 了 27000 篇 arXiv 论文转 Markdown,仅花 $850、约 29 小时。模型为 Chandra-OCR-2。为"Chat with your paper"功能提供基础。。Hugging Face 推出 Hugging Science,策展开放科学数据集/模型/挑战,包括 78GB 基因组、11TB PDE 仿真、1 亿细胞图谱、9T DNA 碱基对等。
Anthropic发布Claude Design:提示词直接转产品原型,正面挑战Figma
Anthropic推出Claude Design,可将自然语言提示词直接转化为高保真产品原型,支持交互式UI、组件库生成和响应式布局,与Canva深度合作。标志着Anthropic从基础模型提供商向全栈产品公司转型,设计工具赛道竞争格局被重写。。Google 正式将 ProducerAI 更名为 Flow Music 并上线,基于 Lyria 3 音乐生成模型和 Veo 视频模型。支持自然语言生成完整歌曲、创建音乐视频、混音曲目和编写自定义音频插件。免费起步,但定价策略引发社区困惑。整合进 Google Flow 生态。。阿里 ATH 旗下 AI 视频模型 HappyHorse-1.0 今日通过阿里云百炼平台逐步开放 API 测试,首批开放企业级客户,5 月份正式商用。HappyHorse 已登顶 Artificial Analysis 的 AI Video Arena 排行榜,超越字节跳动 Seedance 和快手可灵。支持文本转视频、图像转视频,并可生成同步音频。。微软开源语音AI框架VibeVoice持续在GitHub Trending上攀升至4.6万星(日增1690星)。VibeVoice是一个前沿语音AI模型家族,包含语音识别(ASR)和语音合成(TTS),支持低延迟(<500ms)实时语音对话,可完全私有化部署,支持60分钟长上下文音频。已整合HuggingFace,降低了开发者使用门槛。。Anthropic 推出 Claude Design,可将自然语言转化为高保真产品原型,支持交互式 UI 和响应式布局,与 Canva 深度合作。设计工具赛道竞争格局被重写。。Google 宣布 Gemini 可从聊天中直接生成可下载的 Docs、Sheets、Slides、PDF 等多种格式文件。Sundar Pichai 亲自宣布。Google Q1 报告 Cloud +63% YoY。。Microsoft 发布 MAI-Transcribe-1,AA-WER 3.0%(#4),69× 实时速度,25 种语言。Azure Speech/Foundry 预览,定价 $6/千分钟。。Perplexity 推出 Agent 化工作流帮助起草/审核联邦税务申报("Navigate my taxes")。标志着 AI Agent 在高合规领域的实际落地。
YouTube扩大AI相似度检测:名人面部保护技术向全平台普及
YouTube宣布将AI相似度检测技术扩大至全平台名人保护,覆盖面部、声音和形体特征。随着AI视频生成技术迅速普及,深度伪造视频泛滥成灾,主流视频平台首次将AI侵权检测上升为平台核心安全基础设施。。YouTube宣布将AI相似度检测技术扩展至名人和公众人物,用于识别和处理AI深度伪造的名人视频,多模态AI内容真实性验证正成为平台级关键能力。
Latitude推出Voyage:AI原生RPG游戏创作平台,NPC互动全AI生成
AI Dungeon开发商Latitude推出Voyage平台,专为创建自定义角色扮演游戏设计。玩家可用自然语言构建独特游戏世界,NPC对话和剧情走向完全由AI动态生成。多模态AI在娱乐内容创作领域的应用正从生成单张图进化到构建完整叙事世界。。ByteIota 报道指出,HuggingFace 的 ml-intern 在自动化 LLM 训练后工作流演示中表现优于 Claude Code。ml-intern 在微调 Qwen3-1.7B 等任务上展现出自主诊断训练失败、自动调整超参数的能力,标志着开源 ML Agent 能力达到新高度。
AIDC-AI在GitHub发布Pixelle-Video,一款AI全自动短视频生成引擎,一日获237颗GitHub星。项目支持从文本描述到完整短视频的全自动生成流程,开源视频生成工具生态持续壮大。。AIDC-AI 发布 Pixelle-Video,支持从文本到完整短视频的全自动生成流程,GitHub Trending 获 237 星。
Deezer平台44%上传歌曲为AI生成:AI音乐渗透率引爆版权争议
音乐流媒体平台Deezer披露每日上传歌曲中有44%是AI生成的,AI音乐渗透率远超预期。AI对音乐版权体系的冲击正在加速,收入分配格局面临根本性重构。
爱奇艺AI艺人库引发争议:AI生成虚拟艺人商业化边界待定
爱奇艺推出AI艺人库引发广泛争议。AI生成虚拟艺人的商业化路径和法律边界仍不明确,公众接受度和行业监管框架尚未建立,AI在娱乐内容生产中的应用面临伦理和合规双重考验。
Google Research:生成式AI可对已拍照片后期调整视角和构图
Google Research发布生成式AI照片重构技术,可对已拍摄照片进行视角调整和构图后期优化,标志着AIGC从文生图向图像理解与创作融合的新阶段迈进。。Google Research 发布生成式 AI 照片重构技术,可对已拍摄照片进行视角调整和构图后期优化,标志着 AIGC 从文生图向图像理解与创作融合的新阶段迈进。
MiMo-V2.5是小米第一个原生全模态模型,同时支持图像、音频、视频理解与生成,在VideoMME等评测中表现逼近Claude Opus 4.6,并同步推出TTS和ASR系列。
Google宣布Google Maps将迎来大量Gemini AI功能整合,包括智能路线推荐、场地信息摘要、实时交通分析等,是AI-first战略在消费端的最新落地。。Qwen3.5-Omni-Plus 在 DailyOmni 和音频任务上超越 Gemini-3.1 Pro。展现涌现的"vibe coding"能力——从视频输入生成代码,非显式训练获得。
Flipbook探索『生成式视觉互联网』:网站内容由生成式模型实时流式传输
新创公司Flipbook提出生成式视觉互联网概念,网站内容直接由生成式模型实时流式传输,用户每次访问可获得定制化视觉内容体验,是互联网内容交付方式的颠覆性探索。。新创公司 Flipbook 提出生成式视觉互联网概念,网站内容直接由生成式模型实时流式传输,用户每次访问可获得定制化视觉内容体验。
最新报告显示44%的新歌曲已由AI生成或参与创作,但流媒体播放量数据显示人类听众对纯AI音乐接受度仍有明显差距,AI音乐生态面临质量与情感认同挑战。。Deezer 披露每日上传歌曲中 44% 是 AI 生成的,渗透率远超预期。但流媒体播放量数据显示人类听众对纯 AI 音乐接受度仍有明显差距,AI 音乐生态面临质量与情感认同挑战。
GPT Image 2 发布:99% 文字渲染准确率,LM Arena 登顶
OpenAI 发布 GPT Image 2(ChatGPT Images 2.0),实现约 99% 的文字渲染准确率、4K 分辨率输出,支持推理驱动的生成架构。支持中英文等多语言文字排版、网页截图模拟、社交媒体模板等。Sam Altman 称其为『从 GPT-3 到 GPT-5 级别的飞跃』。LM Arena ELO 1512 登顶。
蔡浩宇新视频模型 LPM 1.0 发布:给游戏行业造新引擎
米哈游创始人蔡浩宇推出的新视频生成模型 LPM 1.0 只是冰山一角,真正在造的是下一个时代的游戏引擎。该模型被视为将改变游戏资产生产流程的革命性工具,极客公园深度报道引发行业热议。。米哈游创始人蔡浩宇推出的视频生成模型 LPM 1.0 持续引发讨论。极客公园深度报道认为该模型不只是一款视频生成工具,更是在打造下一代游戏引擎,将改变游戏资产生产流程。AI 视频生成正从内容创作向游戏工业化生产延伸。
胡渊鸣的 Meshy ARR 突破 4000 万美元:3D AI 生成进入快车道
清华姚班出身的胡渊鸣创办的 Meshy,已成为全球 3D 生成式 AI 领域的领军企业,ARR 突破 4000 万美元。从文字、图像到视频,3D 很可能是生成式 AI 重写的下一个领域。
Buzzy 融资 2000 万美元:推出视频版 Photoshop
ARR 同为 2000 万美元的 AI 公司 Buzzy 完成新一轮 2000 万美元融资,推出被称为『视频版 Photoshop』的产品。用户只需对话即可编辑和生成视频,告别 AE、PR 等传统工具。
OpenAI GPT-Image 2 引发伦理争议:有图无真相时代来临
GPT Image 2 的超逼真能力引发伦理担忧,中文排版准确率 99% 意味着 AI 生图已可用于制造高度逼真的假新闻图片。36Kr 评论称『伦理失守比技术突破更可怕』,需要建立图片真实性验证机制。。OpenAI 发布的 GPT Image 2(ChatGPT Images 2.0)持续引发伦理争议。约 99% 文字渲染准确率(含中文)意味着 AI 可生成高度逼真的假新闻图片。社区呼吁建立图片真实性验证机制,36Kr 评论称「伦理失守比技术突破更可怕」。
HappyHorse 1.0 登顶开源 AI 视频生成排行榜
HappyHorse 1.0 以 150 亿参数统一 Transformer 架构,在 Artificial Analysis Video Arena 排行榜登顶(ELO 1374)。支持原生音视频联合生成、7 语言唇形同步、38 秒输出 1080p 视频。完全开源,被认为是阿里团队作品。社区将其视为 AI 视频生成的里程碑。
OpenAI GPT Image 2:创意设计师天塌了吗?行业影响深度评析
GPT Image 2 发布后掀起争议:其精准的文字渲染、物体组合、风格迁移能力使大量设计师感受到职业威胁。36Kr 调查显示,设计师群体开始重新定义自身价值——从"制作者"转向"导演者"和"策略者"。欧莱雅 CreAItech 实验室已利用生成式 AI 每月产出 5 万张图片、500 条视频,内容周期从数周压缩至数天。
ByteDance Seedance 2.0 API 技术深解:原生音频同步 + 导演级镜头控制
ByteDance Seedance 2.0(4 月 9 日发布)API 技术细节:单次请求可同时接收文本、图像、视频片段和音频,生成具有原生音频同步的电影级视频,支持导演级镜头控制(推拉摇移)和卓越运动一致性。被视为字节继 TikTok 之后在视频 AI 领域的最强布局。
欧莱雅 BRANDSTORM 2026:AI+美妆创新,配方发现速度提升 100 倍
欧莱雅 BRANDSTORM 2026 中国总决赛在上海收官,AI 成核心议题。欧莱雅宣布扩大与英伟达的 AI 合作,将 ALCHEMI 机器学习框架整合进研发体系,配方发现速度提升 100 倍。同时设立 CreAItech 生成式 AI 美妆内容实验室,月产 5 万张图片和 500 条视频,内容部署周期从数周压缩至数天。
脑机接口收费标准出台:侵入式置入费集中在 6000-6600 元
国内正式出台脑机接口收费标准,侵入式脑机接口置入费价格集中在 6000 至 6600 元/次。这是国内首次为脑机接口技术制定收费规范,标志着脑机接口从科研阶段迈向医疗商业化。国内已有多家企业完成动物实验并启动人体临床试验。
阿里HappyHorse 1.0于4月27日正式开启灰度测试,官网、阿里云百炼平台和千问App同步开放。150亿参数,单H100生成5秒1080P视频仅需38秒,比竞品Seedance 2.0快2-3倍。当前在图生视频(含音频)榜单位列第二,文生视频赛道被Seedance 2.0反超。API将于4月30日正式上线百炼平台。。字节Seedance 2.0在文生视频赛道成功反超HappyHorse 1.0,保持文生视频第一位置。Seedance 2.0支持文字/图像/视频/音频四种输入,日Token消耗在字节漫剧场景突破7000万,生态壁垒已形成,头部客户迁移成本极高,短期内格局难以撼动。
微软开源VibeVoice前沿语音AI项目
微软开源VibeVoice语音AI项目,今日GitHub Trending新增757颗星,总星数突破43000。VibeVoice支持高质量语音合成与理解,代表微软在开源语音AI领域的最新布局,与ElevenLabs、OpenAI TTS形成竞争,开发者可直接调用API构建语音应用。
阿里Happy Oyster:从文本/图像生成可交互3D场景与沉浸视频
阿里4月16日发布的世界模型产品Happy Oyster今日获更多技术解析,该模型可从文本和图像提示生成可交互3D场景,支持最长3分钟的沉浸式视频。HappyHorse和Happy Oyster构成阿里AI创新事业部双线多模态矩阵,另有一款多模态模型即将发布。
三星Galaxy Glasses"Jinju"谍照曝光,预计479美元
三星首款智能眼镜代号Jinju的设计谍照流出,外观类似Meta雷朋智能眼镜(无显示屏设计),预计售价379至499美元。分析师预测将在下月Google I/O大会期间正式发布,将与Meta雷朋直接竞争,AI语音助手为核心卖点。
AI驱动iPhone主屏幕应用Skye上线前获融资
Skye开发了一款AI感知的iPhone主屏幕应用,在正式上线前已成功获得天使投资,重塑手机静态界面的AI化演进。该应用根据用户习惯、时间、地点动态调整主屏幕布局和推荐应用,代表消费级AI个性化体验的新方向。
AIGC视频商业化加速:HappyHorse定价1.6元/秒vs Seedance比价
阿里HappyHorse公布商业定价:1080P为1.6元/秒,720P为0.9元/秒,折扣后分别降至0.78元和0.44元。720P比Seedance 2.0每秒便宜约1毛钱,但并非价格屠夫策略,阿里定价底气来自更高生成效率(相同算力可服务更多请求),降低了单位服务成本。
微软VibeVoice开源,前沿语音AI今日GitHub Trending第一
微软正式开源VibeVoice前沿语音AI项目,单日在GitHub斩获1483颗星,登上Trending榜首(总星数44958)。项目以Python编写,支持实时语音合成与理解,面向开发者开放完整代码,被视为微软在语音AI领域的重要开源布局。。abhigyanpatwari/GitNexus在GitHub今日新增1607星,总星32727,提供零服务端代码智能引擎,在浏览器中运行知识图谱创建与Graph RAG Agent功能。开发者可对整个代码库进行语义级问答,无需搭建后端服务,代码理解与Agent的结合引发广泛关注。
Google推出"Ask YouTube",Premium用户可对话式AI搜索视频内容
Google向YouTube Premium用户推出"Ask YouTube"功能,允许用户通过对话方式搜索和探索视频内容,AI自动理解视频语义并给出精准推荐。这是Google将Gemini多模态能力深度嵌入YouTube平台的重要举措,探索视频内容的AI交互新范式。
ACE-Step 1.5 UI开源:Suno替代方案今日GitHub热榜
fspecii/ace-step-ui开源项目在GitHub Trending升温,为ACE-Step 1.5 AI音乐生成模型提供专业UI界面,总星1781颗,今日新增162颗。项目被定位为"终极开源Suno替代品",支持完整的音乐创作工作流,AI音乐生成领域开源生态持续活跃。
Anthropic加入Blender开发基金成为企业赞助商
Anthropic正式宣布加入Blender开发基金,成为企业级赞助商,与同期发布的Claude for Creative Work形成呼应。此举被视为Anthropic深化与创意工具生态战略整合的重要信号,也是AI公司系统性布局创意内容生成市场的典型案例。
Claude.ai发生重大宕机,12000+用户受影响
Anthropic旗下Claude.ai、Claude Code、Claude API同时发生重大服务中断,短时间内Downdetector收到近3000份故障报告,影响超1.2万用户。宕机持续约1小时后恢复正常。事件恰好发生在公司宣布Claude for Creative Work的同一天,引发舆论高度关注。
DeepSeek 识图模式实测:推理深度超预期,数手指仍需优化
知乎博主发布DeepSeek识图模式深度测评,使用12张刁钻图片测试其能力边界。结果显示DeepSeek不仅能识别画面内容,还会追问上下文、推断事件性质,推理深度超预期。电影剧照、商品图、抽象图识别准确,但数手指测试仍出错,"爱心图"识别失败。整体来看,识图模式虽处灰测阶段,已展现出国产AI多模态能力的实质性突破。
Runway CEO:AI视频只是前传,世界模型才是下一个方向
Runway CEO在TechCrunch播客中表示,AI视频生成技术只是过渡阶段,真正的下一个方向是世界模型(World Models)。他认为当前的视频生成模型仍然是在"模拟"而非"理解"物理世界,只有建立真正的世界理解能力,AI才能从创意工具进化为通用智能的基础组件。Runway正加大世界模型研发投入。
Google Photos 推出 AI 功能:一键还原《独领风骚》经典衣橱场景
Google为Photos推出AI新功能,可一键将用户照片整理为经典电影《独领风骚》(Clueless)中的标志性虚拟衣橱效果。这是Google将生成式AI深度整合进消费端产品的最新案例,展示了AI在个人照片创作和娱乐化应用中的潜力。该功能基于Gemini视觉理解能力实现。
超级马里奥推理 AI 腾讯开源:腾讯开源具身多模态大模型 HY-Embodied-0.5-X
腾讯开源具身多模态大模型HY-Embodied-0.5-X,该模型专注于物理世界理解和机器人操控任务。开源信息显示,腾讯在具身智能领域正加速布局,结合此前在数字中国峰会上展示的WorkBuddy桌面智能体和SkillHub社区,腾讯的AI战略已从对话式AI全面扩展至具身智能和多模态Agent。
腾讯开源 HY-World 2.0 多模态世界模型:AI 从画图进化到造世界
腾讯开源 HY-World 2.0 多模态世界模型,AI 能力从 2D 图像生成跃升至 3D 世界构建。阿里同步开放 HappyOyster 内测,支持实时 3D 交互生成。多模态世界模型成为新竞争焦点。
爱奇艺 AI 艺人库争议升级:多位明星紧急辟谣
爱奇艺世界大会 CEO 龚宇提出「未来真人实拍或成非遗」并宣布超百位艺人入驻 AI 艺人库。张若昀、于和伟等多位艺人集体否认授权。「爱奇艺疯了」等十余个话题登上热搜。爱奇艺凌晨回应称未获授权绝不纳入。
ComfyUI 完成 $3000万融资,估值达 $5亿
开源 AI 工作流平台 ComfyUI 完成 $3000万融资,估值达 $5亿。平台用户超 400 万,日下载量 5 万次。创作者对 AI 生成媒体精细化控制需求的爆发推动了这一增长。
华为 AI 眼镜正式发布,AI 穿戴新战场开启
华为 AI 眼镜于 4 月 20 日正式发布。苹果在 AI 眼镜领域的布局也引发关注,AI 眼镜作为多模态交互的新载体,被视为后智能手机时代的重要终端形态。
科大讯飞 AstronClaw 升级:AI Agent 首次完整展示软硬一体架构
科大讯飞 AstronClaw 完成升级,AI Agent 首次完整展示软硬一体架构,将语音交互、视觉感知和物理操控能力融合在统一 Agent 框架中。。TII 发布 Falcon Perception,开放词汇指代表达分割模型,以及 0.3B OCR 模型(可媲美 3-10× 更大模型)。采用早期融合 Transformer 从第一层混合图像和文本。
ChatGPT 5.4 Pro 80 分钟解决 64 年数学难题 Erdős 1196
23 岁用户使用 ChatGPT 5.4 Pro 在约 80 分钟内解决了困扰数学界 64 年的 Erdős 1196 问题。陶哲轩确认证明有效。AI 的贡献在于用不同方式引导问题,而非追随专家的局部解法。
GLM-5V-Turbo:原生多模态融合的视觉编码模型
智谱发布 GLM-5V-Turbo,原生处理图像、视频、文档布局和设计稿,同时保持纯文本编码性能。归因于原生多模态融合、下一代 CogViT 编码器、30+ 任务协作 RL。
Sakana KAME:"边想边说"语音到语音架构
Sakana AI 提出 KAME, tandem "speak while thinking" 架构:低延迟前端模型 + 异步后端 LLM oracle 信号组合,实现语音到语音系统的实时思考和表达。
BioMysteryBench:Claude 解决约 30% 困惑专家的生物数据分析问题
Anthropic 发布 BioMysteryBench,报告近期 Claude 模型解决了约 30% 困惑人类专家的硬生物数据分析问题。AI for Science 的又一里程碑。
腾讯混元 Hy-MT1.5-1.8B-1.25bit:440MB 全离线翻译模型
腾讯混元开源 Hy-MT1.5-1.8B-1.25bit,仅 440MB,支持 33 种语言、1056 个翻译方向的全离线手机翻译。声称与商业 API 和 235B 级模型在标准 MT 基准上持平。
基于十数万次真实商用测试,Seedance 1.5 Pro、Google Veo 3.1、Sora 2、万相Wan 2.6、可灵Kling 2.6、Vidu Q2六大主流AI视频模型横评发布。市场日趋成熟和碎片化,各模型各有优劣和适用场景。
视频生成SeedanceVeo 3.1Sora 2横评
投融资
53 条
SpaceX与Cursor达成协议,获得以600亿美元收购的期权或支付100亿美元合作费用。Cursor ARR从2025年初10亿美元飙升至2026年初200亿美元,超过半数收入来自API调用。此交易标志着AI编程工具赛道正式进入巨头整合时代,VS Code生态面临严峻挑战。
NeoCognition获4000万美元种子轮:研发能跨域专业化的通用AI Agent
由俄勒冈州立大学研究人员创立的AI研究实验室NeoCognition获4000万美元超大规模种子轮融资,致力于开发能跨任意领域实现专业化的通用AI代理。与传统专业模型不同,其技术可在新领域快速达到专家水平。AI基础研究种子轮规模持续创历史新高。。AI 研究实验室 NeoCognition 走出隐身模式,完成 4000 万美元种子轮融资,Cambium Capital 和 Walden Catalyst 联合领投,英特尔 CEO Pat Gelsinger 参投。公司专注于构建能像人类一样学习的自学习 AI Agent,提升企业级 AI 可靠性。。在一周之内,Anthropic 先后获得 Amazon 最高 250 亿美元和 Google 最高 400 亿美元的投资承诺,合计 650 亿美元。Anthropic 2 月已融资 300 亿美元,当前估值 3500 亿美元。加上与 Broadcom 和 CoreWeave 的芯片协议以及 500 亿美元数据中心建设计划,Anthropic 正成为全球资金密度最高的 AI 公司。。在一周之内,Anthropic 先后获得 Amazon 最高 $250亿和 Google 最高 $400亿的投资承诺,合计 $650亿。当前估值 $3500亿,风投机构估值甚至高达 $8000亿。加上与 Broadcom 和 CoreWeave 的芯片协议以及 $500亿数据中心建设计划,Anthropic 正成为全球资金密度最高的 AI 公司。。Anthropic 年化收入 $300亿。Google 宣布最高 $400亿投资(估值 $3500亿),Amazon 追加最高 $250亿。风投估值甚至达 $8000亿。已与 Broadcom 和 CoreWeave 签署多年芯片协议,计划年底前获近 1GW 算力。。新研究揭示 Agentic 编码在 SWE-bench Verified 上消耗约 1000× 更多 Token(相比聊天/编码推理),且同一任务不同运行间 token 消耗可差 30×。更多花费并不单调提升准确率。
Anthropic获Amazon $50亿追加投资并承诺$1000亿AWS消费
Amazon向Anthropic追加50亿美元投资,并承诺1000亿美元AWS云消费。Anthropic ARR已超300亿美元,正探讨最早2026年10月IPO路径,当前估值超600亿美元。亚马逊的持续加码进一步巩固了其在AI领域的战略布局。。福布斯发布2026年AI 50强榜单,OpenAI与Anthropic两家合计融资2426亿美元,约占上榜企业总融资80%,头部资源高度集中。20家新成员上榜,制药、金融等垂直领域AI企业加速渗透,多家已启动IPO筹备。。SpaceX 已宣布与 AI 编程公司 Cursor 达成深度合作协议,获得 2026 年晚些时候以 600 亿美元价格收购后者的选择权,或支付 100 亿美元的深度合作费。Cursor 已成为 AI 编程领域估值最高的初创公司,背后有多家科技巨头争夺。此次合作将强化 SpaceX 和 xAI 在 AI 编程工具链的布局。。2026福布斯AI 50榜单显示OpenAI、Anthropic两家公司累计融资2426亿美元,约占榜单企业总融资额的近半。除两巨头外,xAI、Mistral、Cohere等也进入榜单,国产AI公司MiniMax、智谱AI首次跻身榜单前列。。加拿大 AI 公司 Cohere 与德国 Aleph Alpha 宣布合并,交易估值 $200亿。Schwarz Group 计划在 Cohere 即将到来的 Series E 轮投资 $6亿。Fortune 评论称这标志着 AI「中间强国」的崛起,形成对抗美中 AI 霸权的第三极。。AI 编程独角兽 Cursor 以 $500亿估值洽谈 $20亿+融资,a16z 领投。AI 芯片独角兽 Cerebras 同日提交 IPO 申请,挑战英伟达市场地位。Recursive Superintelligence 融资超 $5亿,估值 $27B,成立仅四个月刷新 AI 初创估值增速纪录。。LangSmith 报告基于 67 亿 Agent 运行数据,Azure 占 OpenAI 流量份额从 8% 升至 29%(10 周内),显示企业治理/合规驱动路由决策。。Aran Komatsuzaki 量化了非英语 Token 税,Anthropic 最重。扩展比较发现 Gemini 和 Qwen 是对非英语文本惩罚最轻的模型。Token 化经济学影响全球用户成本。
成都诞生一波千万富豪:具身智能和AI创业成财富新引擎
AI和具身智能创业热潮正在重塑中国城市财富格局。成都等新一线城市凭借人才优势和成本优势,成为AI创业热土,多个AI相关项目实现规模化退出,创业者和早期投资人批量实现千万级回报。
2026 Q1全球AI创业融资创纪录:$2970亿单季刷新历史
2026年第一季度全球AI融资总额达创纪录的2970亿美元,OpenAI募集1220亿美元、Anthropic 300亿美元、xAI 200亿美元、Waymo 160亿美元。四大交易占据史上最大五笔融资中的四席,顶级VC平均轮次大幅提前。。数据显示,2026 年 Q1 全球 AI 初创融资达 2748 亿美元,涉及 807 起融资事件,平均每天有近 9 起融资发生。单季融资额创历史纪录,OpenAI 单轮 1220 亿美元独占鳌头。Series B 轮平均融资额达 1.05 亿美元。。Crunchbase 数据显示,2026 年 Q1 全球风险投资达 2970 亿美元创历史纪录,同比增长 150%。其中 AI 初创企业吸纳 2390 亿美元,占总量的 81%。OpenAI 单轮 1220 亿美元独占鳌头,Series B 轮平均融资达 1.05 亿美元。。全球 AI 融资已连续四季度刷新纪录。Q1 2026 融资总额 2970 亿美元:OpenAI 募集 1220 亿美元、Anthropic 300 亿美元、xAI 200 亿美元、Waymo 160 亿美元,四笔交易合计占全球 Q1 风投总额的近 40%。AI 现在占全球风险投资的约 1/3,超过 1 亿美元的超大轮已成常态。。最新统计报告显示2026年第一季度全球AI初创融资达2748亿美元,807起事件,单季创历史新高。超大轮融资(10亿美元以上)共6起,主导了总金额的约70%。自主智能体赛道吸引最多新增资本,医疗AI和企业智能体两大方向融资量同比增长均超150%。。据市场数据,2026年Q1全球VC融资达$2970亿,其中80%流入AI赛道。OpenAI以$8520亿估值完成$1220亿融资,新晋独角兽70家。资本正从大模型基础层向应用层和Agent层扩散,医疗AI、AgentTech、AI安全和AI基础设施成为最活跃的四大赛道。。Crunchbase 数据显示,2026 年 Q1 全球风险投资达 $2970亿创历史纪录,同比增长 150%。其中 AI 初创企业吸纳 $2390亿,占总量的 81%。OpenAI 单轮 $1220亿独占鳌头,Series B 轮平均融资达 $1.05亿。
AI创业融资报告:流入$1300亿但倒闭公司数量超过去三年总和
AI创业呈现冰火两重天:1300亿美元涌入AI初创公司创历史新高,但同时更多AI公司今年倒闭的数量比过去三年加起来还多。最大几轮融资规模愈发庞大,最小创业公司被加速淘汰,行业马太效应加剧。。$1300亿涌入 AI 初创公司创历史新高,但同时更多 AI 公司今年倒闭数量超过去三年总和。行业马太效应加剧,从价格战转向价值竞争。
4月23日,腾讯与阿里正式启动对DeepSeek的投资意向沟通,本轮估值提升至逾200亿美元(部分消息源显示融前估值达440亿美元),这是DeepSeek的首次外部融资。。据多家媒体报道,腾讯和阿里正就以逾 200 亿美元(约 1460 亿人民币)估值向 DeepSeek 投资进行谈判,具体交割时间和金额尚未确定。若成功,DeepSeek 将成为中国估值最高的 AI 初创公司之一,超越月之暗面(180 亿美元)。DeepSeek 创始人梁文锋态度相对保守,倾向于维持自主控制权。。DeepSeek 正寻求至少 $3亿的首轮外部融资,估值从 $100亿一路飙升至约 $440亿(约 3000 亿人民币)。国资背景消息人士称「根本投不进去」,腾讯与阿里正处于初步洽谈阶段。资金主要用于 V4 模型训练和算力扩张。
Anthropic估值破万亿美元,企业市场份额32%领跑行业
Anthropic历史性突破万亿美元估值,在企业AI市场份额(32%)超越OpenAI(25%)和Google(20%),背后是亚马逊50亿美元投资和Claude Code爆发式增长。
贝索斯主导的Prometheus物理AI实验室即将完成100亿美元融资,专注机器人、工业自动化和物理仿真,是继OpenAI后最大规模AI单笔融资之一。。贝索斯主导的 Prometheus 物理 AI 实验室即将完成 $100亿融资,专注机器人、工业自动化和物理仿真领域,是继 OpenAI 后最大规模 AI 单笔融资之一。
普渡机器人近10亿元融资完成,服务机器人头部企业估值破百亿
普渡机器人完成近10亿元融资,估值突破百亿元,投资方包括国家级基金、产业龙头和地方国资联合加持。
原本计划完成20亿美元融资的AI代码编辑器Cursor被SpaceX抛出的600亿美元收购要约打断,凸显顶级AI编程工具的战略价值。
OpenAI与Infosys合作,将AI工具带给数十万企业客户
OpenAI宣布与印度IT巨头Infosys达成合作,将ChatGPT企业版和API工具带给Infosys数十万企业客户,AI工具通过系统集成商渠道加速渗透传统企业。
AI融资报告:4月AI初创公司融资额突破$314亿,Series B平均1.05亿美元
2026年4月AI初创公司融资额突破314亿美元,Series B轮平均融资额达1.05亿美元创历史新高,共完成1394笔投资,资金主要流向企业AI、机器人和安全领域。
奥明星程完成超亿元 A 轮融资:三位哈佛博士联手打造 AI4S 基建
AI for Science 公司奥明星程完成超亿元 A 轮战略融资,由深创投与复星医药(复健资本)联合领投。三位哈佛博士创立,构建基于大模型的个体健康趋势预测及疾病干预系统,已与超 50 家三甲医院及百余家体检机构合作。一年内融资规模超 5 倍增长。
ERA 融资 1100 万美元:构建 AI 小工具软件平台
初创公司 ERA 完成 1100 万美元融资,用于构建面向 AI 小工具(AI Gadgets)的软件平台。随着 AI 硬件设备越来越多,统一的管理和开发平台需求日益迫切。
Sierra 收购 YC 背景的 AI 初创 Fragment
Bret Taylor 创办的 AI 公司 Sierra 收购了 Y Combinator 支持的 AI 初创公司 Fragment。Sierra 致力于为企业提供 AI 客户服务解决方案,此次收购将进一步增强其技术实力。
Buzzy 完成 2000 万美元融资:AI 视频编辑赛道持续火热
AI 视频编辑公司 Buzzy 完成 2000 万美元融资,ARR 同为 2000 万美元。当 AI 生成视频技术足够成熟后,应用层的机会集中在内容生成之前和内容生成之后两个环节。
Anthropic 从初创到 8000 亿美元估值的估值狂飙之路
Anthropic 的估值在过去一年经历了火箭式增长:从 2024 年约 200 亿美元到 2025 年底约 600 亿美元,2026 年 2 月融资轮估值 3800 亿美元,Google 投资估值 3500 亿美元,部分风投机构甚至给出 8000 亿美元估值。年化收入从约 90 亿美元暴增至 300 亿美元。。Anthropic正与投资者洽谈以$8500-9000亿估值融资约$500亿,这将是AI行业史上最大单轮融资。公司年化收入已从2025年底的$90亿飙升至近$400亿,增长超4倍。若完成,Anthropic将超越OpenAI的$8520亿估值。董事会预计5月做最终决定,市场认为这可能是IPO前的最后一轮私募。此前Amazon承诺投资$250亿,Google承诺$400亿。
工业智能体赛道持续升温:2026 年国内工业 AI 融资总额超 50 亿元
继智用开物完成近亿元融资后,工业 AI 赛道本周融资热度持续。据不完全统计,2026 年国内工业 AI 领域已完成融资超 50 亿元,主要集中在:工业检测(视觉质检)、工厂排产优化(AI 排产员)、工业机器人编程(无需示教)三大方向。立讯精密、比亚迪等制造业龙头成为工业 AI 标杆客户。
科大讯飞、字节跳动参展广东 AI 应用大会,AI+行业落地加速
2026 广东省人工智能应用对接大会今日在深圳举行,科大讯飞、字节跳动、京东方、美的、云天励飞等企业集中展示"人工智能+"典型应用。深圳 AI 核心产业营收达 2200 亿元,规上企业超 2600 家,累计发布 5 批近 300 个"城市+AI"应用场景清单。
Intel Q1 2026 营收增长 7%,AI 需求拉动 CPU 与封装业务
Intel Q1 2026 财报数据:营收同比增长约 7%,主要由 AI 服务器需求带动 CPU 及先进封装(CoWoS)业务增长。Intel 18A 制程进展有所加快,Foundry 业务已获数家 AI 芯片初创公司订单。分析师指出,Intel 在 AI 竞赛中的基础底盘角色仍不可忽视,尽管市场份额持续向 NVIDIA 转移。
英国AI实验室Ineffable Intelligence从隐身状态宣布获得11亿美元种子融资,估值51亿美元,是史上最大种子轮融资记录。由AlphaGo之父、前DeepMind首席研究员David Silver创立,目标是构建不依赖人类生成数据进行自主学习的AI系统,投资方包括英伟达和Google。
谷歌豪掷400亿美元投资Anthropic,含TPU计算资源
谷歌与Anthropic签署史上最大AI投资协议,总额高达400亿美元,其中包含大量Google TPU计算资源,是自2019年微软首次投资OpenAI以来行业最大的单笔AI投资。协议同步要求Anthropic优先使用Google Cloud基础设施,进一步巩固Anthropic与谷歌的深度绑定。
AI商业模式之困:炒作到利润之间缺失的"第二阶段"
MIT Technology Review深度分析指出当前AI行业面临关键商业化挑战:第一阶段(研发炒作)已完成,第三阶段(规模盈利)尚未到达,关键的"第二阶段"(可持续变现机制)仍不清晰。多家AI公司仍处于烧钱换增长模式,订阅和API收费尚未覆盖研发成本。
DeepSeek首次对外融资:100亿美元估值,至少3亿美元
DeepSeek首次接受外部融资,估值定在100亿美元,募资规模至少3亿美元,为此前多次拒绝一线机构后的首次例外。此轮融资被业内视为信号事件,标志着DeepSeek从纯技术驱动转向更主动的商业化布局,将加速国际市场开拓与基础设施建设。
Skye AI主屏幕应用上线前融资,重塑手机交互界面
AI感知iPhone主屏幕应用Skye在正式上线前已完成融资,是2026年消费级AI个性化领域的重要新玩家。投资者认为其有望成为手机AI化演进的新入口,与苹果Apple Intelligence形成互补或竞争关系,代表了消费侧AI应用的新方向。
前Twitter CEO帕拉格·阿格拉瓦尔创立的AI搜索基础设施公司Parallel Web Systems完成1亿美元B轮融资,由红杉资本领投,凯鹏华盈、Index Ventures跟投,公司估值达20亿美元。Parallel为AI Agent提供网页搜索工具,定位为"AI时代的并行网络"。
Manifest OS获$6000万融资,估值$7.5亿,打造全球首个AI原生律所
法律AI初创公司Manifest OS完成6000万美元融资,估值达7.5亿美元。公司定位为全球首个AI原生律所模型,整合合同审查、诉讼分析、法律研究等核心业务,旨在用AI重构法律服务行业的底层基础设施。
礼来与AI生物技术公司Profluent达成$22.5亿协议,开发AI设计基因疗法
礼来制药与AI生物技术公司Profluent达成22.5亿美元协议,共同开发AI设计的基因编辑疗法。Profluent利用AI生成全新蛋白质序列,突破传统天然蛋白质的功能限制,此次合作是2026年最大的AI生物医药商业化交易之一。
花旗:全球AI市场预测从$3.5万亿上调至$4.2万亿
花旗集团将全球AI市场规模预测从3.5万亿美元上调至4.2万亿美元,主要理由是企业AI采用速度超预期加快。报告指出AI基础设施、应用层和服务层均呈现超预期增长,预计2027年将进入更快扩张周期。
2026年新AI实验室获投$188亿,顶级研究员大规模离职创业
CNBC报道,2026年以来顶级AI研究员大规模从Meta、Google、OpenAI离职创办新实验室,这些新机构已累计获得188亿美元投资。现象背后是AI基础研究的重心正在从大公司向专注特定方向的独立实验室转移,Ineffable Intelligence等机构领跑这一浪潮。
Spotify Q1:AI DJ近9400万用户,AI支出激增致股价跌11%
Spotify发布2026年Q1财报:AI DJ功能用户接近9400万,Song DNA功能上线4周已达5200万用户。但由于AI支出大幅增加,投资者担忧盈利能力,Spotify股价单日下跌11%。财报揭示了流媒体平台押注AI的短期盈利压力与长期用户增长红利的深层矛盾。
Shapes App 融资 $800万种子轮:AI社交新范式
让人类和AI角色在同一群聊中协作的Shapes App获Lightspeed领投$800万种子轮。月活超40万(年增长6倍),用户已创建300万个AI角色。核心创新在于将AI从一对一对话模式引入群聊场景,解决"AI精神病"问题。每日数千用户花费2-4小时在应用中,展示出强大的用户粘性。
Scout AI $1亿 A轮:国防 AI 赛道最大单笔融资之一
国防AI初创Scout AI完成$1亿超额认购A轮,由Align Ventures领投。公司致力于为自主军事行动开发基础模型,已建立加州训练基地。资金将用于扩大无人地面车辆测试和模型训练,标志着国防AI领域资本投入的显著加速。
Big Tech AI投资汇总:2026年Q1 四巨头资本支出 $650B
Amazon、Microsoft、Alphabet、Meta 2026年AI基础设施投资合计达$6500亿,创历史纪录。其中Alphabet最高$1900亿,Meta $1250-1450亿,Amazon和Microsoft分别数百亿。四家云业务均超预期增长,但巨额支出引发市场对回报周期的担忧。Nvidia作为底层算力供应商成为最大受益者之一。
SpaceX $600亿锁定 Cursor 收购权
SpaceX 与 Cursor 达成协议,获得以 $600亿收购的期权或支付 $100亿合作费用。Cursor ARR 从 2025 年初 $10亿飙升至 $200亿。AI 编程工具市场进入巨头整合时代。
Meta 宣布裁员 10%:约 8000 名员工
Meta 宣布将裁减约 10% 的员工(约 8000 人),以提高运营效率。Meta 还表示将记录员工按键操作用于训练 AI 模型,引发隐私争议。HN 521 分。
甲骨文全球裁员 30000 人:为 $560亿 AI 数据中心计划融资
甲骨文 3 月裁员约 30000 人(占员工总数 18%),是公司 48 年历史上最大规模裁员。此举旨在为 $560亿的 AI 数据中心扩张计划融资。一封五行邮件在清晨 6 点通知员工被裁。
字节跳动 2025 年净利润缩水超 70%:AI 投入是主因
因大幅增加 AI 业务投入,字节跳动 2025 年净利润同比下滑超 70%。但海外业务表现强劲,营收增长近 50%,占比提升至三成以上。AI 投入短期拖累利润但长期战略清晰。
沃伦警告:AI 公司债务堆积可能引发下一场金融危机
美国参议员 Elizabeth Warren 警告 AI 公司正在快速堆积大量债务,规模和速度可能引发系统性金融风险。
Mistral 估值近千亿:欧洲 AI 还能抢救一下?
法国 AI 公司 Mistral 估值接近千亿元人民币,成为欧洲 AI 赛道最具价值的企业之一。在全球 AI 融资屡创新高的背景下,欧洲 AI 企业能否保持独立和技术领先成为焦点。
Allbirds 转型 AI 计算变身 NewBird AI,股价暴涨 400%
鞋类品牌 Allbirds 宣布转型 AI 计算领域,更名为 NewBird AI,股价应声暴涨 400%,成为传统企业 All-in AI 的典型案例。
英国计划打造主权 AI:仅用 OpenAI 市值 0.08% 资金
英国宣布主权 AI 计划,投入 6.75 亿英镑(约 OpenAI 市值 0.08%)挑战 AI 巨头,目标是建立国家级 AI 基础设施和模型能力。
OpenAI 完成 $1220亿融资,估值 $8520亿
OpenAI 完成 $1220 亿融资,投后估值 $8520 亿。ChatGPT 9 亿周活用户,月收入 $20 亿。与 Amazon、NVIDIA、Microsoft 的战略合作推动 AI 基础设施建设。
GitHub Copilot 转用量计费 + Claude 9× 涨价重塑 AI 编码经济
GitHub Copilot 6 月起转用量计费,Claude 模型定价 9× 上调。Agentic 工作流消耗量是聊天的 1000×,但更多花费不等于更好准确率。AI 编码 Agent 的经济学模型正在重构。
DeepSeek V4 Pro 定价 $1.74/M vs GPT-5.5 $5/M:开源模型价格战白热化
DeepSeek V4 Pro 输入定价 $1.74/百万 Token(GPT-5.5 和 Opus 4.7 均为 $5),1.6T 参数、1M 上下文、SWE-bench 80%+。缓存 token 让上下文使用近乎免费。开源模型竞争力迫使闭源重新评估定价策略。
开源模型价格压力持续加剧
Qwen 3.5 Plus $3/M 输出 token,MiMo-V2.5 Pro $1/$3 每百万 token 在 Code Arena 重塑 Pareto 前沿。Aidan Gomez 论证私有部署的意义在于控制模型=控制成本。开源模型价格瀑布式下跌。
Google Q1 财报:Cloud +63% YoY,Gemini 势头强劲
Google Q1 财报显示 Cloud 收入同比增长 63%,Gemini 动能强劲,搜索查询量创历史新高。"AI 变现"论据的重要数据点。
开放权重竞争压力加剧:Aidan Gomez 论私有部署
Cohere CEO Aidan Gomez 论证私有部署的意义:控制模型=控制成本。社区认为 Haiku/Flash 级工作负载应重新评估开源替代(DeepSeek、Minimax、GLM、Nemotron),价格差距和质量提升使切换可行。
闭源模型依赖被重新定义为运营风险
Gergely Orosz 将 Anthropic 近期的静默变更和影响客户的行为总结为闭源模型是"巨大风险"。Zach Mueller 记录了 Claude 4.7 编码工作流的退化并最终切换。闭源模型的可靠性正在被重新审视。
Sam Altman 住宅遭二次袭击:燃烧瓶 + 驾车枪击
Sam Altman 旧金山住宅在数小时内遭两起袭击:燃烧瓶和驾车枪击。两名嫌疑人被捕。引发对科技高管安全问题的广泛讨论。
2026年4月风险投资共1314笔融资公告,其中58%为AI相关,Series A轮趋势显著。AI持续占据资本配置的核心位置,创始人在融资和战略选择上呈现明确分化。
VC融资AI超级周期
Anthropic宣布年化收入突破300亿美元,正式超过OpenAI的约250亿美元。训练成本仅OpenAI的四分之一。谷歌随即宣布拟向Anthropic投资最高400亿美元。OpenAI营收增速放缓,背负6000亿美元未来支出承诺,IPO年内存变数。
Anthropic300亿超越OpenAI营收
行业
81 条
苹果正式宣布Tim Cook将出任执行董事长,硬件工程高级副总裁John Ternus将于2026年9月1日接任CEO。Ternus是Apple Silicon核心主导者,其接棒信号明确:苹果将在AI时代押注端侧AI芯片战略。同时Johny Srouji被任命为首席硬件官。市值4万亿帝国进入新篇章。。独家报道:Google 通过一项新的数十亿美元交易加深了与 Thinking Machines Lab 的联系。该实验室由前 Google 研究员创办,专注于 AI 安全和可解释性研究。。苹果宣布 Tim Cook 将出任执行董事长,硬件工程负责人 John Ternus 将于 2026 年 9 月 1 日接任 CEO。Ternus 是 Apple Silicon 核心主导者,接棒信号明确:苹果将押注端侧 AI 芯片战略。
Google Maps将迎来AI大升级:Google Cloud Next 2026多项企业级AI发布
Google宣布Google Maps将获得大量AI功能升级。同时Google Cloud Next 2026大会在拉斯维加斯开幕,发布多项企业级AI创新:Gemini Enterprise Agent Platform、第八代TPU、OCS内存池化等。Google全面推进企业AI落地。。Sundar Pichai 在 Cloud Next 上披露,Google 内部 75% 的新代码由 AI 生成,Claude Code 已在 Google DeepMind 内部被广泛采用。但洛杉矶时报报道 Google 内部 AI 编程工具碎片化正在失去竞争优势。。IKP 研究:1400 问题/188 模型/27 厂商的事实知识准确率显示与模型大小强对数线性信号(R²=0.917,135M 到 1.6T)。论证事实知识容量不会随时间"压缩",并用拟合曲线估计闭源模型大小。
OpenAI与Infosys合作将AI工具带给更多企业:400万周活用户的Codex加速企业化
OpenAI与印度IT巨头Infosys达成合作,将AI工具带给更多企业客户。Codex周活跃用户已达400万,企业版支持全套代码库分析和自主修复。AI编程工具从个人赛道正式迈入企业大规模改造阶段。
马斯克百亿锁定Cursor:博的是IPO那1.75万亿
分析认为SpaceX锁定Cursor并非单纯的AI工具收购,而是马斯克企业集团IPO战略的关键一环。SpaceX目标估值1.75万亿美元,计划6-7月纳斯达克上市。Cursor技术预计将深度整合进xAI工具套件,形成AI编程生态闭环。
美国AI反弹加剧:选举临近,数据中心被抗议,AI高管遭敌对声浪
随着美国中期选举临近,公众对AI的情绪显著恶化。多个社区组织起来反对AI数据中心建设,以耗水、噪音、电力为由阻止项目落地。社交媒体上对AI公司高管的敌意日益增加,围绕就业替代和能源消耗的讨论愈演愈烈。
ChatGPT广告价格三月腰斩:OpenAI正在学习如何卖广告
ChatGPT商业化3个月后,广告CPM价格较初期下跌超50%。分析认为这不代表失败,而是OpenAI正在快速学习广告定价机制——从自己定价到让市场决定的必然过程。广告业务预计2026年贡献超10亿美元营收。
Gallup民调:Z世代AI使用率上升但兴奋度从36%降至22%
Gallup最新民调显示Z世代AI使用率持续上升,但对AI的兴奋度从36%降至22%。年轻一代对AI从新奇转向实用主义,AI产品需要证明其真实价值而非概念吸引力。这对AI行业的产品设计方向提出了新要求。
Google在Cloud Next '26正式宣布进入『智能体企业时代』,整合Vertex AI为Gemini Enterprise。企业AI市场从2023年17亿美元飙升至370亿美元,Anthropic(32%)、OpenAI(25%)、Google(20%)三足鼎立。
特斯拉Q1财报超预期:营收223.87亿美元同比增长16%创近三年新高,净利润4.77亿美元,自由现金流14亿美元意外转正,战略重心明确向AI和机器人转移。
Sundar Pichai在Cloud Next上披露,Google内部75%的新代码由AI生成,Claude Code已在Google DeepMind内部被广泛采用,成为AI编程工具渗透率的里程碑指标。
《洛杉矶时报》报道揭示Google内部AI编程工具碎片化:多团队各自为战、整合度低,正在失去对Anthropic(Claude Code)和OpenAI(Codex)的竞争优势。
Anthropic Claude Mythos遭疑似非法访问,CISA被排除首批使用名单
美国网络安全协调机构CISA据报道未被纳入Anthropic Claude Mythos首批使用名单,同期有报道称Mythos Preview遭到疑似非法访问,AI安全模型的安全性受到质疑。。Reddit 热帖(4149 活跃度)指出 Claude、ChatGPT、Gemini、Perplexity 等消费级 LLM 质量普遍下降。Claude 分析能力减弱、ChatGPT 过度热情、Gemini 幻觉严重。高质量 LLM 访问可能需要企业级投资。
Accenture与Google Cloud扩大合作,共同推动全球企业智能体转型
Accenture和Google Cloud在Cloud Next '26上宣布扩大合作,基于Gemini Enterprise平台为全球企业客户提供AI智能体转型服务。
福布斯2026年AI 50榜单发布:OpenAI、Anthropic领衔,20家新上榜
福布斯发布第八届AI 50全球最具潜力非上市AI企业榜单,本届20家新上榜,OpenAI、Anthropic累计融资2426亿美元,约占今年AI 50总融资额半数以上,头部集中效应显著。
美国参议员Elizabeth Warren警告AI公司正在快速堆积大量债务,规模和速度可能引发系统性金融风险,在AI领域单季度融资突破300亿美元的背景下引发监管层广泛讨论。
Meta 宣布裁员 10%:约 8000 名员工
Meta 宣布将裁减约 10% 的员工(约 8000 人),以提高运营效率。Meta 还表示将记录员工按键操作用于训练 AI 模型,引发隐私争议。HN 帖子获 521 分和 496 条评论。
甲骨文全球裁员 30000 人:为 560 亿美元 AI 数据中心计划融资
甲骨文 3 月裁员约 30000 人(占员工总数 18%),是公司 48 年历史上最大规模裁员。此举旨在为 560 亿美元的 AI 数据中心扩张计划融资。一封五行邮件在清晨 6 点通知员工被裁,引发广泛关注。
OpenAI 与 Infosys 合作,将 AI 工具推广到更多企业
OpenAI 与印度 IT 巨头 Infosys 达成合作,共同将 AI 工具推广给更多企业客户。这是 OpenAI 企业化扩张的重要一步,借助 Infosys 的全球客户网络加速 AI 在传统行业的渗透。。Microsoft CEO Satya Nadella在Q1财报会上表示,微软已准备好"exploit"与OpenAI重构后的合作关系。在结束独家云协议后,OpenAI产品仍将首发Azure,但微软同时获得更多收入分成。Nadella强调Copilot 2000万付费用户的使用活跃度超出预期,AI工具已深度嵌入企业工作流,微软将从"唯一平台"叙事转向"首选平台"。
Bitwarden CLI 在供应链攻击中被植入恶意代码
密码管理器 Bitwarden 的 CLI 工具在持续的 Checkmarx 供应链攻击中被植入恶意代码。HN 帖子获 709 分,引发开源软件供应链安全问题的广泛讨论。
X 推出 AI 驱动的自定义信息流
X(原 Twitter)推出由 AI 驱动的新自定义信息流功能,可根据用户兴趣自动筛选和排序内容。TechCrunch 上手体验后认为,这是社交平台全面 AI 化的最新案例。
Google Workspace 大更新:AI 成为办公室新实习生
Google 全面更新 Workspace 办公套件,将 AI 深度整合进 Gmail、Docs 等核心产品。AI 概览功能进入 Gmail 工作场景,Google Maps 也即将迎来大规模 AI 功能整合。
Mythos 遭未经授权访问:Anthropic 专有网络工具有关
报道称一个未经授权的组织已获取 Anthropic 专有 AI 网络工具 Mythos 的访问权限。HN 上有开发者测试 Mythos 在 Firefox 上的表现后认为『炒作过多』。Anthropic 对此事件尚未正式回应。
NoScroll:一个替你刷手机负面新闻的 AI 机器人
TechCrunch 介绍了一款名为 NoScroll 的 AI 机器人,可以代替用户进行『末日刷屏』——自动浏览和筛选负面新闻。这款产品反映了 AI 在信息消费领域的创意应用。
AI 药物发现新突破:如何从海量 AI 生成分子中筛选真正有价值的
AI 正在生成比以往更多的潜在药物分子,但如何从中筛选出真正有临床价值的候选药物成为新挑战。TechCrunch 报道了一家初创公司正在解决这个问题,AI 药物发现从『生成』进入『筛选』阶段。
一年烧掉 1850 亿美元的 AI 行业:智能体时代的操作系统之争
极客公园深度分析指出,AI 行业一年烧掉 1850 亿美元,Google、OpenAI、Anthropic 等巨头都在争夺智能体时代操作系统的位置。企业 Agent、编排工具和基础设施成为新的竞争焦点。。极客公园深度分析指出,AI 行业一年烧掉 $1850亿,Google、OpenAI、Anthropic 等巨头都在争夺智能体时代操作系统的位置。企业 Agent、编排工具和基础设施成为新的竞争焦点。
2026 北京车展:汽车行业被 AI 重新定义的转折点
2026 北京车展集中呈现汽车行业电动化格局定型、智能化加速落地的关键转折。乘联会崔东树指出展会呈现「格局重塑、技术突围、路径分化、配置内卷」四大特征。腾讯汤道生直言「汽车产业竞争正在被 AI 重新定义」。从 L3 自动驾驶规模化商用到车载 AI 智能体量产,AI 正从辅助工具跃升为汽车的核心竞争力。
AI 对软件行业的颠覆:Claude Code 引发全球软件股抛售
Anthropic 的 Claude Code 和 Cowork 代理插件展示出 AI 直接替代软件工程工作的能力,今年早些时候的发布曾引发全球软件股抛售。随着 ml-intern、free-claude-code 等开源工具持续涌现,AI 对软件行业的就业冲击正从讨论走向现实。。Claude Code 和 Cowork 展示出 AI 直接替代软件工程工作的能力,曾引发全球软件股抛售。随着 ml-intern、free-claude-code 等开源工具持续涌现,AI 对软件行业的就业冲击正从讨论走向现实。
SDL 新增 DOS 支持:复古平台的生命力
开源多媒体库 SDL 在最新 Pull Request 中新增 DOS 系统支持。HN 帖子获 220 分、77 条评论。在 AI 时代,开发者社区对底层系统和经典平台的兴趣不减反增。
MacBook Neo 和 iPad 的未来之争
Craig Mod 撰文探讨 MacBook Neo 和 iPad 的产品定位,HN 帖子获 202 分。在 AI 驱动的设备范式变革背景下,个人计算设备的形态和交互方式正面临重新定义。
AI 诊断首次纳入中国国家医保
中国国务院发文力挺大模型采购,AI 诊断首次纳入国家医保。政策层面从鼓励创新走向实际支付体系整合,标志着 AI 在医疗领域的商业化进入新阶段。
深圳 AI 产业大会:核心营收 2200 亿,规上企业超 2600 家
2026 广东省人工智能应用对接大会在深圳举行,大会以"智联千行、赋能百业"为主题。深圳正从算力底座、大模型算法到场景落地构建完整产业生态:华为"盘古"、腾讯"混元"、鹏城"脑海"三大自主模型;越疆机器人、优艾智合具身智能实际部署;南山"模力营"生态社区聚集近 200 家创新主体,估值超 200 亿元。
谷歌 75% 代码由 AI 生成,AI 编程正式进入"生产主力"阶段
Google CEO Sundar Pichai 在最新声明中表示,谷歌内部约 75% 的新增代码现在由 AI 生成,且大部分代码可直接提交生产。这一比例在一年前不到 25%,折射出 AI 编程从"辅助工具"到"生产主力"的历史性跃迁。Anthropic 旗下 Claude Code 和 OpenAI Codex 是目前企业级 AI 编程的两大主流选项。
Apple Music:AI 音乐投稿泛滥,几乎没人听
Apple Music 副总裁 Oliver Schusser 表示,AI 生成音乐在平台上的投稿数量急剧增加,但收听率极低,"几乎没有人在听"。这一现象引发了关于 AI 内容泛滥与真实用户需求脱节的广泛讨论。Spotify 和 YouTube Music 也面临同样困境,平台开始研究 AI 内容标注和推荐降权机制。
程序员删除公司 AI 训练数据获刑五年十个月,数据安全敲响警钟
某公司程序员因删除公司 AI 训练数据、侵占公司资金并收受贿赂,被判处有期徒刑五年十个月。此案成为国内首批因 AI 训练数据安全引发的刑事案例之一,引发广泛讨论。AI 训练数据被正式纳入企业核心资产范畴,相关法律保护体系亟待完善。
抖音下架 AI 侵权视频超 53.8 万条,AI 内容监管标准趋严
抖音宣布持续整治 AI 不当内容,截至目前已下架 AI 侵权视频超 53.8 万条,涉及无授权声音克隆、AI 换脸欺诈、虚假新闻生成等类别。央视同期曝光 AI 盗声问题:仅需 1 秒个人音频即可克隆声音,配音演员群体生存空间受到严重挤压。
2026 年 AI 行业周回顾:梁文锋与杨植麟的"隔空握手"
本周 AI 行业以 Kimi K2.6 发布开篇,以 DeepSeek V4 全量上线收尾。分析人士指出,梁文锋(DeepSeek)与杨植麟(月之暗面)的技术路径代表了国产 AI 的两种范式:一个追求极限成本效率(V4 推理算力降至 27%),一个追求能力边界与 Agent 生态(K2.6 多 Agent 并发)。两者短期内难以正面交锋,但将共同重塑全球 AI 生态格局。
AI 在医疗行业全面渗透:深圳三甲医院 AI 辅助诊断落地
深圳多家三甲医院已正式部署 AI 大模型辅助诊断系统,主要用于疑难病例分析和肿瘤早期筛查,准确率显著提升。深圳法院也上线 AI 辅助审判系统,辅助案件材料梳理和裁判文书起草。政务服务方面,深圳目标 2027 年实现重点场景智能化覆盖率 100%。
马斯克与OpenAI的长期法律战在北加利福尼亚进入陪审团遴选阶段,马斯克索赔1340亿美元,指控奥特曼违背OpenAI成立时的非营利承诺。案件正值OpenAI IPO筹备阶段,若马斯克胜诉可能从根本上改变公司结构,法律结果将深刻影响AI行业治理格局。
OpenAI与微软协议重构:AGI条款正式移除,关系走向独立
微软与OpenAI修订协议移除了此前管辖双方合作的"人工通用智能"(AGI)条款,双方关系被描述为更加灵活但保持距离。此举被解读为OpenAI IPO前的法律清场,也表明微软认为AGI短期内无法实现,不再通过合同条款锁定潜在利益。
企业AI应用指数:79%已落地,金融法律研发领跑
香港大学与德勤中国联合发布2026企业AI应用指数,79%受访企业已完成AI Agent至少一个场景落地,金融、法律、研发为进展最快的三大行业。主要障碍集中于数据合规(61%)、模型幻觉(54%)和集成复杂度(49%)三方面。
LLM行为漂移:生成式AI随机性打破传统单元测试方法
微软研究员在VentureBeat撰文指出生成式AI的随机性和不可预测性打破了传统的单元测试范式。LLM行为漂移问题在生产环境中普遍存在,提出需要构建"概率性测试"框架,通过多次采样和统计分析替代二元通过/失败判断。
AI"静默失败"现象:企业部署最昂贵的失败不报错
VentureBeat报道企业AI部署中最昂贵的失败来自"静默失败"——系统正常运行但持续自信地给出错误结果,不产生报错信息。这一问题在医疗AI、法律AI和金融AI场景中危害最大,推动行业转向构建AI系统的"可信度仪表盘"和异常检测机制。
2026 AI合成受众技术:72%准确率对行为建模,颠覆咨询行业
WPP高管在VentureBeat撰文称AI合成受众技术已能以72%准确率对特定人口统计群体的行为进行建模,将颠覆传统市场调研和咨询行业。该技术仅凭年龄、社区和性别等基本信息即可模拟消费者反应,大幅降低新产品测试成本。
AI模型幻觉问题报告:73%企业在生产中遭遇重大幻觉事件
行业调研显示73%企业在生产环境中经历过重大LLM幻觉事件,其中医疗和法律场景损失最大。推理型模型(o4-mini、QwQ-32B等)幻觉率显著低于通用对话模型,推动企业加速迁移至推理优先架构。
《时代》杂志公布2026年十大最具影响力AI公司,字节跳动居首,阿里巴巴、智谱AI同时入榜,中国企业占据三席。榜单不以模型性能为唯一标准,着重考察对行业的综合塑造力。OpenAI、谷歌母公司Alphabet同样入选,中美AI竞争格局清晰呈现。
Google与五角大楼签署机密AI协议,员工抗议再起
Google无视内部员工抗议,与美国国防部签署机密AI合作协议,引发第二波抗议浪潮。员工联署公开信要求公司披露协议范围、撤出军事AI项目,管理层以保密协议为由拒绝详细说明。Google AI应用于军事领域的伦理争议持续发酵。
佛罗里达州否决AI权利法案,美国AI监管碎片化加剧
佛罗里达州议长在特别会议上否决了州长德桑蒂斯推动的AI权利法案,成为该法案首次正式遭否。批评者认为该法案将对AI创新设置过度障碍;支持者则强调公民AI保护权利的迫切性。此次否决加剧了美国各州AI立法路径的碎片化分歧。
欧盟AI法案僵局:各方寻求豁免,谈判陷入泥潭
欧盟各国代表与立法者就削弱AI法案达成僵局,多方寻求为已受监管行业争取豁免条款,导致法案谈判进程严重延滞。分析人士担忧,若豁免范围扩大,AI法案的实际约束力将大打折扣,欧盟AI治理框架面临被架空风险。
Google CEO:75%新代码由AI生成,工程师批准后上线
Google CEO Sundar Pichai在Techmeme采访中透露,Google目前已有75%的新代码由AI生成,工程师审阅批准后直接上线。这一数据被业界视为"软件工程师大规模AI替代"已实质性开始的重要信号,引发广泛的就业影响讨论。
Meta将于5月20日裁员8000人,AI重组第一波正式启动
Meta确认将于5月20日启动全公司AI重组的第一波裁员,涉及8000个工作岗位,主要集中在可被AI替代的重复性岗位。扎克伯格在内部备忘录中将此定性为"把更多资源集中在AI使命上的必要调整",AI驱动的科技业大规模人员优化正在加速。
4月国内大模型"日更"节奏:月之暗面、阿里、腾讯、DeepSeek密集更新
经济观察网梳理,4月以来国内大模型进入"日更"节奏,月之暗面(Kimi)、阿里(Qwen)、腾讯混元、DeepSeek相继发布或更新模型,行业竞争白热化。声网研报指出:模型能力的差距正在收窄,产品生态、推理成本和开发者体验将成为下一阶段竞争核心。
腾讯多款 Agent 智能体亮相数字中国峰会,混元 Hy3 首秀
数字中国峰会上,腾讯展示WorkBuddy桌面智能体工作台和AI Skills社区SkillHub,可一句话生成可验收结果。混元Hy3 preview语言模型迎来展会首秀,具备强大推理和多模态能力。腾讯已将文档、会议、地图、ima、QQ浏览器等核心产品能力封装为官方Skills,副总裁韩开创表示AI正从"对话"到"执行"范式跃迁。
数字中国峰会:AI赋能实体经济,从"流量驱动"到"词元驱动"
第九届数字中国建设峰会进入第二天,新华网报道峰会聚焦AI深度赋能千行百业。中国移动人工智能生态大会上,郑庆华院士指出AI赋能关键在于突破"难、险、脏、繁、杂、情"等典型场景。国家数据局局长刘烈宏表示,日均词元调用量两年增长超千倍,AI产业价值逻辑正从流量驱动转向词元驱动。
AI 对话框成"赛博魅魔":越懂你越危险的隐忧
媒体报道指出,AI对话系统的个性化能力越强,用户越容易产生情感依赖,专家称之为"赛博魅魔"效应。多篇分析文章呼吁建立AI情感交互的伦理边界,特别是在年轻用户群体中,AI陪伴产品可能影响正常的社交能力发展。欧盟和美国监管机构已开始关注这一新兴风险领域。
一家服装科技巨头入局具身智能:跨界 AI 浪潮加速
36氪报道,一家服装科技赛道巨头宣布入局具身智能领域,将AI能力与服装制造和设计结合。这反映了AI能力正向更广泛的垂直行业渗透,传统行业巨头正加速拥抱AI转型。具身智能在制造业的应用场景包括智能质检、自动化裁剪、柔性生产线等。
阿里云 CEO 回应AI算力涨价:结构性供需矛盾将长期存在
阿里云高管在财报会上回应AI算力涨价问题,表示GPU资源供需矛盾是结构性的,并非短期现象。随着AI推理需求爆发式增长(预计2028年推理占工作负载70%以上),算力价格将在未来2-3年维持高位。阿里云将持续优化自研芯片(倚天、含光)以降低成本,但短期内涨价趋势难以逆转。
OpenAI 高管集体离职 + 股东密谋罢免奥特曼
OpenAI 核心高管剧烈震荡,一日内三位核心高管(含 Sora 负责人等)离职。股东密谋罢免 CEO 奥尔特曼。目前 11 位联合创始人仅剩 2 人在职。OpenAI 面临存在性问题,战略收缩迹象明显。
工信部等八部门印发 AI+制造专项行动:1000 个工业智能体
工信部等八部门印发 AI+制造专项行动方案,明确 3 到 5 个通用大模型落地制造业,部署 1000 个工业智能体,AI 从实验室全面走向工厂车间。
马斯克诉奥特曼案即将开庭:9 人陪审团裁决 OpenAI 使命
马斯克诉奥特曼案即将开庭,9 人陪审团将裁决 OpenAI 是否偏离创始使命。此案将成为 AI 行业治理和开源承诺的里程碑式判例。
A 股 AI 算力板块延续结构性上涨:CPO"易中天"批量刷新历史新高
A 股延续结构性上涨行情,AI 算力、商业航天、半导体四大主线为核心上涨阵地。CPO 和光模块以「易中天」三巨头批量刷新历史新高,人形机器人相关个股活跃。
腾讯朱雀实验室:AI 4 小时自主发现 33 个 0day 漏洞
腾讯朱雀实验室披露 AI 系统在 4 小时内自主攻破 FreeBSD 等主流服务器,发现 33 个 0day 漏洞并完成完整攻击链搭建。网络安全攻防逻辑被彻底改写。
AI 法律维权指南发布:北京朝阳法院提示 AI 换脸触碰人格权红线
针对「AI 换脸」「声纹克隆」等侵权频发问题,北京朝阳法院法官发布「三步走」维权建议。AI 生成内容的法律边界进一步明确。
发改委:完善 AI 法律法规、政策制度与伦理准则
国家发改委发声要求加强新兴领域安全治理,重点完善 AI 相关法律法规、政策制度、应用规范及伦理准则,AI 监管框架持续收紧。
美国 AI 反弹加剧:选举临近,数据中心被抗议
随着中期选举临近,公众对 AI 情绪显著恶化。多个社区反对 AI 数据中心建设,社交媒体对 AI 高管敌意增加,AI 监管政治化趋势明显。
全球 AI 深度伪造危机:90 所学校 600 学生受害
全球 AI 深度伪造危机加剧,90 所学校 600 名学生成为 AI 裸照生成应用受害者。美国参议员质询 ElevenLabs,AI 语音诈骗已致 $8.93亿损失。
Google 五角大楼 AI 合同引发内部强烈反弹
Google 签署允许其 AI 用于机密工作和"任何合法政府目的"的合同,合同语言允许政府请求修改安全过滤器,仅"不打算用于"监视或自主武器的非约束性限制。DeepMind 内部 BlackHC 称之为"可耻",事先无内部讨论或公告。
ARC-AGI-3 人类基线更新:单人 99.35%,平均 49.14%
ARC-AGI-3 基准的人类基线大幅更新:第一人从 86.17% 升至 99.35%,平均从 34.64% 升至 49.14%。挑战 AI 能力的门槛被显著提高。
ChatGPT 变得过度质疑:纠正用户每一句话
用户广泛反馈 ChatGPT 变得过度质疑和吹毛求疵,即使是非正式对话也会纠正用户措辞。归因于 OpenAI 打击虚假信息的努力。用户转而使用 Gemini 或 Grok 获得更平衡的体验。
非英语 Token 税量化研究:模型多语言公平性新视角
Aran Komatsuzaki 量化了各模型的非英语 Token 税:Anthropic 惩罚最重,Gemini 和 Qwen 最轻。这一发现对非英语用户的 API 成本有直接影响,推动社区关注模型多语言公平性。
"我取消了 Claude":HN 777 分热帖引爆用户信任危机
一篇"I cancelled Claude"博客在 HN 获 777 分和 468 条评论。作者列举三大不满:Token 限制频繁中断工作流、输出质量明显下降、客服支持形同虚设。Anthropic 发布事后分析归因于推理参数被调低。
Claude 系统提示词泄露 + Claude Code 性能问题持续发酵
Claude 4.7 发布后系统提示词被破解,显示严格行为约束设计。Anthropic 工程团队事后分析将性能下降归因于:推理努力参数从 high 被调为 medium、冗长提示策略变更、缓存 bug。社区认为修复速度不够快。
Odysseys 基准:200 个长程互联网任务,最佳模型仅 44.5%
Odysseys 基准引入 200 个长程实时互联网任务,采用评分制替代二值通过/失败,加入轨迹效率指标。最佳模型成功率仅 44.5%,效率仅 1.15%。
AI 数字双胞胎伦理争议:山东母亲不知儿子已故,AI 陪伴视频通话
山东一家庭为已故儿子创建 AI 数字双胞胎,定期与不知情的心脏病母亲视频通话。使用照片/视频/录音模拟外貌/声音/举止。引发关于 AI 欺骗与情感关怀的伦理争议。
Agent 攻击面是 Web:HTML/CSS 提示注入成功率 86%
DeepMind 论文"AI Agent Traps"重新定义 Agent 安全:威胁来自网页/文档中的对抗性内容,而非模型越狱。HTML/CSS 隐藏提示注入成功率高达 86%,潜在记忆中毒在 <0.1% 污染率下达 80%+ 攻击成功率。
LLM-as-a-Verifier:用模型排名替代候选生成作为缩放瓶颈
LLM-as-a-Verifier 提出通过让模型排名候选输出并使用 rank-token logprobs 估计预期质量。论点:胜者选择才是测试时缩放的瓶颈,单次验证可超越更繁琐的重排序方案。
OpenAI未能实现2025年ChatGPT营收及年末周活10亿目标,Google Gemini高速增长正在蚕食OpenAI市场份额。公司背负6000亿美元未来支出承诺,虽已完成1220亿美元融资,但资金或三年内耗尽。CFO警告若营收不及预期,数据中心采购合同履约将承压,年内IPO存变数。
OpenAI营收IPO软银
斯坦福大学发布《2026年人工智能指数报告》,涵盖顶尖AI模型加速升级、头部AI企业加速上市(OpenAI和Anthropic计划2026年下半年IPO)、大众对AI喜忧参半、美国部分地区限制新建数据中心等关键议题。
斯坦福AI指数报告2026趋势
Claude 4月15日大宕机:Anthropic API全面中断
4月15日Anthropic Claude服务发生重大宕机事件,API全面中断,影响大量企业和开发者。部分应用通过错误处理管线维持运行。
Claude宕机AnthropicAPI中断
Notion AI 4月更新:语音输入、可分享对话和跨应用自动化
Notion AI发布4月更新,新增语音输入、可分享对话和跨应用自动化功能。AI助手能力进一步增强,向AI原生办公平台演进。
Notion AI语音输入自动化办公
Ollama v0.21.0发布:Mac桌面端AI部署体验优化
Ollama发布v0.21.0版本,优化Mac桌面端AI模型部署体验,保持在macOS桌面层之下运行,提升本地AI使用便捷性。
Ollama本地AIMac部署
从垂直SaaS到垂直AI:行业商业模式根本性转变
2026年AI行业出现从垂直SaaS向垂直AI的根本性转变。传统SaaS销售工具帮助人工作,垂直AI直接销售劳动成果,在保险、法律、物流和医疗管理等领域捕获传统劳动力预算。竞争壁垒从'构建能力'转向独特的分发渠道和判断力。
垂直AISaaS商业模式劳动成果