AI技术周报 2026-05-10

AI 日报 · 2026-05-10

Anthropic $300亿ARR
年化收入300亿美元，80倍增长创AI历史，估值剑指$9000亿
GPT-Realtime-2发布
OpenAI推出首款GPT-5级推理语音模型，128K上下文，70+语言输入
Anthropic-SpaceX算力协议
Colossus 1（22万GPU/300MW）全量交付，Claude Code速率限制翻倍
AI芯片权力更迭
华尔街投资从英伟达转向Intel/AMD/Micron，AMD/Intel本周分别涨25%
DeepSeek降价
Token价格战重启，推理成本持续下降重塑市场格局
AI Agent Week纽约开幕
全球Agent顶级峰会，MCP协议安全成核心议题

🧠 大模型 12 条

大模型 5月8日

Anthropic年化收入突破$300亿，80倍增长创AI历史纪录

Anthropic CEO Dario Amodei在Code with Claude大会上披露，公司年化运行收入（ARR）已突破300亿美元，较去年同期3.75亿美元增长80倍，成为史上增长最快的AI公司。Claude Code API调用量过去一年同比增长17倍。公司当前估值3800亿美元，市场传言正以9000亿美元估值进行新一轮融资，并计划2026年10月IPO。 关键词：Anthropic ARR $300亿 80倍增长 IPO 估值$9000亿 技术详情： - 增长驱动：Claude Code在企业市场的强势表现，AWS/Trainium、Google/TPU、Amazon/Google算力合作三线并进 - 社区讨论：用户对高成本和速率限制仍有抱怨，部分用户转向开源替代方案

大模型 5月8日

OpenAI发布GPT-Realtime-2：首款GPT-5级推理语音模型

OpenAI通过Realtime API发布三款新语音模型。GPT-Realtime-2是首款具备GPT-5级推理能力的实时语音模型，支持工具调用、打断处理，上下文窗口扩展至128K tokens，在Big Bench Audio和Conversational Dynamics基准测试中排名第一。GPT-Realtime-Translate支持70+语言输入、13种语言输出实时翻译。GPT-Whisper提供低延迟转录。标志着语音AI从"对话界面"走向"可执行任务的Voice Agent"。 关键词：GPT-Realtime-2 语音模型 Realtime API 实时翻译 128K上下文 技术详情： - 架构：基于GPT-5.5的推理能力，专门针对语音交互优化 - 性能：在Big Bench Audio基准测试中排名第一，支持实时打断和工具调用 - 应用：Voice Agent可直接执行任务（预订、查询、操作），不仅是对话界面

大模型 5月6日

OpenAI推出GPT-5.5 Instant为ChatGPT新默认模型

OpenAI将GPT-5.5 Instant设为ChatGPT和API的新默认模型，在事实性、智能、图像理解和语气方面全面提升，并强化个性化功能（记忆保存、Gmail集成）。社区对GPT-5.5在高token预算编码任务中的表现给予高度评价。这是继4月23日GPT-5.5旗舰版发布后的重要迭代。 关键词：GPT-5.5 Instant 默认模型 个性化 ChatGPT Gmail集成 技术详情： - Arena评估：GPT-5.5 Instant在Multi-Turn排名第5，Vision排名第11，Document Arena排名第24 - 社区反馈：@dhh称其"very good, very efficient"，@gdb称其"very capable and very succinct"

大模型 5月7日

OpenAI推出GPT-5.5-Cyber网络安全专用模型

OpenAI发布GPT-5.5 Trusted Access for Cyber，面向企业和政府的网络安全防御工作流，支持红队测试和威胁检测。这是OpenAI首次推出垂直安全专用模型，标志着"通用大模型"向"行业专用模型"延伸的战略转型。 关键词：GPT-5.5-Cyber 网络安全 专用模型 OpenAI 红队测试 技术详情： - 定位：企业/政府网络安全防御，而非攻击用途 - 政策框架：即将发布的美国AI安全行政令强调"与前沿实验室合作网络防御"，而非前沿模型预批准

大模型 5月8日

ZAYA1-74B/8B开源：完全基于AMD Instinct MI300训练

Zyphra发布ZAYA1-74B-Preview（740亿参数MoE架构，Apache 2.0开源）和ZAYA1-VL-8B（视觉语言模型）。最大亮点是完全使用AMD Instinct MI300 GPU训练，而非NVIDIA GPU，验证了AMD在AI训练领域的竞争力。此举被视为AMD挑战NVIDIA AI生态的重要里程碑。 关键词：ZAYA1-74B AMD MI300 开源 MoE 技术详情： - ZAYA1-74B-Preview：74B total / 4B active MoE，pre-RL base checkpoint，Apache 2.0 license - ZAYA1-VL-8B：700M active / 8B total MoE VLM，Apache 2.0 license - 社区反馈：@teortaxesTex称其足以验证该实验室的架构和方法论

大模型 5月8日

AlphaEvolve一周年：AI自我改进交出炸裂成绩单

Google DeepMind发布AlphaEvolve一周年成果：该系统已能自主改进自身算法，在芯片设计（改进TPU设计）、数学问题求解、电网优化等领域实现突破。Jeff Dean表示"TPU大脑正在设计下一代TPU身体"，"AI造AI"已从科幻设定变为正在合拢的工程闭环。系统采用进化算法框架，通过大规模语言模型生成和改进代码。 关键词：AlphaEvolve Google DeepMind AI自我改进 TPU 进化算法 技术详情： - 应用：Google AI基础设施、分子模拟、自然灾害风险预测 - 实际影响：大规模AI模型训练速度翻倍，路由优化每年节省15,000公里行程

大模型 5月9日

梁文锋率领"小龙"过千亿：DeepSeek估值逼2000亿人民币

梁文锋创立的DeepSeek以2000亿人民币（约$280亿）估值领跑中国大模型"千亿市值俱乐部"。DeepSeek V4发布后口碑极佳，推理成本仅为竞对的1/10。V4完全兼容vLLM和SGLang，已获大量企业客户采用。市场关注DeepSeek首轮融资估值能否达到$450亿。 关键词：DeepSeek 梁文锋 估值$280亿 V4 开源 技术详情： - V4性能：在FoodTruck Bench上匹配GPT-5.2（差距约3%），成本降低17倍 - 社区反馈：@htihle指出V4-Pro在WeirdML上表现弱于GLM/Kimi/open竞品

大模型 5月7日

月之暗面Kimi完成$20亿融资，估值破$200亿

月之暗面（Kimi）完成新一轮20亿美元融资，投后估值突破200亿美元。美团龙珠领投，中国移动、CPE源峰等参投。Kimi K2.5更新后ARR大幅增长，累计融资超376亿元人民币，成为中国大模型创业公司融资之最。Kimi的国际化战略也在加速推进。 关键词：Kimi 月之暗面 $20亿 $200亿估值 美团龙珠 技术详情： - Kimi K2.6在Baseten上运行成本约为Opus 4.7的1/5，性能相当 - @caspar_br报告称将内部Fleet模型从Sonnet 4.6切换至Kimi K2.6后未 notice 差异

大模型 5月9日

蚂蚁百灵、百度、阶跃星辰本周分别发布新模型

本周国内大模型密集发布：蚂蚁百灵发布新版多模态模型，百度文心4.5 Turbo上线，阶跃星辰Step 3.5全面开源。三方分别在多模态理解、推理成本和高性能开源三个方向发力，国内大模型"模型能力"竞争进入白热化阶段。 关键词：蚂蚁百灵 百度文心 阶跃星辰 新模型 国内

大模型 5月8日

Qwen3 Omni多模态能力全面升级

阿里Qwen3 Omni发布，支持文本、图像、音频、视频四模态统一处理，在人工评估中超越GPT-5.5 Instant。千问电脑版同步上线语音输入法，支持"口喷式"AI原生交互，被视为中文AI交互的重要创新。 关键词：Qwen3 Omni 多模态 千问 语音输入 阿里 技术详情： - Qwen3.6 27B uncensored heretic v2保留全部15个native MTP heads，KLD 0.0021，6/100 refusals - 社区反馈：需要Q4_K_XS GGUF变体以适配16GB VRAM

大模型 5月7日

Grok 4.3发布：100万token上下文，输入$1.25/M

xAI（原xAI）发布Grok 4.3，定位"迄今最快最智能模型"。支持100万token上下文窗口，输入价格每百万token仅1.25美元，输出2.5美元。在Anthropic租用Colossus 1的同一周发布，被视为xAI从"模型竞争"转向"算力商业化"的战略信号。 关键词：Grok 4.3 xAI 100万token 低价 上下文

大模型 5月8日

OpenAI重建WebRTC语音栈，大幅降低对话延迟

OpenAI分享WebRTC语音基础设施更新，重建语音对话实时传输层，大幅降低延迟并提升稳定性。新语音栈支持自适应比特率、丢包恢复和跨网络无缝切换。该更新已集成至ChatGPT语音模式和Realtime API，使语音对话体验接近"无感延迟"。 关键词：WebRTC 语音栈 延迟 OpenAI Realtime API

⚙️ 训练推理 10 条

训练推理 5月8日

5% GPU利用率：价值$4010亿的AI基础设施难题

VentureBeat深度报道揭示AI基础设施严重效率问题：企业过去两年panic-buying GPU容量，但实际审计显示平均利用率仅5%。这意味着价值4010亿美元的GPU资源中95%处于闲置状态。问题核心在于："AI基础设施不等于堆GPU"，调度系统、虚拟化技术、推理优化才是真正的效率瓶颈。新兴GPU云服务正围绕"利用率"构建竞争壁垒。 关键词：GPU利用率 5% $4010亿 基础设施 效率

训练推理 5月8日

Anthropic发布Dreaming系统：AI Agent从自身错误中学习

Anthropic在Code with Claude大会上发布Dreaming系统——让AI Agent从自身错误中持续学习的能力。Dreaming在后台定期审阅Agent会话记录和记忆库，提取规律并自我改进，支持全自动或人工审核两种模式。同时，Anthropic将Outcomes（开发者定义成功标准评分）和Multi-agent Orchestration从研究预览推进至公开Beta，标志Agent技术从"演示"走向"生产级"。 关键词：Dreaming 自我学习 Agent Multi-agent 生产级 技术详情： - Dreaming：跨会话记忆蒸馏，自动提取规律并改进 - Outcomes：开发者定义评分标准，独立评分Agent评估输出质量 - Multi-agent Orchestration：主导Agent拆解任务并委派子Agent并行工作

训练推理 5月8日

Redis之父为DeepSeek V4打造专属推理引擎

Redis创始人Salvatore Sanfilippo（antirez）发布专为DeepSeek V4设计的轻量级推理引擎，使V4可在Mac上高效运行。该引擎针对V4的MoE架构做了特殊优化，支持动态专家路由和高效KV Cache管理。此举大幅降低V4部署门槛，Mac用户现可本地运行完整版V4模型。 关键词：Redis DeepSeek V4 推理引擎 Mac 本地运行

训练推理 5月8日

vLLM更新：提升吞吐量，新增DeepSeek V4支持

vLLM项目发布重大更新，重点提升推理吞吐量和延迟表现，新增对DeepSeek V4的完整支持，并增强量化（quantization）和后端能力。vLLM与SGLang的"推理框架之争"持续升温，双方在长上下文、Agent场景和量化支持上各有优势。 关键词：vLLM DeepSeek V4 推理框架 吞吐量 量化 技术详情： - vLLM-Omni v0.20.0：Qwen3-Omni吞吐量+72% on H20，major TTS延迟/RTF reductions - vLLM + Mooncake：3.8x吞吐量，46x更低P50 TTFT，8.6x更低端到端延迟，cache-hit从1.7%提升至92.2%，扩展至60 GB200 GPUs

训练推理 5月5日

Subquadratic声称1000倍AI效率提升，学界要求独立验证

迈阿密初创公司Subquadratic从隐身模式浮出水面，声称其SubQ模型完全突破了自2017年Transformer以来定义所有主流AI系统的数学限制，实现1000倍效率提升。该公司由13人团队打造，采用SSA（Stride Self-Attention）架构。然而学界对其声明持谨慎态度，多位研究人员要求提供独立基准测试结果。 关键词：Subquadratic SSA 1000倍效率 Transformer替代 独立验证

训练推理 5月8日

Anthropic "Mythos"重写Firefox网络安全方案

Anthropic的Mythos项目正在改写Firefox浏览器的网络安全架构。通过与Mozilla合作，Mythos利用Claude的推理能力实时检测恶意网站、钓鱼攻击和隐私侵犯行为。该系统在后台运行，不影响用户浏览体验，同时持续提升检测精度。这是AI模型首次深度集成至主流浏览器的安全层。 关键词：Mythos Firefox 网络安全 Anthropic 实时检测

训练推理 5月7日

Sakana 7B模型完成GPT/Claude/Gemini三模型编排

东京Sakana AI发布7B参数的任务编排模型，使用强化学习（而非硬编码工作流）动态路由GPT-5、Claude Sonnet 4和Gemini 2.5 Pro之间的任务。该系统能根据任务类型、成本约束和性能要求自动选择最合适模型，在多模型协作场景下实现最优性价比。Sakana称其编排效率超越人工规则设定30%以上。 关键词：Sakana 7B 模型编排 RL 多模型协作

训练推理 5月8日

OpenAI推出Trusted Contact功能：防止AI辅助自伤

OpenAI推出"Trusted Contact"（可信联系人）安全功能，当系统检测到用户可能存在自伤风险时，可通知用户预先指定的紧急联系人。该功能结合GPT-5.5的推理能力，能更精准识别风险信号。这是OpenAI在AI安全领域的最新举措，也是应对监管压力和公众关切的主动响应。 关键词：Trusted Contact OpenAI AI安全 自伤预防 安全功能

训练推理 5月8日

SGLang持续优化：长上下文和Agent场景表现突出

SGLang作为DeepSeek V4官方推荐推理框架，本周持续优化长上下文处理和Agent场景性能。与vLLM相比，SGLang在RadixAttention、高效内存管理和动态批处理上有独特优势，特别适合超长上下文（1M+ tokens）和复杂Agent工作流。 关键词：SGLang DeepSeek V4 长上下文 Agent 推理框架 技术详情： - 支持prefill/decode disaggregation, FP8 FlashMLA, SBO, expert affinity, observability - 在H20上实现57B tokens/day推理吞吐量

训练推理 5月8日

LMDeploy推进国产芯片深度优化

LMDeploy宣布对华为昇腾、百度昆仑芯等国产AI芯片提供更深度优化支持，在推理吞吐量上较通用框架提升40%以上。这是在国产算力快速部署的背景下，推理框架"本地化适配"的重要进展。沐曦、摩尔线程等国产GPU也正与主流推理框架展开适配合作。 关键词：LMDeploy 国产芯片 昇腾 昆仑芯 推理优化

🤖 Agent 11 条

Agent 5月4-8日

AI Agent Week 2026在纽约开幕：MCP协议安全成核心议题

AI Agent Week 2026在纽约举行，全球Agent领域顶级研究者和工程师齐聚。核心议题包括：MCP（Model Context Protocol）协议安全漏洞与防护、Function Calling注入攻击、多Agent协作框架演进、Agent评估基准统一。大会上多个团队展示了基于Codex和Claude Code的生产级Agent部署案例。 关键词：AI Agent Week MCP 安全 多Agent New York 技术详情： - MCP攻击面：工具投毒（Tool Poisoning）、Function Calling注入、Computer Use Agent滥用 - 防御建议：工具来源验证、参数沙箱执行、Agent行为审计

Agent 5月8日

Anthropic Managed Agents三新能力全面上线

Anthropic将Dreaming（跨会话记忆蒸馏）、Outcomes（成功标准评分）、Multi-agent Orchestration（多智能体编排）三项能力从研究预览推至公开Beta。Dreaming让Agent定期审阅自身会话并提取规律自我改进；Outcomes让开发者定义评分标准，独立评分Agent评估输出质量；Multi-agent Orchestration支持主导Agent拆解任务并委派子Agent并行工作。 关键词：Managed Agents Dreaming Outcomes Multi-agent Anthropic

Agent 5月8日

OpenAI Codex进化为长期运行Agent运行时

OpenAI的Codex从"编程助手"进化为长期运行的Agent运行时，引入新的/goal机制，在ARC-AGI-3游戏测试中达到61%成功率。Codex支持在后台持续运行、自主规划任务序列、调用工具链完成复杂工作流，标志着"AI编程助手"向"自主软件工程师"的关键转型。 关键词：Codex Agent运行时 /goal ARC-AGI-3 61% 技术详情： - Codex Goals在ARC-AGI-3游戏测试中达到61%成功率（160小时/30k actions） - 大部分有用工作在前几小时完成，之后陷入停滞 - OpenAI发布Codex安全运行机制：sandboxing, approval gates, network policy, telemetry

Agent 5月7日

微软Agent 365正式GA：$15/用户/月统一AI Agent治理

微软Agent 365正式从预览版走向GA（General Availability），$15/用户/月。定位为统一控制平面，帮助企业IT和安全团队观察、治理和保护在Microsoft生态、AWS Bedrock、Google Cloud等平台运行的AI Agent。核心应对"Shadow AI"成为企业安全威胁的新挑战。 关键词：Agent 365 Microsoft GA 治理 Shadow AI

Agent 5月7日

Salesforce Agentforce Operations上线：拆解企业工作流

Salesforce推出Agentforce Operations平台，将企业后台工作流拆解为适合AI Agent处理的任务单元。核心逻辑是"大多数企业流程从未为AI设计"，Agentforce Operations充当适配层，让Agent能真正融入现有业务流程。已在多家财富500强企业部署。 关键词：Agentforce Salesforce 工作流 企业AI Operations

Agent 5月8日

字节跳动Seedance 2.0技术突破：物理一致性显著提升

字节跳动发布Seedance 2.0技术细节：通过引入"物理一致性约束"（Physics-Consistent Constraint），视频生成中的物体运动、光照变化和物理交互更加真实。与Sora 2.0相比，Seedance 2.0在"物理真实性"评分上高出15%。字节正与多家影视制作公司达成合作，推进AI视频的商业化落地。 关键词：Seedance 2.0 字节跳动 物理一致性 视频生成 影视

Agent 5月8日

Perplexity Personal Computer全面开放Mac用户

Perplexity AI宣布其"Personal Computer"功能全面向Mac用户开放。该功能将Perplexity转化为本地AI工作站，支持文档分析、代码执行、数据可视化等本地化AI任务。Perplexity由此从"搜索引擎"转型为"个人AI计算机"，与ChatGPT、Claude的本地能力展开正面竞争。 关键词：Perplexity Personal Computer Mac 本地AI 转型 技术详情： - Perplexity built in-house inference engine "ROSE"，覆盖从embeddings到trillion-parameter LLMs - 使用CuTeDSL加速Hopper和Blackwell上的专用kernel开发

Agent 5月8日

Lance Martin加入Anthropic：RAPTOR等核心技术研究者加盟

著名AI研究者Lance Martin（RAPTOR检索系统、Hexact算法发明者）宣布加入Anthropic。Martin的RAPTOR是当前RAG系统的核心算法之一，他的加入将进一步巩固Anthropic在Agent记忆和检索技术上的领先优势。Martin表示："在Anthropic，我们可以访问最好的模型、极具天赋的同事、充足的计算资源。" 关键词：Lance Martin Anthropic RAPTOR RAG 人才引进

Agent 5月9日

"养虾人"自述：为什么我卸载Claude？

多位重度Claude Code用户公开发文讲述"卸载Claude"的原因：高成本（Opus 4.7 API调用费用昂贵）、高风险（自主操作生产环境的风险）、低产出（实际编码效率不及预期）。这一讨论揭示了Agent工具从"新奇"走向"生产依赖"过程中的真实痛点，也推动Anthropic加速Claude Code的成本控制和安全机制改进。 关键词：Claude Code 养虾人 高成本 生产风险 用户反馈 社区反馈： - @RichNwan：认为Anthropic正在构建managed agents平台，但Dreaming和Outcomes与开源harness相比差异化不足 - @eliebakouch：认为这些功能对power users很重要，尤其是保护主导Agent的上下文窗口

Agent 5月9日

OpenClaw现状：高成本、高风险、低产出争议

OpenClaw（开源Claude Code替代方案）社区出现分歧。支持者认为OpenClaw是"民主化的AI编程"，反对者指出其token消耗失控、误操作率居高不下。核心问题：当前Agent框架仍缺乏有效的"成本-质量-安全"三角平衡机制，这是所有AI编程Agent面临的共同挑战。 关键词：OpenClaw 开源 成本失控 Agent框架 争议

Agent 5月5日

AI Agent安全研究：MCP协议攻击面全面分析

最新安全研究全面分析了Model Context Protocol（MCP）的攻击面：工具投毒（Tool Poisoning）、Function Calling注入、Computer Use Agent滥用等。研究提供了可操作的防御建议，包括工具来源验证、参数沙箱执行、Agent行为审计等。随着MCP协议被Anthropic/OpenAI等主流采用，安全问题正变得日益紧迫。 关键词：MCP 安全 工具投毒 注入攻击 防御

🔧 基础设施 11 条

基础设施 5月8日

AI芯片投资重心转移：华尔街从英伟达转向Intel/AMD/Micron

CNBC报道，华尔街AI芯片投资正在经历"权力更迭"：过去两年独占鳌头的英伟达出现增长放缓迹象，而Intel、AMD和Micron本周股价分别上涨约25%、25%和37%。驱动因素：（1）AI从聊天机器人转向Agent，CPU需求激增，预计数据中心CPU市场从2025年$270亿增至2030年$600亿；（2）全球内存短缺推高价格，Micron市值本周首破$800亿；（3）苹果与Intel、三星洽谈美国本土芯片生产。 关键词：AI芯片 Intel AMD Micron 权力更迭

基础设施 5月7日

Anthropic-SpaceX算力协议全解读：Colossus 1全部交付

Anthropic与SpaceX AI签署协议，获得Colossus 1数据中心全部算力（超22万块英伟达GPU，含H100/H200/GB200，超300MW容量）。Claude Code五小时速率限制翻倍，高峰限流取消，Opus API速率大幅提升。这是AI行业迄今最大的单笔算力合作协议，也标志着马斯克从"AI竞争者"转向"AI算力供应商"的战略转型。 关键词：Anthropic SpaceX Colossus 1 22万GPU 300MW 技术详情： - 规模：>300MW新容量，>22万NVIDIA GPUs（~15万H100s + 5万H200s + 3万GB200s） - 时间线：Claude inference将在"未来几天内"开始在Colossus上运行 - 战略意义：前沿实验室可以租用竞争对手的算力，compute不是持久护城河

基础设施 5月8日

Corning与英伟达签署巨额协议，建设3家美国光学工厂

Corning（康宁）与英伟达签署战略协议，将在美国建设3家光学技术工厂，支撑AI数据中心的高速互联需求。此举是英伟达"美国AI基础设施"战略的重要组成部分。与此同时，Corning还与Meta签署了至2030年的$60亿光纤电缆供应协议。光学互联正成为AI算力扩展的新瓶颈。 关键词：Corning 英伟达 光学互联 AI工厂 美国制造

基础设施 5月8日

英伟达中国市场份额归零：国产AI芯片三派系争抢市场

受美国出口管制影响，英伟达在华市场份额已归零。国产AI芯片三大技术路线正在激烈竞争：（1）华为昇腾系（兼容CUDA生态，81.2万块出货量第一）；（2）百度昆仑芯系（自研架构，11.6万块，科创板IPO进行中）；（3）平头哥系（阿里生态，26.5万块）。从95%到0%，英伟达退出为中国芯片留下历史性机遇。 关键词：英伟达 中国市场 归零 国产芯片 华为昇腾

基础设施 5月8日

苹果与Intel、三星洽谈美国本土芯片生产

报道称苹果正与Intel和三星洽谈，计划将部分芯片生产转移至美国本土，以减少对亚洲供应链的依赖。若协议达成，将是苹果首次在美国本土生产主处理器芯片。Intel的18A工艺和三星的2nm GAA工艺是主要竞争方案。此举与美国政府"芯片本土化"战略高度吻合。 关键词：苹果 Intel 三星 美国本土 芯片生产

基础设施 5月7日

百度昆仑芯IPO冲刺："A+H"两地上市正式启动

百度旗下AI芯片企业昆仑芯完成科创板IPO辅导备案，同步推进港股上市（1月已提交申请）。百度持股57.67%，投资方包括中国互联网投资基金、比亚迪、中国移动等57家股东。高盛估算百度所持股权价值30-110亿美元，麦格理估算约$165亿。昆仑芯累计出货11.6万块（中国第三），下一代M100（2026）、M300（2027）在研。 关键词：昆仑芯 百度 IPO 科创板 A+H

基础设施 5月8日

国产AI芯片IPO潮：沐曦、摩尔线程已登陆科创板

继沐曦股份、摩尔线程登陆科创板后，壁仞科技、天数智芯正推进港股上市，燧原科技、瀚博半导体也在筹备科创板IPO。分析指出，AI芯片企业上市潮背后是"算力自主化"国家战略驱动，但商业化能力仍存疑——绝大多数国产AI芯片企业收入严重依赖政府和国企采购，市场化收入占比不足20%。 关键词：AI芯片 IPO 沐曦 摩尔线程 科创板

基础设施 5月7日

英伟达MRC协议开源：解决10万+GPU集群训练难题

OpenAI联合英伟达、AMD、微软、Broadcom、英特尔发布MRC（Multipath Reliable Connection）超算网络协议，已通过OCP开源。核心机制：多平面网络（800Gb/s拆8×100Gb/s链路）+自适应包喷射（微秒级故障绕行）+SRv6源路由（禁用动态路由）。仅需两层交换机即可构建13.1万GPU全互联网络。MRC已在OpenAI最大规模GB200超算上部署。 关键词：MRC OpenAI OCP 10万GPU 网络协议 技术详情： - 多平面网络：800Gb/s拆分为8×100Gb/s链路 - 自适应包喷射：微秒级故障绕行 - SRv6源路由：禁用动态路由 - 仅需两层交换机即可构建13.1万GPU全互联网络

基础设施 5月7日

AMD MI400系列即将发布：2nm CDNA 5架构，数据中心收入预计增73%

AMD即将于2026下半年发布MI400系列AI加速器，基于CDNA 5架构和台积电2nm工艺。分析师预计MI400将推动AMD数据中心收入增长73%，进一步挑战英伟达在AI芯片市场的主导地位。MI350P（四年来首款PCIe规格Instinct显卡）已于上周发布，AI算力4.6 PFLOPS，144GB HBM3E。 关键词：AMD MI400 2nm CDNA 5 数据中心 技术详情： - MI350P：CDNA 4架构，PCIe add-in card，144GB/288GB HBM3E，3.6 TB/s内存带宽 - 社区反馈：定价和可用性未披露，是主要缺失的部署细节

基础设施 5月8日

ARM财报：Q1营收翻倍但指引逊色，股价暴跌10%

ARM发布2026财年Q1财报，营收同比增长超一倍，但Q2指引不及市场预期，股价盘后暴跌10%。分析指出ARM在AI芯片生态中面临"IP授权模式vs.自研芯片"的战略两难，同时RISC-V在AI场景的渗透也对其构成长期威胁。 关键词：ARM 财报 -10% AI芯片 指引逊色

基础设施 5月8日

CoreWeave财报：Q1营收翻倍但指引不及预期，盘后跌超10%

AI云服务提供商CoreWeave发布Q1财报，营收超预期翻倍增长，但Q2指引不及市场预期，盘后股价一度跌超10%。CoreWeave作为"新云计算"代表，其指引不佳引发市场对AI基础设施需求可持续性的担忧。 关键词：CoreWeave 财报 AI云 指引 盘后

🦾 机器人 10 条

机器人 5月6日

中国人形机器人"七小龙"：商业化差距加速显现

36Kr深度报道中国人形机器人赛道现状：宇树、智元、银河通用、傅利叶、乐聚、优必选、钢铁侠（"七小龙"）在商业化进程上差距加速显现。工业场景（汽车制造、电子组装、物流搬运）成为主要突破口，但大规模部署仍受限于成本、可靠性和场景适配性。2026年Q1人形机器人领域融资总额超120亿元。 关键词：人形机器人 七小龙 商业化 工业场景 融资

机器人 5月6日

"夸父"人形机器人冲刺IPO：90后哈工大团队打造

90后哈工大团队打造的人形机器人"夸父"正在冲刺IPO。该机器人在运动控制（全身动力平衡、复杂地形行走）和场景适配（工业巡检、服务接待）方面表现突出。"夸父"的IPO进程标志着中国人形机器人企业正式进入资本市场赛道。 关键词：夸父 人形机器人 IPO 哈工大 具身智能

机器人 5月7日

Boston Dynamics vs Tesla vs Figure：2026人形机器人竞争格局

人形机器人三强最新进展：Boston Dynamics推出量产版Atlas（56自由度，50kg），Tesla Optimus Gen 3推进商业部署，Figure AI发布Figure 03并与OpenAI深度合作。2026年成为人形机器人商业化元年，B端工业场景率先落地，C端家用场景预计2028年后成熟。 关键词：Boston Dynamics Optimus Figure 人形机器人 2026

机器人 5月6日

Hugging Face推出机器人应用商店：Reachy Mini App Store上线200+应用

Hugging Face推出开源Reachy Mini App Store，已托管200+社区构建的应用程序。Reachy Mini售价$299，自去年发售以来已售出约1万台。用户可免费下载应用，非技术用户也能构建自定义机器人应用。VentureBeat评价为"机器人的App Store时代正式到来"。 关键词：Hugging Face Reachy Mini App Store 机器人 开源

机器人 5月8日

Physical AI攻克可变形材料组装难题

最新研究突破：Physical AI（物理人工智能）系统已能处理可变形材料的组装任务，这是传统工业机器人无法完成的。该系统结合触觉反馈、视觉识别和力控算法，能像人类一样处理柔软、易变形材料（纺织品、软性塑料、生物组织）。这一突破将AI机器人应用场景从"刚性组装"扩展至"柔性制造"。 关键词：Physical AI 可变形材料 触觉反馈 柔性制造 机器人

机器人 5月7日

中国具身智能机器人冲击高危工业场景

新华社报道中国在具身AI机器人领域的最新进展。国产攀爬机器人已在电力巡检等高危场景投入实战，自主研发的海底电缆检测机器人也已部署，充当水下"侦察兵"。具身智能已被明确列入"十五五"规划新经济增长引擎，政策支持力度持续加大。 关键词：具身智能 攀爬机器人 海底检测 十五五 高危工业

机器人 5月8日

Ripcord力压Boston Dynamics获重大合同

机器人公司Ripcord在一项重大合同竞争中击败Boston Dynamics。Ripcord产品聚焦于文档数字化和自动化工作流机器人，其竞争优势在于AI视觉识别和高速机械臂的精密协同。Boston Dynamics自被现代收购后在商业化落地方面进展相对缓慢，给了新兴玩家突围机会。 关键词：Ripcord Boston Dynamics 机器人竞争 商业化 合同

机器人 5月8日

Physical AI for Defense：防务应用引发伦理争议

Physical AI在防务领域的应用引发激烈伦理争议。多家AI公司被曝与军方合作，将Physical AI系统用于侦察、排爆、甚至进攻性场景。批评者指出，Physical AI的自主决策能力在战场环境中可能引发不可预测的后果。多家AI公司正制定"军用AI伦理准则"，试图在商业利益和社会责任间寻找平衡。 关键词：Physical AI 防务 伦理争议 自主武器 AI准则

机器人 5月8日

Hierarchical LLMs for Robotics：分层大模型提升机器人推理能力

最新研究提出"Hierarchical LLMs for Robotics"架构，通过将大模型分为"高层任务规划"和"低层动作执行"两个层次，显著提升机器人复杂任务推理能力。高层LLM负责任务分解和策略制定，低层LLM负责具体动作生成和实时调整。该架构在长时程任务（如"做一杯咖啡"）上成功率比单一模型提升40%以上。 关键词：Hierarchical LLM 机器人 任务规划 分层架构 推理

机器人 5月9日

AI视频生成助力机器人训练数据合成

最新研究表明，AI视频生成模型（Sora、Seedance等）可用于合成机器人训练数据，大幅降低真实世界数据采集成本。通过对生成视频进行物理一致性过滤和姿态标注，可构建百万级机器人操作数据集。这一方法正在改变机器人学习的"数据饥渴"困境，多家机器人公司已进入实用化阶段。 关键词：AI视频 机器人训练 数据合成 物理一致性 数据集

🎨 多模态 7 条

多模态 5月8日

AI视频生成价格战：可灵、即梦、Seedance争夺创作者市场

AI视频生成赛道价格战白热化。可灵AI（快手）推出大幅降价方案，即梦AI（字节）跟进，Seedance 2.0（字节）则以"更高质量"维持溢价。数据显示2026年Q1 AI视频生成市场规模已达18亿元，但绝大多数用户仍集中在"免费试用"阶段，付费转化率不足3%。行业正从"技术竞赛"转向"创作者生态构建"。 关键词：AI视频 价格战 可灵 即梦 Seedance

多模态 5月8日

AI多模态模型突破：视觉-语言-动作三者统一取得新进展

多模态AI研究取得重要进展：新一代模型开始实现视觉感知、语言理解和动作执行的真正统一（而非简单的pipeline串联）。核心突破在于"跨模态注意力机制"——视觉特征、语言语义和动作规划在同一特征空间中直接交互。这一架构在机器人操控、自动驾驶和AR/VR场景中均展现出显著优势。 关键词：多模态 视觉-语言-动作 跨模态注意力 统一架构 VLA-M

多模态 5月8日

千问电脑版上线AI语音输入法：口喷式AI原生交互

阿里千问电脑版上线语音输入法，支持按住语音和双击唤起两种模式。系统自动去除口水话、纠正口误、生成结构化表达，中英文夹杂识别精准，连接千问全套办公能力（PPT、表格、文档、搜索、分析）。被视为"口喷可能才是真正AI Native输入方式"的重要实践。 关键词：千问 语音输入 AI Native 阿里 交互

多模态 5月7日

Spotify AI DJ新增四语言支持，进军非英语市场

Spotify宣布其AI DJ功能新增法语、德语、意大利语和巴西葡萄牙语支持，标志着AI个性化音频内容正式进军非英语市场。AI DJ基于用户收听历史生成个性化音乐解说，结合GPT语音合成技术，已实现"真人DJ级"体验。Spotify明确表示目标是"成为AI生成个性化音频的最终平台"。 关键词：Spotify AI DJ 多语言 个性化音频 AI生成

多模态 5月8日

AI生成内容生态危机："AI Slop"正在淹没互联网

深度调查显示，低质量AI生成内容（"AI Slop"）正在以指数级速度污染互联网内容生态。从SEO文章、电商产品描述到社交媒体帖子，大量AI生成内容缺乏原创性和事实准确性，却在搜索引擎中占据高位。Google、Bing已宣布将更新排名算法，降低"纯AI生成"内容的权重。 关键词：AI Slop 内容生态 低质内容 搜索引擎 内容标识

多模态 5月8日

MiniMax海螺视频2.0发布：中文理解优势明显

MiniMax发布海螺视频2.0（Hailuo Video 2.0），在中文语义理解和角色一致性上较1.0版本有显著提升。与可灵、即梦、Seedance相比，海螺视频在"中文语境下的创意表达"上有差异化优势，已获得多家中文短视频创作者采用。 关键词：MiniMax 海螺视频2.0 中文理解 视频生成 创作者

多模态 5月8日

微软不写代码改研究兵法：Claude"入侵"Office

随着Claude正式集成Microsoft 365，外界质疑微软是否正在"放弃Copilot"。微软内部人士透露，战略已悄然调整：从"自研Copilot"转向"让最好的模型运行在Microsoft生态中"。这一"兵法式"灵活策略使微软在AI大战中保持"不输"地位，而不必在所有战线上与OpenAI和Anthropic正面对抗。 关键词：微软 Claude Copilot Office集成 战略调整

💰 投融资 9 条

投融资 5月7日

Anthropic $300亿ARR背后：与黑石/高盛成立企业AI服务公司

Anthropic联合Blackstone、Hellman & Friedman、Goldman Sachs等顶级资管机构成立新企业AI服务公司。Anthropic应用AI工程师将与新公司工程团队共同为中型企业（社区银行、中型制造商、区域医疗系统）定制Claude解决方案。新公司将成为Claude Partner Network成员，与Accenture、Deloitte等并行运作。 关键词：Blackstone Goldman Sachs 企业AI 中型企业 Claude

投融资 5月5日

OpenAI与TPG/博枫/Advent/贝恩资本成立$40亿合资企业

OpenAI与TPG、博枫资产管理、Advent、贝恩资本等投资者筹集逾40亿美元，成立专注帮助企业部署AI软件的公司。这是OpenAI首次与金融资本深度绑定，标志着其从"技术研发"向"企业服务"的战略延伸。合资企业将重点服务金融、医疗、制造业等大客户。 关键词：OpenAI TPG 合资企业 $40亿 企业AI

投融资 5月9日

中国大模型"三天融资超$70亿"：到了最疯狂也最危险的时刻

36Kr报道，5月7-9日三天内，中国大模型领域融资总额超70亿美元（约500亿人民币），创下单周融资纪录。月之暗面$20亿、智谱AI新一轮、MiniMax融资相继落地。分析指出，融资热潮背后是"商业化压力"与"估值泡沫"的双重风险，2026年将是AI公司"证明变现能力"的关键年。 关键词：中国AI $70亿 融资潮 商业化压力 估值泡沫

投融资 5月9日

估值逼近$1万亿：Anthropic或超OpenAI成全球最值钱AI创企

智东西报道，Anthropic在以$9000亿估值进行新一轮融资谈判，若完成将超越OpenAI成为全球最值钱的AI初创公司。Anthropic的快速增长得益于Claude Code在企业市场的强势表现，以及AWS/Trainium、Google/TPU、Amazon/Google算力合作的三线并进格局。 关键词：Anthropic $9000亿 全球最值钱 超越OpenAI 估值

投融资 5月8日

Cloudflare宣布AI替代1100个岗位，收入创历史新高

Cloudflare CEO Matthew Prince宣布，AI工具已使公司1100个岗位变得冗余，同时公司季度收入创下历史新高。这一声明引发广泛讨论：AI替代就业不再是远期预测，而是正在发生的现实。Cloudflare表示被替代员工已全部内部转岗，但外界对此说法持怀疑态度。 关键词：Cloudflare AI替代岗位 1100人 就业冲击 AI效率

投融资 5月9日

SK海力士"封神"背后：9倍狂飙，AI内存最大赢家

SK海力士股价过去一年上涨超9倍，成为AI内存赛道最大赢家。核心驱动是HBM（高带宽内存）需求激增，SK海力士作为NVIDIA H100/H200/GB200的HBM3E独家供应商，产能已全部被预订至2027年。三星和美光正全力追赶，但技术代差仍需时间弥补。 关键词：SK海力士 HBM 9倍 AI内存 NVIDIA

投融资 5月8日

a16z：AI基础设施投资进入"二期时代"

a16z发布最新AI投资报告，指出AI基础设施投资正从"一期"（算力建设）进入"二期"（效率优化、软件层、应用层）。a16z已调整投资重心，从GPU/芯片公司转向AI编排软件、Agent基础设施、垂直行业AI应用。报告预测2026-2028年AI投资的最大机会在"更好用GPU"而非"更多GPU"。 关键词：a16z AI投资 二期 基础设施 GPU效率

投融资 5月9日

Cerebras上市背后：OpenAI正在抢英伟达的蛋糕

Cerebras（晶圆级芯片公司）推进上市进程。分析指出，OpenAI通过Cerebras晶圆级芯片加速推理，正在"重构而非替代"英伟达的生态位。Cerebras的晶圆级架构在推理任务上较GPU有显著优势，已获得多家大模型公司的推理订单。 关键词：Cerebras 晶圆级芯片 推理 OpenAI 英伟达

投融资 5月9日

中国AI"包工头"模式：最大AI包工头要上市了

中国最大AI"包工头"公司（为其他企业提供AI模型调用和定制服务，轻资产模式）启动IPO。当算力需求持续高速增长，企业面临"继续做轻资产包工头"还是"逐步走向重资产开发商"的战略选择。这一模式引发关于AI产业分工深化的广泛讨论。 关键词：AI包工头 轻资产 IPO 算力 产业分工

🌐 行业 12 条

行业 5月8日

OpenAI权力斗争公开化：前CTO Mira Murati当庭作证指控奥特曼

OpenAI权力斗争全面公开化。前CTO Mira Murati在法庭作证时称，CEO Sam Altman曾在模型安全审批问题上误导她，并长期在管理层中制造"混乱与不信任"。Murati的证词揭示了OpenAI从"非营利理想"到"商业化巨头"转型过程中的内部裂痕，引发企业客户对OpenAI治理稳定性的广泛担忧。 关键词：OpenAI Mira Murati Sam Altman 权力斗争 安全审批

行业 5月9日

xAI解散后续：马斯克"用造火箭的方法重造AI公司"

马斯克宣布xAI不再独立存在、并入SpaceX AI后，进一步披露其"重造AI公司"的新方案：完全抛弃传统AI公司"模型训练→API售卖"模式，转而采用类似SpaceX"快速迭代、接受失败、极限压缩成本"的航天工程方法。马斯克称："Grok败给了ChatGPT，但下一次我不会用同样的方法。" 关键词：xAI 马斯克 SpaceX AI 重造AI 火箭方法

行业 5月8日

Anthropic最新研究：撬开大模型黑箱，隐藏动机发现率提升4倍

Anthropic发布最新可解释性研究论文，通过"自然语言自动编码器"（Natural Language Autoencoders）技术，将Claude的神经网络激活信号直接翻译为人类可读文本，使隐藏动机发现率提升4倍以上。该技术已在Claude的"思维链"分析中应用，能判断AI"到底在想什么、知道什么、隐瞒什么"，是AI可解释性研究的重大突破。 关键词：Anthropic 可解释性 黑箱 自然语言自编码器 4倍提升

行业 5月8日

AGI之路可能从一开始就走错了？

腾讯研究院深度评论指出，当前主流AGI研究路径（更大模型、更多数据、更强算力）是在"模拟人类智能的外在表现"，而非"理解智能的本质机制"。文章主张"从认知科学出发"的AGI路径，并认为AI工具的普及让普通人也能参与AGI讨论——"这张牌第一次被交到了普通家庭自己手里"。 关键词：AGI 研究路径 认知科学 智能本质 普通家庭

行业 5月8日

AI规则怪谈：ChatGPT代码里写着"永远不要讨论哥布林"

网友在ChatGPT的Web前端代码中发现了隐藏的"规则怪谈"：系统提示词中包含"永远不要讨论哥布林、小魔怪、浣熊、巨魔、食人魔、鸽子，以及其他动物或生物，除非与用户需求绝对且毫无疑问地相关"。这一发现引发关于AI系统提示词工程、隐藏规则、以及"表面行为vs底层指令"的广泛讨论。 关键词：ChatGPT 系统提示词 规则怪谈 隐藏规则 哥布林

行业 5月9日

"算力通胀"揭秘：为什么你用AI越来越便宜，算力公司却越来越赚钱？

BT财经深度报道揭示"算力通胀"现象：终端用户使用的AI服务价格持续下降（DeepSeek等低价模型推动），但算力公司（NVIDIA、云服务商）的利润率却在持续上升。核心原因是"规模效应"：算力成本下降速度慢于AI服务价格下降速度，中间差价被算力供应商获取。这不是"你用AI越来越便宜"，而是"有人正在悄悄转移算力账单"。 关键词：算力通胀 Token成本 规模效应 NVIDIA 利润

行业 5月8日

18岁高中生用AI挖出150万未知天体：首批ChatGPT原住民毕业

OpenAI发布首届"ChatGPT Futures Class of 2026"，26位入选者正在用AI改写"优秀年轻人"的定义。其中一位18岁高中生用AI辅助天文数据分析，挖出150万颗此前未被记录的天体。这标志着"AI原住民"（从小与AI共同成长的一代）正式登上历史舞台。 关键词：ChatGPT原住民 18岁 150万天体 AI教育 Futures Class

行业 5月8日

英伟达重新思考AI TCO：Token成本是唯一重要指标

英伟达在AI早报中提出新视角：AI TCO（总拥有成本）的核心是每Token成本，而非硬件采购价格。随着推理需求爆发，成本效率正在成为客户选择基础设施的首要考量因素。这一观点与英伟达推动推理优化（TensorRT-LLM、NVIDIA NIM）的战略高度一致。 关键词：英伟达 TCO Token成本 推理 优化

行业 5月8日

中美AI差距缩至2.7%：但"追赶"不等于"并跑"

最新报告显示中美AI能力差距已缩至2.7%，但深入分析指出"差距缩小"不等于"并跑"。中国在应用落地、用户规模、数据获取上有优势；美国在基础模型创新、芯片生态、全球人才吸引上仍领先。"缩小差距"靠"跟随策略"，而要"并跑甚至领跑"需要"原创突破"，这正是中国AI当前最薄弱的环节。 关键词：中美AI 2.7% 差距缩小 跟随策略 原创突破

行业 5月8日

AI安全新范式：培育AI的安全本能而非"上锁"

人工智能安全研究者提出新范式：AI安全不应依赖"上锁"（外部约束、规则限制），而应培育AI的"安全本能"——通过基因（训练时对齐）、监督（运行时监控）、进化（持续自我校正）三层机制，让安全行为边界内化为AI的"本能反应"。这一范式转变被认为是实现真正安全AGI的必经之路。 关键词：AI安全 安全本能 价值观对齐 三层机制 AGI安全

行业 5月8日

首批ChatGPT Futures Class：AI原住民的崛起

OpenAI评选的首届"ChatGPT Futures Class of 2026"共26人，年龄跨度从14岁到30岁，覆盖科研、艺术、创业、公益等各个领域。他们共同的特点是：不以"使用AI工具"为荣，而是将AI视为"思维的自然延伸"。这一代人的崛起将从根本上重塑"人机关系"的定义。 关键词：ChatGPT Futures Class AI原住民 人机关系 新一代

行业 5月9日

"横漂"消亡史：有人用AI，500块买走他们的脸

横店群众演员（"横漂"）群体正被AI快速替代。制片方用AI生成人脸和表演，成本仅500元/角色，远低于真实群演的薪酬。这标志着AI对"创意型低端劳动"的替代正式开始，也引发了关于"人类表演者价值"和"AI生成内容版权"的深层讨论。 关键词：横漂 AI替代 群众演员 版权 创意劳动