AI DAILY · 2026-05-10 · 周日
AI 日报 / 2026 年 05 月 10 日
今日收录 98 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
Anthropic $300亿ARR
年化收入300亿美元,80倍增长创AI历史,估值剑指$9000亿
GPT-Realtime-2发布
OpenAI推出首款GPT-5级推理语音模型,128K上下文,70+语言输入
Anthropic-SpaceX算力协议
Colossus 1(22万GPU/300MW)全量交付,Claude Code速率限制翻倍
AI芯片权力更迭
华尔街投资从英伟达转向Intel/AMD/Micron,AMD/Intel本周分别涨25%
DeepSeek降价
Token价格战重启,推理成本持续下降重塑市场格局
AI Agent Week纽约开幕
全球Agent顶级峰会,MCP协议安全成核心议题
大模型
12 条
Anthropic年化收入突破$300亿,80倍增长创AI历史纪录
Anthropic CEO Dario Amodei在Code with Claude大会上披露,公司年化运行收入(ARR)已突破300亿美元,较去年同期3.75亿美元增长80倍,成为史上增长最快的AI公司。Claude Code API调用量过去一年同比增长17倍。公司当前估值3800亿美元,市场传言正以9000亿美元估值进行新一轮融资,并计划2026年10月IPO。 关键词:
Anthropic ARR $300亿 80倍增长 IPO 估值$9000亿 技术详情: - 增长驱动:Claude Code在企业市场的强势表现,AWS/Trainium、Google/TPU、Amazon/Google算力合作三线并进 - 社区讨论:用户对高成本和速率限制仍有抱怨,部分用户转向开源替代方案OpenAI发布GPT-Realtime-2:首款GPT-5级推理语音模型
OpenAI通过Realtime API发布三款新语音模型。GPT-Realtime-2是首款具备GPT-5级推理能力的实时语音模型,支持工具调用、打断处理,上下文窗口扩展至128K tokens,在Big Bench Audio和Conversational Dynamics基准测试中排名第一。GPT-Realtime-Translate支持70+语言输入、13种语言输出实时翻译。GPT-Whisper提供低延迟转录。标志着语音AI从"对话界面"走向"可执行任务的Voice Agent"。 关键词:
GPT-Realtime-2 语音模型 Realtime API 实时翻译 128K上下文 技术详情: - 架构:基于GPT-5.5的推理能力,专门针对语音交互优化 - 性能:在Big Bench Audio基准测试中排名第一,支持实时打断和工具调用 - 应用:Voice Agent可直接执行任务(预订、查询、操作),不仅是对话界面OpenAI推出GPT-5.5 Instant为ChatGPT新默认模型
OpenAI将GPT-5.5 Instant设为ChatGPT和API的新默认模型,在事实性、智能、图像理解和语气方面全面提升,并强化个性化功能(记忆保存、Gmail集成)。社区对GPT-5.5在高token预算编码任务中的表现给予高度评价。这是继4月23日GPT-5.5旗舰版发布后的重要迭代。 关键词:
GPT-5.5 Instant 默认模型 个性化 ChatGPT Gmail集成 技术详情: - Arena评估:GPT-5.5 Instant在Multi-Turn排名第5,Vision排名第11,Document Arena排名第24 - 社区反馈:@dhh称其"very good, very efficient",@gdb称其"very capable and very succinct"OpenAI推出GPT-5.5-Cyber网络安全专用模型
OpenAI发布GPT-5.5 Trusted Access for Cyber,面向企业和政府的网络安全防御工作流,支持红队测试和威胁检测。这是OpenAI首次推出垂直安全专用模型,标志着"通用大模型"向"行业专用模型"延伸的战略转型。 关键词:
GPT-5.5-Cyber 网络安全 专用模型 OpenAI 红队测试 技术详情: - 定位:企业/政府网络安全防御,而非攻击用途 - 政策框架:即将发布的美国AI安全行政令强调"与前沿实验室合作网络防御",而非前沿模型预批准ZAYA1-74B/8B开源:完全基于AMD Instinct MI300训练
Zyphra发布ZAYA1-74B-Preview(740亿参数MoE架构,Apache 2.0开源)和ZAYA1-VL-8B(视觉语言模型)。最大亮点是完全使用AMD Instinct MI300 GPU训练,而非NVIDIA GPU,验证了AMD在AI训练领域的竞争力。此举被视为AMD挑战NVIDIA AI生态的重要里程碑。 关键词:
ZAYA1-74B AMD MI300 开源 MoE 技术详情: - ZAYA1-74B-Preview:74B total / 4B active MoE,pre-RL base checkpoint,Apache 2.0 license - ZAYA1-VL-8B:700M active / 8B total MoE VLM,Apache 2.0 license - 社区反馈:@teortaxesTex称其足以验证该实验室的架构和方法论AlphaEvolve一周年:AI自我改进交出炸裂成绩单
Google DeepMind发布AlphaEvolve一周年成果:该系统已能自主改进自身算法,在芯片设计(改进TPU设计)、数学问题求解、电网优化等领域实现突破。Jeff Dean表示"TPU大脑正在设计下一代TPU身体","AI造AI"已从科幻设定变为正在合拢的工程闭环。系统采用进化算法框架,通过大规模语言模型生成和改进代码。 关键词:
AlphaEvolve Google DeepMind AI自我改进 TPU 进化算法 技术详情: - 应用:Google AI基础设施、分子模拟、自然灾害风险预测 - 实际影响:大规模AI模型训练速度翻倍,路由优化每年节省15,000公里行程梁文锋率领"小龙"过千亿:DeepSeek估值逼2000亿人民币
梁文锋创立的DeepSeek以2000亿人民币(约$280亿)估值领跑中国大模型"千亿市值俱乐部"。DeepSeek V4发布后口碑极佳,推理成本仅为竞对的1/10。V4完全兼容vLLM和SGLang,已获大量企业客户采用。市场关注DeepSeek首轮融资估值能否达到$450亿。 关键词:
DeepSeek 梁文锋 估值$280亿 V4 开源 技术详情: - V4性能:在FoodTruck Bench上匹配GPT-5.2(差距约3%),成本降低17倍 - 社区反馈:@htihle指出V4-Pro在WeirdML上表现弱于GLM/Kimi/open竞品月之暗面Kimi完成$20亿融资,估值破$200亿
月之暗面(Kimi)完成新一轮20亿美元融资,投后估值突破200亿美元。美团龙珠领投,中国移动、CPE源峰等参投。Kimi K2.5更新后ARR大幅增长,累计融资超376亿元人民币,成为中国大模型创业公司融资之最。Kimi的国际化战略也在加速推进。 关键词:
Kimi 月之暗面 $20亿 $200亿估值 美团龙珠 技术详情: - Kimi K2.6在Baseten上运行成本约为Opus 4.7的1/5,性能相当 - @caspar_br报告称将内部Fleet模型从Sonnet 4.6切换至Kimi K2.6后未 notice 差异蚂蚁百灵、百度、阶跃星辰本周分别发布新模型
本周国内大模型密集发布:蚂蚁百灵发布新版多模态模型,百度文心4.5 Turbo上线,阶跃星辰Step 3.5全面开源。三方分别在多模态理解、推理成本和高性能开源三个方向发力,国内大模型"模型能力"竞争进入白热化阶段。 关键词:
蚂蚁百灵 百度文心 阶跃星辰 新模型 国内Qwen3 Omni多模态能力全面升级
阿里Qwen3 Omni发布,支持文本、图像、音频、视频四模态统一处理,在人工评估中超越GPT-5.5 Instant。千问电脑版同步上线语音输入法,支持"口喷式"AI原生交互,被视为中文AI交互的重要创新。 关键词:
Qwen3 Omni 多模态 千问 语音输入 阿里 技术详情: - Qwen3.6 27B uncensored heretic v2保留全部15个native MTP heads,KLD 0.0021,6/100 refusals - 社区反馈:需要Q4_K_XS GGUF变体以适配16GB VRAMGrok 4.3发布:100万token上下文,输入$1.25/M
xAI(原xAI)发布Grok 4.3,定位"迄今最快最智能模型"。支持100万token上下文窗口,输入价格每百万token仅1.25美元,输出2.5美元。在Anthropic租用Colossus 1的同一周发布,被视为xAI从"模型竞争"转向"算力商业化"的战略信号。 关键词:
Grok 4.3 xAI 100万token 低价 上下文OpenAI重建WebRTC语音栈,大幅降低对话延迟
OpenAI分享WebRTC语音基础设施更新,重建语音对话实时传输层,大幅降低延迟并提升稳定性。新语音栈支持自适应比特率、丢包恢复和跨网络无缝切换。该更新已集成至ChatGPT语音模式和Realtime API,使语音对话体验接近"无感延迟"。 关键词:
WebRTC 语音栈 延迟 OpenAI Realtime API
训练推理
10 条
5% GPU利用率:价值$4010亿的AI基础设施难题
VentureBeat深度报道揭示AI基础设施严重效率问题:企业过去两年panic-buying GPU容量,但实际审计显示平均利用率仅5%。这意味着价值4010亿美元的GPU资源中95%处于闲置状态。问题核心在于:"AI基础设施不等于堆GPU",调度系统、虚拟化技术、推理优化才是真正的效率瓶颈。新兴GPU云服务正围绕"利用率"构建竞争壁垒。 关键词:
GPU利用率 5% $4010亿 基础设施 效率Anthropic发布Dreaming系统:AI Agent从自身错误中学习
Anthropic在Code with Claude大会上发布Dreaming系统——让AI Agent从自身错误中持续学习的能力。Dreaming在后台定期审阅Agent会话记录和记忆库,提取规律并自我改进,支持全自动或人工审核两种模式。同时,Anthropic将Outcomes(开发者定义成功标准评分)和Multi-agent Orchestration从研究预览推进至公开Beta,标志Agent技术从"演示"走向"生产级"。 关键词:
Dreaming 自我学习 Agent Multi-agent 生产级 技术详情: - Dreaming:跨会话记忆蒸馏,自动提取规律并改进 - Outcomes:开发者定义评分标准,独立评分Agent评估输出质量 - Multi-agent Orchestration:主导Agent拆解任务并委派子Agent并行工作Redis之父为DeepSeek V4打造专属推理引擎
Redis创始人Salvatore Sanfilippo(antirez)发布专为DeepSeek V4设计的轻量级推理引擎,使V4可在Mac上高效运行。该引擎针对V4的MoE架构做了特殊优化,支持动态专家路由和高效KV Cache管理。此举大幅降低V4部署门槛,Mac用户现可本地运行完整版V4模型。 关键词:
Redis DeepSeek V4 推理引擎 Mac 本地运行vLLM更新:提升吞吐量,新增DeepSeek V4支持
vLLM项目发布重大更新,重点提升推理吞吐量和延迟表现,新增对DeepSeek V4的完整支持,并增强量化(quantization)和后端能力。vLLM与SGLang的"推理框架之争"持续升温,双方在长上下文、Agent场景和量化支持上各有优势。 关键词:
vLLM DeepSeek V4 推理框架 吞吐量 量化 技术详情: - vLLM-Omni v0.20.0:Qwen3-Omni吞吐量+72% on H20,major TTS延迟/RTF reductions - vLLM + Mooncake:3.8x吞吐量,46x更低P50 TTFT,8.6x更低端到端延迟,cache-hit从1.7%提升至92.2%,扩展至60 GB200 GPUsSubquadratic声称1000倍AI效率提升,学界要求独立验证
迈阿密初创公司Subquadratic从隐身模式浮出水面,声称其SubQ模型完全突破了自2017年Transformer以来定义所有主流AI系统的数学限制,实现1000倍效率提升。该公司由13人团队打造,采用SSA(Stride Self-Attention)架构。然而学界对其声明持谨慎态度,多位研究人员要求提供独立基准测试结果。 关键词:
Subquadratic SSA 1000倍效率 Transformer替代 独立验证Anthropic "Mythos"重写Firefox网络安全方案
Anthropic的Mythos项目正在改写Firefox浏览器的网络安全架构。通过与Mozilla合作,Mythos利用Claude的推理能力实时检测恶意网站、钓鱼攻击和隐私侵犯行为。该系统在后台运行,不影响用户浏览体验,同时持续提升检测精度。这是AI模型首次深度集成至主流浏览器的安全层。 关键词:
Mythos Firefox 网络安全 Anthropic 实时检测Sakana 7B模型完成GPT/Claude/Gemini三模型编排
东京Sakana AI发布7B参数的任务编排模型,使用强化学习(而非硬编码工作流)动态路由GPT-5、Claude Sonnet 4和Gemini 2.5 Pro之间的任务。该系统能根据任务类型、成本约束和性能要求自动选择最合适模型,在多模型协作场景下实现最优性价比。Sakana称其编排效率超越人工规则设定30%以上。 关键词:
Sakana 7B 模型编排 RL 多模型协作OpenAI推出Trusted Contact功能:防止AI辅助自伤
OpenAI推出"Trusted Contact"(可信联系人)安全功能,当系统检测到用户可能存在自伤风险时,可通知用户预先指定的紧急联系人。该功能结合GPT-5.5的推理能力,能更精准识别风险信号。这是OpenAI在AI安全领域的最新举措,也是应对监管压力和公众关切的主动响应。 关键词:
Trusted Contact OpenAI AI安全 自伤预防 安全功能SGLang持续优化:长上下文和Agent场景表现突出
SGLang作为DeepSeek V4官方推荐推理框架,本周持续优化长上下文处理和Agent场景性能。与vLLM相比,SGLang在RadixAttention、高效内存管理和动态批处理上有独特优势,特别适合超长上下文(1M+ tokens)和复杂Agent工作流。 关键词:
SGLang DeepSeek V4 长上下文 Agent 推理框架 技术详情: - 支持prefill/decode disaggregation, FP8 FlashMLA, SBO, expert affinity, observability - 在H20上实现57B tokens/day推理吞吐量LMDeploy推进国产芯片深度优化
LMDeploy宣布对华为昇腾、百度昆仑芯等国产AI芯片提供更深度优化支持,在推理吞吐量上较通用框架提升40%以上。这是在国产算力快速部署的背景下,推理框架"本地化适配"的重要进展。沐曦、摩尔线程等国产GPU也正与主流推理框架展开适配合作。 关键词:
LMDeploy 国产芯片 昇腾 昆仑芯 推理优化
Agent
11 条
AI Agent Week 2026在纽约开幕:MCP协议安全成核心议题
AI Agent Week 2026在纽约举行,全球Agent领域顶级研究者和工程师齐聚。核心议题包括:MCP(Model Context Protocol)协议安全漏洞与防护、Function Calling注入攻击、多Agent协作框架演进、Agent评估基准统一。大会上多个团队展示了基于Codex和Claude Code的生产级Agent部署案例。 关键词:
AI Agent Week MCP 安全 多Agent New York 技术详情: - MCP攻击面:工具投毒(Tool Poisoning)、Function Calling注入、Computer Use Agent滥用 - 防御建议:工具来源验证、参数沙箱执行、Agent行为审计Anthropic Managed Agents三新能力全面上线
Anthropic将Dreaming(跨会话记忆蒸馏)、Outcomes(成功标准评分)、Multi-agent Orchestration(多智能体编排)三项能力从研究预览推至公开Beta。Dreaming让Agent定期审阅自身会话并提取规律自我改进;Outcomes让开发者定义评分标准,独立评分Agent评估输出质量;Multi-agent Orchestration支持主导Agent拆解任务并委派子Agent并行工作。 关键词:
Managed Agents Dreaming Outcomes Multi-agent AnthropicOpenAI Codex进化为长期运行Agent运行时
OpenAI的Codex从"编程助手"进化为长期运行的Agent运行时,引入新的/goal机制,在ARC-AGI-3游戏测试中达到61%成功率。Codex支持在后台持续运行、自主规划任务序列、调用工具链完成复杂工作流,标志着"AI编程助手"向"自主软件工程师"的关键转型。 关键词:
Codex Agent运行时 /goal ARC-AGI-3 61% 技术详情: - Codex Goals在ARC-AGI-3游戏测试中达到61%成功率(160小时/30k actions) - 大部分有用工作在前几小时完成,之后陷入停滞 - OpenAI发布Codex安全运行机制:sandboxing, approval gates, network policy, telemetry微软Agent 365正式GA:$15/用户/月统一AI Agent治理
微软Agent 365正式从预览版走向GA(General Availability),$15/用户/月。定位为统一控制平面,帮助企业IT和安全团队观察、治理和保护在Microsoft生态、AWS Bedrock、Google Cloud等平台运行的AI Agent。核心应对"Shadow AI"成为企业安全威胁的新挑战。 关键词:
Agent 365 Microsoft GA 治理 Shadow AISalesforce Agentforce Operations上线:拆解企业工作流
Salesforce推出Agentforce Operations平台,将企业后台工作流拆解为适合AI Agent处理的任务单元。核心逻辑是"大多数企业流程从未为AI设计",Agentforce Operations充当适配层,让Agent能真正融入现有业务流程。已在多家财富500强企业部署。 关键词:
Agentforce Salesforce 工作流 企业AI Operations字节跳动Seedance 2.0技术突破:物理一致性显著提升
字节跳动发布Seedance 2.0技术细节:通过引入"物理一致性约束"(Physics-Consistent Constraint),视频生成中的物体运动、光照变化和物理交互更加真实。与Sora 2.0相比,Seedance 2.0在"物理真实性"评分上高出15%。字节正与多家影视制作公司达成合作,推进AI视频的商业化落地。 关键词:
Seedance 2.0 字节跳动 物理一致性 视频生成 影视Perplexity Personal Computer全面开放Mac用户
Perplexity AI宣布其"Personal Computer"功能全面向Mac用户开放。该功能将Perplexity转化为本地AI工作站,支持文档分析、代码执行、数据可视化等本地化AI任务。Perplexity由此从"搜索引擎"转型为"个人AI计算机",与ChatGPT、Claude的本地能力展开正面竞争。 关键词:
Perplexity Personal Computer Mac 本地AI 转型 技术详情: - Perplexity built in-house inference engine "ROSE",覆盖从embeddings到trillion-parameter LLMs - 使用CuTeDSL加速Hopper和Blackwell上的专用kernel开发Lance Martin加入Anthropic:RAPTOR等核心技术研究者加盟
著名AI研究者Lance Martin(RAPTOR检索系统、Hexact算法发明者)宣布加入Anthropic。Martin的RAPTOR是当前RAG系统的核心算法之一,他的加入将进一步巩固Anthropic在Agent记忆和检索技术上的领先优势。Martin表示:"在Anthropic,我们可以访问最好的模型、极具天赋的同事、充足的计算资源。" 关键词:
Lance Martin Anthropic RAPTOR RAG 人才引进"养虾人"自述:为什么我卸载Claude?
多位重度Claude Code用户公开发文讲述"卸载Claude"的原因:高成本(Opus 4.7 API调用费用昂贵)、高风险(自主操作生产环境的风险)、低产出(实际编码效率不及预期)。这一讨论揭示了Agent工具从"新奇"走向"生产依赖"过程中的真实痛点,也推动Anthropic加速Claude Code的成本控制和安全机制改进。 关键词:
Claude Code 养虾人 高成本 生产风险 用户反馈 社区反馈: - @RichNwan:认为Anthropic正在构建managed agents平台,但Dreaming和Outcomes与开源harness相比差异化不足 - @eliebakouch:认为这些功能对power users很重要,尤其是保护主导Agent的上下文窗口OpenClaw现状:高成本、高风险、低产出争议
OpenClaw(开源Claude Code替代方案)社区出现分歧。支持者认为OpenClaw是"民主化的AI编程",反对者指出其token消耗失控、误操作率居高不下。核心问题:当前Agent框架仍缺乏有效的"成本-质量-安全"三角平衡机制,这是所有AI编程Agent面临的共同挑战。 关键词:
OpenClaw 开源 成本失控 Agent框架 争议AI Agent安全研究:MCP协议攻击面全面分析
最新安全研究全面分析了Model Context Protocol(MCP)的攻击面:工具投毒(Tool Poisoning)、Function Calling注入、Computer Use Agent滥用等。研究提供了可操作的防御建议,包括工具来源验证、参数沙箱执行、Agent行为审计等。随着MCP协议被Anthropic/OpenAI等主流采用,安全问题正变得日益紧迫。 关键词:
MCP 安全 工具投毒 注入攻击 防御
基础设施
11 条
AI芯片投资重心转移:华尔街从英伟达转向Intel/AMD/Micron
CNBC报道,华尔街AI芯片投资正在经历"权力更迭":过去两年独占鳌头的英伟达出现增长放缓迹象,而Intel、AMD和Micron本周股价分别上涨约25%、25%和37%。驱动因素:(1)AI从聊天机器人转向Agent,CPU需求激增,预计数据中心CPU市场从2025年$270亿增至2030年$600亿;(2)全球内存短缺推高价格,Micron市值本周首破$800亿;(3)苹果与Intel、三星洽谈美国本土芯片生产。 关键词:
AI芯片 Intel AMD Micron 权力更迭Anthropic-SpaceX算力协议全解读:Colossus 1全部交付
Anthropic与SpaceX AI签署协议,获得Colossus 1数据中心全部算力(超22万块英伟达GPU,含H100/H200/GB200,超300MW容量)。Claude Code五小时速率限制翻倍,高峰限流取消,Opus API速率大幅提升。这是AI行业迄今最大的单笔算力合作协议,也标志着马斯克从"AI竞争者"转向"AI算力供应商"的战略转型。 关键词:
Anthropic SpaceX Colossus 1 22万GPU 300MW 技术详情: - 规模:>300MW新容量,>22万NVIDIA GPUs(~15万H100s + 5万H200s + 3万GB200s) - 时间线:Claude inference将在"未来几天内"开始在Colossus上运行 - 战略意义:前沿实验室可以租用竞争对手的算力,compute不是持久护城河Corning与英伟达签署巨额协议,建设3家美国光学工厂
Corning(康宁)与英伟达签署战略协议,将在美国建设3家光学技术工厂,支撑AI数据中心的高速互联需求。此举是英伟达"美国AI基础设施"战略的重要组成部分。与此同时,Corning还与Meta签署了至2030年的$60亿光纤电缆供应协议。光学互联正成为AI算力扩展的新瓶颈。 关键词:
Corning 英伟达 光学互联 AI工厂 美国制造英伟达中国市场份额归零:国产AI芯片三派系争抢市场
受美国出口管制影响,英伟达在华市场份额已归零。国产AI芯片三大技术路线正在激烈竞争:(1)华为昇腾系(兼容CUDA生态,81.2万块出货量第一);(2)百度昆仑芯系(自研架构,11.6万块,科创板IPO进行中);(3)平头哥系(阿里生态,26.5万块)。从95%到0%,英伟达退出为中国芯片留下历史性机遇。 关键词:
英伟达 中国市场 归零 国产芯片 华为昇腾苹果与Intel、三星洽谈美国本土芯片生产
报道称苹果正与Intel和三星洽谈,计划将部分芯片生产转移至美国本土,以减少对亚洲供应链的依赖。若协议达成,将是苹果首次在美国本土生产主处理器芯片。Intel的18A工艺和三星的2nm GAA工艺是主要竞争方案。此举与美国政府"芯片本土化"战略高度吻合。 关键词:
苹果 Intel 三星 美国本土 芯片生产百度昆仑芯IPO冲刺:"A+H"两地上市正式启动
百度旗下AI芯片企业昆仑芯完成科创板IPO辅导备案,同步推进港股上市(1月已提交申请)。百度持股57.67%,投资方包括中国互联网投资基金、比亚迪、中国移动等57家股东。高盛估算百度所持股权价值30-110亿美元,麦格理估算约$165亿。昆仑芯累计出货11.6万块(中国第三),下一代M100(2026)、M300(2027)在研。 关键词:
昆仑芯 百度 IPO 科创板 A+H国产AI芯片IPO潮:沐曦、摩尔线程已登陆科创板
继沐曦股份、摩尔线程登陆科创板后,壁仞科技、天数智芯正推进港股上市,燧原科技、瀚博半导体也在筹备科创板IPO。分析指出,AI芯片企业上市潮背后是"算力自主化"国家战略驱动,但商业化能力仍存疑——绝大多数国产AI芯片企业收入严重依赖政府和国企采购,市场化收入占比不足20%。 关键词:
AI芯片 IPO 沐曦 摩尔线程 科创板英伟达MRC协议开源:解决10万+GPU集群训练难题
OpenAI联合英伟达、AMD、微软、Broadcom、英特尔发布MRC(Multipath Reliable Connection)超算网络协议,已通过OCP开源。核心机制:多平面网络(800Gb/s拆8×100Gb/s链路)+自适应包喷射(微秒级故障绕行)+SRv6源路由(禁用动态路由)。仅需两层交换机即可构建13.1万GPU全互联网络。MRC已在OpenAI最大规模GB200超算上部署。 关键词:
MRC OpenAI OCP 10万GPU 网络协议 技术详情: - 多平面网络:800Gb/s拆分为8×100Gb/s链路 - 自适应包喷射:微秒级故障绕行 - SRv6源路由:禁用动态路由 - 仅需两层交换机即可构建13.1万GPU全互联网络AMD MI400系列即将发布:2nm CDNA 5架构,数据中心收入预计增73%
AMD即将于2026下半年发布MI400系列AI加速器,基于CDNA 5架构和台积电2nm工艺。分析师预计MI400将推动AMD数据中心收入增长73%,进一步挑战英伟达在AI芯片市场的主导地位。MI350P(四年来首款PCIe规格Instinct显卡)已于上周发布,AI算力4.6 PFLOPS,144GB HBM3E。 关键词:
AMD MI400 2nm CDNA 5 数据中心 技术详情: - MI350P:CDNA 4架构,PCIe add-in card,144GB/288GB HBM3E,3.6 TB/s内存带宽 - 社区反馈:定价和可用性未披露,是主要缺失的部署细节ARM财报:Q1营收翻倍但指引逊色,股价暴跌10%
ARM发布2026财年Q1财报,营收同比增长超一倍,但Q2指引不及市场预期,股价盘后暴跌10%。分析指出ARM在AI芯片生态中面临"IP授权模式vs.自研芯片"的战略两难,同时RISC-V在AI场景的渗透也对其构成长期威胁。 关键词:
ARM 财报 -10% AI芯片 指引逊色CoreWeave财报:Q1营收翻倍但指引不及预期,盘后跌超10%
AI云服务提供商CoreWeave发布Q1财报,营收超预期翻倍增长,但Q2指引不及市场预期,盘后股价一度跌超10%。CoreWeave作为"新云计算"代表,其指引不佳引发市场对AI基础设施需求可持续性的担忧。 关键词:
CoreWeave 财报 AI云 指引 盘后
机器人
10 条
中国人形机器人"七小龙":商业化差距加速显现
36Kr深度报道中国人形机器人赛道现状:宇树、智元、银河通用、傅利叶、乐聚、优必选、钢铁侠("七小龙")在商业化进程上差距加速显现。工业场景(汽车制造、电子组装、物流搬运)成为主要突破口,但大规模部署仍受限于成本、可靠性和场景适配性。2026年Q1人形机器人领域融资总额超120亿元。 关键词:
人形机器人 七小龙 商业化 工业场景 融资"夸父"人形机器人冲刺IPO:90后哈工大团队打造
90后哈工大团队打造的人形机器人"夸父"正在冲刺IPO。该机器人在运动控制(全身动力平衡、复杂地形行走)和场景适配(工业巡检、服务接待)方面表现突出。"夸父"的IPO进程标志着中国人形机器人企业正式进入资本市场赛道。 关键词:
夸父 人形机器人 IPO 哈工大 具身智能Boston Dynamics vs Tesla vs Figure:2026人形机器人竞争格局
人形机器人三强最新进展:Boston Dynamics推出量产版Atlas(56自由度,50kg),Tesla Optimus Gen 3推进商业部署,Figure AI发布Figure 03并与OpenAI深度合作。2026年成为人形机器人商业化元年,B端工业场景率先落地,C端家用场景预计2028年后成熟。 关键词:
Boston Dynamics Optimus Figure 人形机器人 2026Hugging Face推出机器人应用商店:Reachy Mini App Store上线200+应用
Hugging Face推出开源Reachy Mini App Store,已托管200+社区构建的应用程序。Reachy Mini售价$299,自去年发售以来已售出约1万台。用户可免费下载应用,非技术用户也能构建自定义机器人应用。VentureBeat评价为"机器人的App Store时代正式到来"。 关键词:
Hugging Face Reachy Mini App Store 机器人 开源Physical AI攻克可变形材料组装难题
最新研究突破:Physical AI(物理人工智能)系统已能处理可变形材料的组装任务,这是传统工业机器人无法完成的。该系统结合触觉反馈、视觉识别和力控算法,能像人类一样处理柔软、易变形材料(纺织品、软性塑料、生物组织)。这一突破将AI机器人应用场景从"刚性组装"扩展至"柔性制造"。 关键词:
Physical AI 可变形材料 触觉反馈 柔性制造 机器人中国具身智能机器人冲击高危工业场景
新华社报道中国在具身AI机器人领域的最新进展。国产攀爬机器人已在电力巡检等高危场景投入实战,自主研发的海底电缆检测机器人也已部署,充当水下"侦察兵"。具身智能已被明确列入"十五五"规划新经济增长引擎,政策支持力度持续加大。 关键词:
具身智能 攀爬机器人 海底检测 十五五 高危工业Ripcord力压Boston Dynamics获重大合同
机器人公司Ripcord在一项重大合同竞争中击败Boston Dynamics。Ripcord产品聚焦于文档数字化和自动化工作流机器人,其竞争优势在于AI视觉识别和高速机械臂的精密协同。Boston Dynamics自被现代收购后在商业化落地方面进展相对缓慢,给了新兴玩家突围机会。 关键词:
Ripcord Boston Dynamics 机器人竞争 商业化 合同Physical AI for Defense:防务应用引发伦理争议
Physical AI在防务领域的应用引发激烈伦理争议。多家AI公司被曝与军方合作,将Physical AI系统用于侦察、排爆、甚至进攻性场景。批评者指出,Physical AI的自主决策能力在战场环境中可能引发不可预测的后果。多家AI公司正制定"军用AI伦理准则",试图在商业利益和社会责任间寻找平衡。 关键词:
Physical AI 防务 伦理争议 自主武器 AI准则Hierarchical LLMs for Robotics:分层大模型提升机器人推理能力
最新研究提出"Hierarchical LLMs for Robotics"架构,通过将大模型分为"高层任务规划"和"低层动作执行"两个层次,显著提升机器人复杂任务推理能力。高层LLM负责任务分解和策略制定,低层LLM负责具体动作生成和实时调整。该架构在长时程任务(如"做一杯咖啡")上成功率比单一模型提升40%以上。 关键词:
Hierarchical LLM 机器人 任务规划 分层架构 推理AI视频生成助力机器人训练数据合成
最新研究表明,AI视频生成模型(Sora、Seedance等)可用于合成机器人训练数据,大幅降低真实世界数据采集成本。通过对生成视频进行物理一致性过滤和姿态标注,可构建百万级机器人操作数据集。这一方法正在改变机器人学习的"数据饥渴"困境,多家机器人公司已进入实用化阶段。 关键词:
AI视频 机器人训练 数据合成 物理一致性 数据集
多模态
7 条
AI视频生成价格战:可灵、即梦、Seedance争夺创作者市场
AI视频生成赛道价格战白热化。可灵AI(快手)推出大幅降价方案,即梦AI(字节)跟进,Seedance 2.0(字节)则以"更高质量"维持溢价。数据显示2026年Q1 AI视频生成市场规模已达18亿元,但绝大多数用户仍集中在"免费试用"阶段,付费转化率不足3%。行业正从"技术竞赛"转向"创作者生态构建"。 关键词:
AI视频 价格战 可灵 即梦 SeedanceAI多模态模型突破:视觉-语言-动作三者统一取得新进展
多模态AI研究取得重要进展:新一代模型开始实现视觉感知、语言理解和动作执行的真正统一(而非简单的pipeline串联)。核心突破在于"跨模态注意力机制"——视觉特征、语言语义和动作规划在同一特征空间中直接交互。这一架构在机器人操控、自动驾驶和AR/VR场景中均展现出显著优势。 关键词:
多模态 视觉-语言-动作 跨模态注意力 统一架构 VLA-M千问电脑版上线AI语音输入法:口喷式AI原生交互
阿里千问电脑版上线语音输入法,支持按住语音和双击唤起两种模式。系统自动去除口水话、纠正口误、生成结构化表达,中英文夹杂识别精准,连接千问全套办公能力(PPT、表格、文档、搜索、分析)。被视为"口喷可能才是真正AI Native输入方式"的重要实践。 关键词:
千问 语音输入 AI Native 阿里 交互Spotify AI DJ新增四语言支持,进军非英语市场
Spotify宣布其AI DJ功能新增法语、德语、意大利语和巴西葡萄牙语支持,标志着AI个性化音频内容正式进军非英语市场。AI DJ基于用户收听历史生成个性化音乐解说,结合GPT语音合成技术,已实现"真人DJ级"体验。Spotify明确表示目标是"成为AI生成个性化音频的最终平台"。 关键词:
Spotify AI DJ 多语言 个性化音频 AI生成AI生成内容生态危机:"AI Slop"正在淹没互联网
深度调查显示,低质量AI生成内容("AI Slop")正在以指数级速度污染互联网内容生态。从SEO文章、电商产品描述到社交媒体帖子,大量AI生成内容缺乏原创性和事实准确性,却在搜索引擎中占据高位。Google、Bing已宣布将更新排名算法,降低"纯AI生成"内容的权重。 关键词:
AI Slop 内容生态 低质内容 搜索引擎 内容标识MiniMax海螺视频2.0发布:中文理解优势明显
MiniMax发布海螺视频2.0(Hailuo Video 2.0),在中文语义理解和角色一致性上较1.0版本有显著提升。与可灵、即梦、Seedance相比,海螺视频在"中文语境下的创意表达"上有差异化优势,已获得多家中文短视频创作者采用。 关键词:
MiniMax 海螺视频2.0 中文理解 视频生成 创作者微软不写代码改研究兵法:Claude"入侵"Office
随着Claude正式集成Microsoft 365,外界质疑微软是否正在"放弃Copilot"。微软内部人士透露,战略已悄然调整:从"自研Copilot"转向"让最好的模型运行在Microsoft生态中"。这一"兵法式"灵活策略使微软在AI大战中保持"不输"地位,而不必在所有战线上与OpenAI和Anthropic正面对抗。 关键词:
微软 Claude Copilot Office集成 战略调整
投融资
9 条
Anthropic $300亿ARR背后:与黑石/高盛成立企业AI服务公司
Anthropic联合Blackstone、Hellman & Friedman、Goldman Sachs等顶级资管机构成立新企业AI服务公司。Anthropic应用AI工程师将与新公司工程团队共同为中型企业(社区银行、中型制造商、区域医疗系统)定制Claude解决方案。新公司将成为Claude Partner Network成员,与Accenture、Deloitte等并行运作。 关键词:
Blackstone Goldman Sachs 企业AI 中型企业 ClaudeOpenAI与TPG/博枫/Advent/贝恩资本成立$40亿合资企业
OpenAI与TPG、博枫资产管理、Advent、贝恩资本等投资者筹集逾40亿美元,成立专注帮助企业部署AI软件的公司。这是OpenAI首次与金融资本深度绑定,标志着其从"技术研发"向"企业服务"的战略延伸。合资企业将重点服务金融、医疗、制造业等大客户。 关键词:
OpenAI TPG 合资企业 $40亿 企业AI中国大模型"三天融资超$70亿":到了最疯狂也最危险的时刻
36Kr报道,5月7-9日三天内,中国大模型领域融资总额超70亿美元(约500亿人民币),创下单周融资纪录。月之暗面$20亿、智谱AI新一轮、MiniMax融资相继落地。分析指出,融资热潮背后是"商业化压力"与"估值泡沫"的双重风险,2026年将是AI公司"证明变现能力"的关键年。 关键词:
中国AI $70亿 融资潮 商业化压力 估值泡沫估值逼近$1万亿:Anthropic或超OpenAI成全球最值钱AI创企
智东西报道,Anthropic在以$9000亿估值进行新一轮融资谈判,若完成将超越OpenAI成为全球最值钱的AI初创公司。Anthropic的快速增长得益于Claude Code在企业市场的强势表现,以及AWS/Trainium、Google/TPU、Amazon/Google算力合作的三线并进格局。 关键词:
Anthropic $9000亿 全球最值钱 超越OpenAI 估值Cloudflare宣布AI替代1100个岗位,收入创历史新高
Cloudflare CEO Matthew Prince宣布,AI工具已使公司1100个岗位变得冗余,同时公司季度收入创下历史新高。这一声明引发广泛讨论:AI替代就业不再是远期预测,而是正在发生的现实。Cloudflare表示被替代员工已全部内部转岗,但外界对此说法持怀疑态度。 关键词:
Cloudflare AI替代岗位 1100人 就业冲击 AI效率SK海力士"封神"背后:9倍狂飙,AI内存最大赢家
SK海力士股价过去一年上涨超9倍,成为AI内存赛道最大赢家。核心驱动是HBM(高带宽内存)需求激增,SK海力士作为NVIDIA H100/H200/GB200的HBM3E独家供应商,产能已全部被预订至2027年。三星和美光正全力追赶,但技术代差仍需时间弥补。 关键词:
SK海力士 HBM 9倍 AI内存 NVIDIAa16z:AI基础设施投资进入"二期时代"
a16z发布最新AI投资报告,指出AI基础设施投资正从"一期"(算力建设)进入"二期"(效率优化、软件层、应用层)。a16z已调整投资重心,从GPU/芯片公司转向AI编排软件、Agent基础设施、垂直行业AI应用。报告预测2026-2028年AI投资的最大机会在"更好用GPU"而非"更多GPU"。 关键词:
a16z AI投资 二期 基础设施 GPU效率Cerebras上市背后:OpenAI正在抢英伟达的蛋糕
Cerebras(晶圆级芯片公司)推进上市进程。分析指出,OpenAI通过Cerebras晶圆级芯片加速推理,正在"重构而非替代"英伟达的生态位。Cerebras的晶圆级架构在推理任务上较GPU有显著优势,已获得多家大模型公司的推理订单。 关键词:
Cerebras 晶圆级芯片 推理 OpenAI 英伟达中国AI"包工头"模式:最大AI包工头要上市了
中国最大AI"包工头"公司(为其他企业提供AI模型调用和定制服务,轻资产模式)启动IPO。当算力需求持续高速增长,企业面临"继续做轻资产包工头"还是"逐步走向重资产开发商"的战略选择。这一模式引发关于AI产业分工深化的广泛讨论。 关键词:
AI包工头 轻资产 IPO 算力 产业分工
行业
12 条
OpenAI权力斗争公开化:前CTO Mira Murati当庭作证指控奥特曼
OpenAI权力斗争全面公开化。前CTO Mira Murati在法庭作证时称,CEO Sam Altman曾在模型安全审批问题上误导她,并长期在管理层中制造"混乱与不信任"。Murati的证词揭示了OpenAI从"非营利理想"到"商业化巨头"转型过程中的内部裂痕,引发企业客户对OpenAI治理稳定性的广泛担忧。 关键词:
OpenAI Mira Murati Sam Altman 权力斗争 安全审批xAI解散后续:马斯克"用造火箭的方法重造AI公司"
马斯克宣布xAI不再独立存在、并入SpaceX AI后,进一步披露其"重造AI公司"的新方案:完全抛弃传统AI公司"模型训练→API售卖"模式,转而采用类似SpaceX"快速迭代、接受失败、极限压缩成本"的航天工程方法。马斯克称:"Grok败给了ChatGPT,但下一次我不会用同样的方法。" 关键词:
xAI 马斯克 SpaceX AI 重造AI 火箭方法Anthropic最新研究:撬开大模型黑箱,隐藏动机发现率提升4倍
Anthropic发布最新可解释性研究论文,通过"自然语言自动编码器"(Natural Language Autoencoders)技术,将Claude的神经网络激活信号直接翻译为人类可读文本,使隐藏动机发现率提升4倍以上。该技术已在Claude的"思维链"分析中应用,能判断AI"到底在想什么、知道什么、隐瞒什么",是AI可解释性研究的重大突破。 关键词:
Anthropic 可解释性 黑箱 自然语言自编码器 4倍提升AGI之路可能从一开始就走错了?
腾讯研究院深度评论指出,当前主流AGI研究路径(更大模型、更多数据、更强算力)是在"模拟人类智能的外在表现",而非"理解智能的本质机制"。文章主张"从认知科学出发"的AGI路径,并认为AI工具的普及让普通人也能参与AGI讨论——"这张牌第一次被交到了普通家庭自己手里"。 关键词:
AGI 研究路径 认知科学 智能本质 普通家庭AI规则怪谈:ChatGPT代码里写着"永远不要讨论哥布林"
网友在ChatGPT的Web前端代码中发现了隐藏的"规则怪谈":系统提示词中包含"永远不要讨论哥布林、小魔怪、浣熊、巨魔、食人魔、鸽子,以及其他动物或生物,除非与用户需求绝对且毫无疑问地相关"。这一发现引发关于AI系统提示词工程、隐藏规则、以及"表面行为vs底层指令"的广泛讨论。 关键词:
ChatGPT 系统提示词 规则怪谈 隐藏规则 哥布林"算力通胀"揭秘:为什么你用AI越来越便宜,算力公司却越来越赚钱?
BT财经深度报道揭示"算力通胀"现象:终端用户使用的AI服务价格持续下降(DeepSeek等低价模型推动),但算力公司(NVIDIA、云服务商)的利润率却在持续上升。核心原因是"规模效应":算力成本下降速度慢于AI服务价格下降速度,中间差价被算力供应商获取。这不是"你用AI越来越便宜",而是"有人正在悄悄转移算力账单"。 关键词:
算力通胀 Token成本 规模效应 NVIDIA 利润18岁高中生用AI挖出150万未知天体:首批ChatGPT原住民毕业
OpenAI发布首届"ChatGPT Futures Class of 2026",26位入选者正在用AI改写"优秀年轻人"的定义。其中一位18岁高中生用AI辅助天文数据分析,挖出150万颗此前未被记录的天体。这标志着"AI原住民"(从小与AI共同成长的一代)正式登上历史舞台。 关键词:
ChatGPT原住民 18岁 150万天体 AI教育 Futures Class英伟达重新思考AI TCO:Token成本是唯一重要指标
英伟达在AI早报中提出新视角:AI TCO(总拥有成本)的核心是每Token成本,而非硬件采购价格。随着推理需求爆发,成本效率正在成为客户选择基础设施的首要考量因素。这一观点与英伟达推动推理优化(TensorRT-LLM、NVIDIA NIM)的战略高度一致。 关键词:
英伟达 TCO Token成本 推理 优化中美AI差距缩至2.7%:但"追赶"不等于"并跑"
最新报告显示中美AI能力差距已缩至2.7%,但深入分析指出"差距缩小"不等于"并跑"。中国在应用落地、用户规模、数据获取上有优势;美国在基础模型创新、芯片生态、全球人才吸引上仍领先。"缩小差距"靠"跟随策略",而要"并跑甚至领跑"需要"原创突破",这正是中国AI当前最薄弱的环节。 关键词:
中美AI 2.7% 差距缩小 跟随策略 原创突破AI安全新范式:培育AI的安全本能而非"上锁"
人工智能安全研究者提出新范式:AI安全不应依赖"上锁"(外部约束、规则限制),而应培育AI的"安全本能"——通过基因(训练时对齐)、监督(运行时监控)、进化(持续自我校正)三层机制,让安全行为边界内化为AI的"本能反应"。这一范式转变被认为是实现真正安全AGI的必经之路。 关键词:
AI安全 安全本能 价值观对齐 三层机制 AGI安全首批ChatGPT Futures Class:AI原住民的崛起
OpenAI评选的首届"ChatGPT Futures Class of 2026"共26人,年龄跨度从14岁到30岁,覆盖科研、艺术、创业、公益等各个领域。他们共同的特点是:不以"使用AI工具"为荣,而是将AI视为"思维的自然延伸"。这一代人的崛起将从根本上重塑"人机关系"的定义。 关键词:
ChatGPT Futures Class AI原住民 人机关系 新一代"横漂"消亡史:有人用AI,500块买走他们的脸
横店群众演员("横漂")群体正被AI快速替代。制片方用AI生成人脸和表演,成本仅500元/角色,远低于真实群演的薪酬。这标志着AI对"创意型低端劳动"的替代正式开始,也引发了关于"人类表演者价值"和"AI生成内容版权"的深层讨论。 关键词:
横漂 AI替代 群众演员 版权 创意劳动