AI技术日报 2026-05-14

AI 日报 · 2026-05-14

GPT-5.6曝光
距5.5发布仅三周，内部代码标识ember-alpha/beacon-alpha，ultrafast模式提2-3倍速
田渊栋创业Recursive Superintelligence
6.5亿美元融资、$46.5亿估值，8位联创含Peter Norvig，黄仁勋苏妈都投了
Cerebras IPO定价$185
超预期区间$150-160，募资$55.5亿，完全稀释估值$564亿
Anthropic年化收入飙至$440亿
三个月估值从$3800亿翻至$9500亿，Claude Code年化$25亿
MiniMax发布Mavis多Agent系统
Leader-Worker-Verifier对抗式架构，上下文隔离+多任务并行
微软洽谈收购Inception
为后OpenAI时代做准备，SpaceX也曾竞标，要价超$10亿
Figure人形机器人8小时自主班次
Helix-02驱动的多机器人协同分拣，人机parity ~3s/package

🧠 大模型 9 条

大模型 5月14日

GPT-5.6曝光：距5.5发布仅三周，OpenAI加速冲刺ASI

GPT-5.5发布仅三周，GPT-5.6已启动内部测试，首批检查点运行中
内部代码标识ember-alpha、beacon-alpha，Codex日志中已出现GPT-5.6路由记录
ultrafast模式本周四上线，速度提升2-3倍，专为延迟敏感任务设计
GPT-5.3-Codex成为首个参与自身训练的模型，85%内部员工每周使用Codex
30天切换到Codex的企业获2个月免费使用权，3小时内2000名开发者响应

GPT-5.6ultrafastOpenAICodexASI

大模型 5月14日

田渊栋官宣创业Recursive Superintelligence：$46.5亿估值，8位AI大佬联手

前Meta FAIR科学家田渊栋联合创立Recursive Superintelligence，融资6.5亿美元，估值46.5亿美元
GV（谷歌风投）、Greycroft领投，AMD Ventures、英伟达跟投
CEO为前Salesforce AI研究负责人Richard Socher，8位联创来自OpenAI、DeepMind、Meta AI等
核心方向：递归自我改进（AI用AI改进AI），重视可解释性，反对无脑堆算力
AI泰斗Peter Norvig参与合著，团队25人分布在旧金山和伦敦

田渊栋Recursive Superintelligence$46.5亿递归自我改进Peter Norvig

大模型 5月14日

Anthropic：三个月估值从$3800亿飙至$9500亿，史上最大IPO前夜

Anthropic洽谈新一轮$300-500亿融资，估值目标$9500亿，5月底前可能完成
年化收入已飙升至$440亿以上，推理毛利率从38%升至70%以上
Q1全球LLM市场份额31.4%超越OpenAI的29.0%，月活仅1.34亿但ARPU是OpenAI 7倍
Claude Code年化收入超$25亿，占同类工具54%市场份额，占GitHub公开提交约4%
四大供养者锁定超20吉瓦算力：亚马逊$250亿+谷歌$400亿+SpaceX Colossus 300兆瓦+微软Azure

Anthropic$9500亿$440亿营收Claude CodeIPO

大模型 5月14日

OpenAI指控Anthropic收入注水$80亿：总额法vs净额法会计争议

OpenAI首席营收官Dresser内部备忘录：Anthropic采用总额法将渠道费计入营收
按净额法计算，Anthropic$300亿年化收入应约为$220亿，低于OpenAI同期$250亿
Bank of America测算2026年Anthropic向AWS和谷歌支付渠道分成$64亿
双方都在推进IPO，SEC可能强制统一会计口径，这实质是估值攻防战

AnthropicOpenAI总额法净额法$80亿争议

大模型 5月13日

GPT-5.5首破ProgramBench：0源码盲写程序，编程AI新纪元

GPT-5.5在Meta+斯坦福+哈佛联合推出的ProgramBench上首次破题，此前所有模型通过率0%
26个任务通过95%以上单元测试，xhigh模式在累积直方图全程碾压所有对手
Claude Opus 4.7花费$10.74仅得最差成绩，GPT-5.5普通版仅$1.04、17次调用
推理算力是核心变量：同一模型medium几乎交白卷，xhigh断层碾压

GPT-5.5ProgramBench盲写程序编程AI推理算力

大模型 5月13日

OpenAI前CTO Murati发布Interaction Model：200ms微轮次实现AI"共在"

Thinking Machines Lab发布交互模型，276B MoE参数（激活12B），200ms micro-turn永不停止
解决共在性（多模态统一）、共时性（200ms心跳）、并发性（先读后写串行等效并行）
TimeSpeak测试64.7% vs GPT-4o realtime 4.3%，CueSpeak测试81.7% vs 2.9%
双模型架构：Interaction Model保心跳+Background Model深度推理异步返回

Thinking MachinesMuratiInteraction Model200ms共在性

大模型 5月14日

OpenEvidence：被三分之二美国医生使用的AI医疗搜索工具

OpenEvidence AI医疗搜索工具称已覆盖约65万美国医生，国际范围另有120万
定位面向医疗专业人员的AI辅助搜索和诊断支持工具
反映AI在医疗专业场景的快速渗透和信任度建立

OpenEvidenceAI医疗65万医生医疗搜索诊断辅助

大模型 5月13日

百度Create 2026：提出DAA指标，重构AI时代价值度量衡

百度在Create 2026大会提出DAA（Daily Active Agents，日活智能体数）新指标
李彦宏：DAU代表眼球，Token代表成本，DAA代表生产力闭环
百度智能云升级为"面向大规模智能体应用的新全栈AI云"
提出"驾驭工程"（Harness Engineering）概念，强调长上下文管理和工具调度

百度DAA智能体Token价值度量衡

大模型 5月13日

Needle：26M参数单次函数调用模型，无FFN架构挑战常识

Cactus Compute开源Needle，仅26M参数的函数/工具调用模型，采用Simple Attention Network
架构完全去掉FFN/MLP层，主张工具调用本质是检索/槽位提取/JSON组装而非深度推理
在200B token上预训练27小时，2B Gemini合成数据后训练45分钟，消费设备6000 tok/s prefill
在单次函数调用上超越FunctionGemma-270M、Qwen-0.6B、Granite-350M等大模型

Needle26M模型无FFN函数调用Simple Attention

⚙️ 训练推理 10 条

训练推理 5月13日

Claude Code推/goal模式：小模型裁判验证完成，不干完不许停

Claude Code推出/goal目标驱动模式，设定完成条件后自动循环执行直到达标
独立小模型Haiku担任裁判，每轮验证是否完成，"做事的人不能同时当裁判"
源自澳洲开发者Geoffrey Huntley三行bash脚本Ralph Loop，三家公司11天内集体采纳
AI编程战场从"生成代码"转向"闭环交付"，谁先锁住工作流谁赢

Claude Code/goalRalph Loop闭环交付Anthropic

训练推理 5月13日

Codex Goal模式科研实测：博士80小时工作2小时完成，效率40倍

机械可解释性研究任务：博士预计80小时，Codex /goal模式仅1小时56分钟完成
最优配置为/goal + GPT-5.5 High + Fast Mode，效率提升约40倍
Darwin Gödel Machine（Sakana AI）能改写自己源代码，SWE-bench从20%自我提升至50%
四位跨领域学者发表《AGI案例研究：今日LLM已达标》，行业正对公众进行"煤气灯效应"

Codex科研奇点40倍效率递归自我改进AGI

训练推理 5月13日

Bun用AI 6天将96万行Zig重写为Rust：Claude Code亲手重写了自己

Anthropic收购的Bun在6天内用AI将96万行Zig代码迁移为Rust，5月11日宣布Zig版本终结
直接原因：Bun的WebKit Malloc导致Claude Code内存泄漏（RSS从1.7GB暴涨到14GB+）
Rust版通过99.8%测试套件，但13000+个unsafe调用引发"vibecoded disaster"争议
与Zig社区哲学冲突：Zig禁止AI生成代码，而Anthropic是AI编程最激进推动者

BunZig到Rust96万行Claude CodeAI重写

训练推理 5月13日

NVIDIA Star Elastic：训练后模型压缩成本降低360倍

NVIDIA推出Star Elastic技术，实现训练后模型压缩的效率飞跃
将模型压缩成本降低360倍，同时保持模型精度基本不损失
针对AI推理部署成本高企问题，为大模型在企业端落地提供经济可行路径

NVIDIAStar Elastic模型压缩360倍推理部署

训练推理 5月14日

DeepSeek V4基准测试持续刷新，编程能力逼近GPT-5.5

DeepSeek V4在多项基准测试中持续刷新成绩，编程能力逼近GPT-5.5水平
中美定价差距扩大至5-25倍，中国模型在等效性能下成本优势显著
估值三周翻五倍，OpenAI跟投$300亿是最大单笔

DeepSeek V4编程能力5-25倍价差估值翻倍

训练推理 5月13日

React-doctor日增788星：捕获AI Agent编写的糟糕React代码

react-doctor在GitHub趋势日增788星，定位AI编码质量检测工具
可自动识别AI Agent生成的有问题的React代码模式
为AI辅助编码提供质量护栏，减少"看起来对但实际有问题"的代码

react-doctorAI编码质量React代码检测GitHub趋势

训练推理 5月13日

Nous Research Token Superposition Training：预训练2-3倍提速无需改推理架构

Nous Research提出Token Superposition Training，修改预训练早期阶段
模型先读取/预测连续token bags再回到标准next-token prediction
在匹配FLOPs下实现2-3倍墙钟时间加速，推理时架构完全不变
从270M dense到10B-A1B MoE全尺寸验证，预训练效率突破

Token SuperpositionNous Research2-3倍提速预训练MoE

训练推理 5月13日

Multi-stream LLM：打破单流限制，实现并行推理和工具调用

Jonas Geiping等研究者发布多流LLM架构，挑战当前chat训练将Agent限制为单数据流
主张Agent推理、工具调用、状态跟踪应由独立流并行处理，降低延迟
实现更清晰的关注点分离和更可解释的并行推理/工具使用
论文和代码已开源，对Agent架构设计有深远影响

Multi-stream LLM并行推理Agent架构Jonas Geiping工具调用

训练推理 5月12日

δ-mem外部记忆：冻结模型+在线联想记忆，基准提升1.10-1.15倍

δ-mem提出将外部在线联想记忆附加到冻结全注意力backbone上的方案
仅8×8状态维度，平均基准分提升1.10倍，对比非δ-mem基线提升1.15倍
在记忆密集型benchmark上增益更大，不改变推理架构
为大模型提供低成本外部记忆增强路径

δ-mem外部记忆联想记忆基准提升冻结模型

训练推理 5月13日

Datology VLM数据策展：2B模型+11.7分提升，训练计算量仅为1/17

Datology展示VLM数据策展的巨大威力：在2B规模上跨20个公开VLM基准提升11.7分
打败InternVL3.5-2B约10分，训练计算量仅为其1/17
4B规模接近前沿水平，响应FLOPs比Qwen3-VL-4B低3.3倍
证明数据质量而非模型规模是VLM性能关键杠杆

DatologyVLM数据策展11.7分提升训练效率

🤖 Agent 9 条

Agent 5月14日

MiniMax发布Mavis：Leader-Worker-Verifier对抗式多Agent系统

MiniMax推出Mavis模式（MiniMax as a Jarvis），基于Team Engine多Agent基础设施
三类核心角色：Leader管理分配、Worker执行任务、Verifier铁面验收，Worker和Verifier对抗式制衡
实测9个并行任务交付10+文件（xls、ppt、html、md），Verifier发现错误后Worker自动重做
支持微信/飞书IM接入，秒回与执行逻辑解耦，8个同时任务无语境错乱
Token Plan与Agent Plan合并为统一套餐，所有额度共享

MiniMaxMavis多Agent对抗式验证上下文隔离

Agent 5月13日

Cline SDK开源：从CLI到完整Agent Harness平台

Cline开源重建版Cline SDK，附带全新TUI终端界面
支持agent teams（多智能体团队）、scheduled jobs（定时任务）、connectors（连接器）
定位为可复用的自定义编码Agent基座，成为OpenClaw之外最受欢迎的开源coding harness
社区反响热烈，成为当日GitHub最高参与度的技术发布之一

Cline SDK开源Agent HarnessTUICoding Agent

Agent 5月13日

Notion发布开发者平台：工作空间变身AI Agent中枢

Notion推出全新开发者平台，允许团队将AI Agent、外部数据源和自定义代码集成到工作空间
支持接入Claude、Codex、GPT等外部Agent，Business和Enterprise用户可用
可部署自定义代码（Notion Workers）实现数据同步和Agent工具构建
标志Notion从协作文档工具向Agent驱动生产力平台转型

NotionAI Agent开发者平台外部Agent生产力平台

Agent 5月13日

LangChain发布LangSmith Engine+SmithDB：Agent可观测性12-15倍提速

LangChain在Interrupt大会一口气发布7大Agent基础设施组件
最核心技术亮点SmithDB：专为嵌套长时trace和大型payload设计的可观测性数据库
基于Apache DataFusion和Vortex构建，关键workload访问速度提升12-15倍
同步发布Sandboxes、Managed Deep Agents、LLM Gateway、Context Hub等

LangChainLangSmith EngineSmithDB可观测性Agent基础设施

Agent 5月13日

微软洽谈收购LLM开发商Inception：为后OpenAI时代布局

微软正在洽谈收购LLM开发商Inception，要价超$10亿
SpaceX也曾接触Inception，微软此举是为OpenAI独立后做准备
微软正广泛物色AI创业公司，此前还考虑收购Cursor但因GitHub Copilot冲突放弃
反映微软与OpenAI排他性关系的持续松动

微软Inception收购后OpenAI$10亿

Agent 5月13日

Hermes Agent五层防烂尾机制：心跳→僵尸回收→退出拦截→幻觉拦截→重试预算

Nous Research发布Hermes Agent，五层工程化机制防止Agent任务烂尾
第一层心跳检测证明存活，第二层超时僵尸回收，第三层未完成退出拦截
第四层幻觉拦截验证代码实际落盘，第五层独立重试预算防无限循环
与OpenAI Codex和Anthropic Claude Code /goal共同致敬Ralph Loop精神

Hermes AgentNous Research防烂尾五层机制多Agent

Agent 5月13日

Duet Agent：面向周/月级长时任务的状态机Harness

Duet Agent提出状态机架构，专为持续数周甚至数月的长周期任务设计
支持父/子Agent协调，用持久化记忆替代上下文压缩
与Claude Code /goal和Hermes Agent共同指向Agent UX新范式：长时运行+有状态+可检查
Agent产品正从聊天对话转向"持久执行+中间状态检查+工具原生UI"

Duet Agent状态机长时任务持久执行Agent UX

Agent 5月13日

Anthropic恢复OpenClaw和第三方Agent使用权限

Anthropic恢复Claude订阅用户对OpenClaw和第三方Agent的使用权
6月15日起，付费用户每月获50%编程额度提升，覆盖Claude Agent SDK
OpenAI同步反击：迁移到Codex的企业获2个月免费使用权（约$400价值）

AnthropicOpenClaw第三方Agent额度提升Claude Agent SDK

Agent 5月13日

AI最先重构的不是产品，而是软件公司自身

分析指出软件公司组织逻辑正在根本性变化：从流水线部门→混编小队围绕客户转
AI拆掉的不是人而是岗位，将"人的经验"变成"系统能力"
Shopify CEO：新增HC必须先证明AI不能完成；Salesforce一边用AI压缩客服一边增加AI销售
未来软件公司=人类与Agent混编的小型作战组织，最大竞争力是响应速度而非规模

软件公司组织重构Agent混编中层压缩响应速度

🔧 基础设施 9 条

基础设施 5月13日

Cerebras IPO定价$185超预期：募资$55.5亿，估值$564亿

Cerebras Systems将IPO定价$185/股，远超预期区间$150-160，募资至少$55.5亿
完全稀释估值$564亿，3000万股+超额配售450万股，Nasdaq代码CBRS
此前OpenAI以$0.00001/股地板价换取Cerebras约3%股权，按480亿估值价值超$40亿
AI芯片公司密集IPO：Cerebras紧随CoreWeave之后，华尔街预计AI基础设施板块将持续升温

CerebrasIPO$185$55.5亿$564亿估值

基础设施 5月13日

CoreWeave暴跌预警：OpenAI的"承诺换股"模式成为最危险资产

CoreWeave 67%营收来自微软，OpenAI合约金额超$220亿占签约收入三分之一
《华尔街日报》报道OpenAI营收与用户增速未达内部预期，CFO担心无力支付
CoreWeave联合创始人等已套现超$60亿，数据中心行业信用状况恶化10%-12%
"星际之门"5000亿计划部分推进工作已停滞

CoreWeaveOpenAI营收风险$220亿合约AI基础设施

基础设施 5月13日

思科Q3营收$158.4亿创纪录：AI订单上调至$90亿，盘后涨19%+

思科Q3营收同比增长12%至$158.4亿，超预期$155.6亿
AI基础设施YTD订单达$53亿，全年AI订单预测上调至$90亿
同步宣布裁员约4000人，AI自动化替代趋势持续
反映AI对传统网络设备商的双面影响：需求拉动+人力压缩

Cisco$158.4亿AI订单$90亿裁员4000网络设备

基础设施 5月13日

Claude Code定价变更引发开发者反弹，Theo和Jeremy Howard齐批

Anthropic宣布Claude付费计划每月编程额度改为专用credits，覆盖Agent SDK和第三方SDK应用
权限社区视为对订阅补贴harness的重大限制，Theo、Jeremy Howard、Matt Pocock等集体批评
Anthropic部分安抚：Claude Code周额度提升50%至7月13日，叠加此前2倍5小时限制
OpenAI趁势推出企业迁移激励：30天内切换Codex获2个月免费

Claude Code定价争议开发者反弹Theo编程额度

基础设施 5月14日

OpenEvidence被三分之二美国医生使用的AI医疗搜索工具

AI医疗搜索工具OpenEvidence称覆盖约65万美国医生，国际另有120万
反映AI在医疗专业场景的快速渗透和信任度建立

OpenEvidenceAI医疗65万医生诊断辅助

基础设施 5月14日

xAI向金融行业推销Grok：Apollo、大摩内部测试但实际使用率低

xAI推动金融行业采用Grok，Apollo Global、Morgan Stanley等正在进行内部测试
但金融从业者很少在实际工作中使用Grok，实际转化率存疑
反映Grok在企业级市场的渗透仍处于早期阶段

xAIGrok金融行业ApolloMorgan Stanley

基础设施 5月13日

ClickHouse定位AI日志实时分析引擎：AI Labs都在用

ClickHouse凭借OLAP+可观测性+AI Observability三重能力，成为AI日志分析热门选择
多家AI Labs将其作为模型训练日志、推理监控和Agent行为追踪的底层引擎
实时分析能力满足AI系统对毫秒级监控的需求

ClickHouseAI日志实时分析OLAP可观测性

基础设施 5月13日

TextGen变身原生桌面应用：oobabooga打造LM Studio开源替代

oobabooga将text-generation-webui重构为便携式无需安装的Electron桌面应用
支持CUDA/Vulkan/CPU-only/ROCm/Apple Silicon多平台，零外部请求
集成MCP工具调用（带审批门控）、PDF提取、Web搜索、Claude Code兼容API
定位为隐私友好的LM Studio开源替代，社区反响热烈

TextGenoobaboogaLM Studio替代原生桌面MCP

基础设施 5月13日

Cursor扩展Cloud Agents：完整开发环境含cloned repos和版本回滚

Cursor扩展云端Agent功能，支持完整配置的开发环境
包含cloned repos、依赖安装、版本历史、回滚、作用域egress和隔离secrets
标志coding agent从"生成代码"向"管理完整开发环境"演进

CursorCloud Agents开发环境版本回滚Coding Agent

🦾 机器人 7 条

机器人 5月13日

Figure人形机器人8小时自主班次：Helix-02实现多机器人协同分拣

Figure CEO Brett Adcock直播展示人形机器人执行完整8小时自主包裹分拣班次
使用Helix-02模型，机器人从摄像头像素推理，人机parity约3秒/包裹
多机器人网络化协同、低电量自主更换、故障自诊断并切换维护
这是目前最清晰的多机器人长时无人值守编排公开演示之一

Figure8小时班次Helix-02多机器人人机parity

机器人 5月14日

第二届杭州国际人形机器人与机器人技术展览会开幕

2026第二届杭州HRTE在杭州大会展中心举办，为期三天（5月14-16日）
中国首个人形机器人全产业链专业展，总面积6万平方米
汇聚全球顶尖人形机器人企业，预计接待10万专业观众
覆盖整机、核心零部件、传感器、操作系统等全产业链

杭州机器人展HRTE人形机器人全产业链6万平方米

机器人 5月13日

接入AI Agent的家庭机器人交互时长跃升至2小时

接入腾讯ClawPro后，家庭机器人内测用户日均交互从30分钟跃升至2小时
AI Agent赋能让家庭机器人从"工具"升级为"类家人"角色
反映AI Agent在消费级机器人场景的巨大商业化潜力

家庭机器人ClawProAI Agent2小时交互消费级

机器人 5月13日

中国具身智能机器人走向高风险工业前沿

中国多家具身智能企业部署至高压电巡检、核设施维护等高风险场景
"操作即收集"反馈循环让机器人越用越聪明，非结构化环境适应性显著增强
具身智能被纳入最新五年计划，列为经济增长新引擎

工业机器人高风险场景五年计划非结构化电巡检

机器人 5月13日

Apptronik累计融资$9.35亿，人形机器人商业化领跑

人形机器人初创Apptronik累计融资$9.35亿，估值突破$50亿
与多家制造业客户签署部署协议，商业化进展领先同类公司
2026年被视为人形机器人赛道商业化元年

Apptronik$9.35亿$50亿人形机器人商业化

机器人 5月13日

LangForce破解VLA模型视觉捷径：分布外泛化提升至66.5%

华中科技大学等团队发现VLA模型忽视语言指令的"视觉捷径"问题
仅视觉模型在OOD场景成功率接近0%，提出LangForce方法引入LLR损失函数
在SimplerEnv OOD场景达66.5%（提升11.3%），推理时无额外开销
通过显式最大化语言信息增益，确保模型真正理解并遵循指令

LangForceVLA视觉捷径分布外泛化指令跟随

机器人 5月13日

林俊旸创业聚焦世界模型和具身大脑：估值约$20亿

前阿里千问大模型技术负责人林俊旸启动创业，聚焦世界模型和具身智能
新公司估值约$20亿，已接触红杉中国、高榕创投等，团队含字节腾讯海外背景成员
因阿里将Qwen团队拆分重组而离职，具身智能和世界模型成VC和大牛押注方向
对标公司：World Labs（$50亿）、AMI Labs（$35亿）

林俊旸世界模型具身智能$20亿千问

🎨 多模态 8 条

多模态 5月14日

AI视频生成工具2026横评更新：Veo 3.1领先，可灵Kling 3.0中国强势

最新AI视频生成对比：Veo 3.1支持原生音频和4K，综合表现领先
可灵Kling 3.0和Seedance 2.0在中国市场表现强劲，定价远低于海外竞品
AI视频生成从文生视频进化到物理规律理解和长时长叙事阶段
Sora已于3月24日停服，因成本不可持续退出市场

Veo 3.1Kling 3.0Seedance 2.0视频生成AI横评

多模态 5月12日

谷歌Gemini Omni视频模型泄露：统一图像+视频+音频生成

Gemini Omni模型出现在Gemini App视频生成标签页，5月12日截图引发关注
定位Gemini自研全新模型家族首个成员，单次前向推理同时完成图像+视频+音频生成
支持视频remix、编辑和从简单提示生成高质量样本，早期反馈称赞数学连贯性和语音质量
可能于5月19日Google I/O 2026正式发布

Gemini OmniGoogle I/O视频生成统一模型泄露

多模态 5月13日

何恺明CVPR 2026五篇论文：从流匹配到视觉推理

何恺明团队在CVPR 2026发表五篇论文，覆盖生成模型、视觉推理与自监督学习
JiT通过直接预测干净图像实现高质量去噪（FID 1.78）
VARC用纯视觉模型在ARC-1上达到人类水平，展示视觉推理新范式

何恺明CVPR 2026JiTVARC视觉推理

多模态 5月13日

百度文心走向原生全模态统一

百度在Create 2026宣布文心模型走向原生全模态统一架构
单一模型同时处理文本、图像、视频、语音、代码等多种模态
搜索已全面AI化，MaaS升级为Token Foundry（词元工厂）

百度文心全模态Token Foundry搜索AI化

多模态 5月13日

AI漫剧迎来第一次泡沫破裂

AI漫剧赛道经历第一波泡沫，多个明星项目用户增长放缓
AI生成内容同质化严重，用户留存率低，商业化路径不清晰
行业需要回归内容本质，AI是工具而非内容本身

AI漫剧泡沫破裂同质化用户留存商业化

多模态 5月13日

Spotify AI DJ扩展多语言覆盖，AI音频成战略重心

Spotify AI DJ新增法语、德语、意大利语和巴西葡萄牙语支持
公司战略从流媒体平台转向AI生成个人音频平台
AI DJ成为用户留存和差异化竞争的核心功能

SpotifyAI DJ多语言个人音频战略转型

多模态 5月13日

Perceptron Mk1：视频分析AI成本比竞品低80-90%

Perceptron发布Mk1视频分析AI模型，成本较Anthropic、OpenAI和Google低80-90%
定位"Physical AI"，目标将物理AI像数字AI一样普及化
早期用户已用于体育赛事自动剪辑精彩片段

Perceptron Mk1视频分析80-90%便宜Physical AI体育剪辑

多模态 5月13日

词元经济：AI时代从流量为王到Token为王

58同城日消耗近2000亿Token即将突破3000亿，有赞从三四百亿跃至2000亿年底目标5万亿
字节豆包日均Token突破120万亿，智谱API涨价83%调用量反增400%
阿里成立ATH事业群首次将Token写进组织结构，钉钉称软件已变"日抛品"
预测未来10年Token将涨10-50倍，但推理成本持续降低

词元经济Token58同城字节跳动API涨价

💰 投融资 6 条

投融资 5月13日

Cerebras IPO定价$185超预期：募资$55.5亿

Cerebras Systems将IPO定价$185/股，远超预期$150-160区间
发行3000万股，完全稀释估值$564亿，Nasdaq代码CBRS
AI芯片IPO热潮延续，华尔街对AI基础设施板块热情高涨

CerebrasIPO$55.5亿$564亿估值AI芯片

投融资 5月14日

田渊栋创业融资$6.5亿：估值$46.5亿

Recursive Superintelligence完成6.5亿美元融资，估值46.5亿美元
GV、Greycroft领投，AMD Ventures和英伟达跟投
8位联创阵容豪华，核心方向为递归自我改进

Recursive Superintelligence$6.5亿$46.5亿田渊栋AI创业

投融资 5月13日

微软洽谈收购Inception：要价超$10亿

微软正洽谈收购LLM开发商Inception，要价超$10亿
SpaceX也曾竞标，微软此举是为OpenAI独立后的战略储备
反映大厂争抢AI模型开发能力的激烈程度

微软Inception收购$10亿大厂争夺

投融资 5月13日

词元经济产业逻辑：AI融资热潮下的新秩序

字节跳动2026年资本支出1600亿元，饱和式推进Token生产-燃烧-变现体系
郭达雅以亿元年薪加盟字节跳动，林俊旸离职引发Qwen团队震荡
真格基金推出"Token Grant"计划向早期创业者提供Token
预测90%中小玩家可能在这一轮周期中出局

词元经济字节跳动$1600亿资本支出Token Grant行业洗牌

投融资 5月13日

Anthropic vs OpenAI企业竞争白热化：Anthropic首次份额领先

Ramp数据显示4月Anthropic企业采用率34.4%首次超过OpenAI的32.3%
Anthropic同步调整编程额度政策引发开发者反弹，OpenAI以2个月免费Codex反击
竞争格局从"最好模型赢"转向"补贴+工作流控制+harness兼容性"

AnthropicOpenAI34.4%份额企业竞争定价战

投融资 5月13日

Figure机器人获巨额融资，8小时班次证明商业化路径

Figure完成新一轮融资，CEO Brett Adcock展示8小时全自主分拣班次
多机器人网络协同+低电量自主更换+故障自诊断，商业化演示远超竞品
2026年人形机器人赛道融资和商业化进展加速

Figure融资8小时班次商业化人形机器人

🌐 行业 9 条

行业 5月13日

奥特曼首度出庭作证：披露马斯克想让子女继承OpenAI控制权

奥特曼首次出庭作证：马斯克曾想让子女继承OpenAI控制权，自己"十分反感"
驳斥"OpenAI背叛初心"：当年第二次会面就讨论过营利性公司文件，马斯克当时表示赞赏
评价马斯克"不懂如何运营研究实验室"，"电锯管理学"让关键研究人员士气受挫
OpenAI已累计募集$1750亿，马斯克诉讼核心是将$1800亿转移至非营利母公司

奥特曼马斯克OpenAI诉讼出庭作证$1750亿

行业 5月13日

《纽约客》深度调查定性奥特曼："不受真相的约束"

Ronan Farrow历时一年采访100+人的调查：奥特曼"容易撒谎且觉得被发现了也无所谓"
前CTO穆拉蒂视频证词：奥特曼长期向不同高管提供不同版本事实，模糊安全审批节点
个人财富超$20亿：Helion核聚变$3.75亿投资纸面价值$16亿，被质疑利用OpenAI推高估值
国会5月11日要求奥特曼提交2015年至今所有利益冲突文件，5月22日为截止日

奥特曼纽约客利益冲突Helion国会调查

行业 5月13日

Claude Mythos Preview首个通过AISI全部端到端网络安全测试

Anthropic/Glasswing的Claude Mythos Preview成为首个解决UK AISI全部端到端网络靶场的模型
包括Cooling Tower靶场，是唯一在250万token限制内清零所有任务项的模型
UK AISI称前沿模型完成网络任务的长度每几月翻倍，近期模型已超越此趋势
独立测试显示更新版Mythos完成率从3/10提升至6/10

Claude MythosAISI网络安全Cooling Tower端到端测试

行业 5月13日

AI Vibe Coding技术债警示：3月积累361万行废弃代码

开发者继承3个月"vibe engineer"生成的仓库：309k LOC、240k文档、100万+markdown日志
220个handler仅20个在用，40+ secrets仅2个需要，用Claude一周重写
最终PR：+10,197行新增、-3,618,778行删除，成为职业生涯最 satisfying 的PR
社区热议：AI生成技术债可能催生"清理vibe-coded mess"新维护赛道

Vibe Coding技术债361万行AI生成代码代码清理

行业 5月13日

SWE-ZERO-12M：最大开放Agent轨迹数据集，112B token

Kevin Li发布SWE-ZERO-12M-trajectories，定位最大开放Agent轨迹数据集
112B token、12M轨迹、122K PR、3K仓库、16种编程语言
为Agent训练和评估提供前所未有的规模数据支撑
社区呼吁Agent评估应从"仅看结果"转向"日志分析"，更强Agent会暴露benchmark隐藏bug

SWE-ZERO-12MAgent轨迹112B token开放数据集Agent评估

行业 5月14日

第二届杭州国际人形机器人展：中国首个人形机器人全产业链展

展会汇聚全球顶尖人形机器人企业，覆盖整机、核心零部件、传感器、操作系统
TrendForce预测中国2026年人形机器人产量增长94%，下半年进入商业化关键阶段
中国HEIS 2026框架成为全球首个综合国家标准体系

杭州机器人展人形机器人全产业链HEIS 2026商业化

行业 5月13日

百度Create 2026：DAA指标+新全栈AI云+驾驭工程

百度提出DAA（日活智能体数）替代DAU和Token作为AI时代价值度量衡
百度智能云升级为面向大规模智能体应用的新全栈AI云
提出驾驭工程概念：长上下文管理、持久记忆、工具调用、子智能体调度
从2010年NLP部到2026年DAA，百度AI长期主义路径得到验证

百度CreateDAA新全栈驾驭工程长期主义

行业 5月13日

味之素ABF膜：味精厂成日本最牛AI股，5年涨5倍

日本味之素凭借ABF膜（芯片封装绝缘材料）占据全球95%以上份额
5月11日宣布ABF涨价30%，股价当日暴涨10%，5年累计涨超500%
AI GPU先进封装需20层以上ABF（普通CPU仅6层），单颗消耗量是普通CPU的9倍以上
年需求增速>40%但供给仅增10%-15%，无敌定价权

味之素ABF膜芯片封装95%份额AI基础设施

行业 5月13日

AI应用嵌入比例一年翻8倍：岗位正在被悄悄接管

AI应用在企业中的嵌入比例一年内翻8倍，从辅助工具变为工作流核心
昆仑万维要求技术人员通过AI将研发效率提升50%，使用Token少的员工将被淘汰
钉钉管理层从5-7层压缩至1-3层，"软件变成日抛品"
未来将被淘汰：只会简单执行的文员、初级程序员、只做上传下达的中层管理者

AI渗透岗位替代组织变革中层压缩效率提升