AI DAILY · 2026-05-14 · 周四
AI 日报 / 2026 年 05 月 14 日
今日收录 68 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
GPT-5.6曝光
距5.5发布仅三周,内部代码标识ember-alpha/beacon-alpha,ultrafast模式提2-3倍速
田渊栋创业Recursive Superintelligence
6.5亿美元融资、$46.5亿估值,8位联创含Peter Norvig,黄仁勋苏妈都投了
Cerebras IPO定价$185
超预期区间$150-160,募资$55.5亿,完全稀释估值$564亿
Anthropic年化收入飙至$440亿
三个月估值从$3800亿翻至$9500亿,Claude Code年化$25亿
MiniMax发布Mavis多Agent系统
Leader-Worker-Verifier对抗式架构,上下文隔离+多任务并行
微软洽谈收购Inception
为后OpenAI时代做准备,SpaceX也曾竞标,要价超$10亿
Figure人形机器人8小时自主班次
Helix-02驱动的多机器人协同分拣,人机parity ~3s/package
大模型
9 条
- GPT-5.5发布仅三周,GPT-5.6已启动内部测试,首批检查点运行中
- 内部代码标识ember-alpha、beacon-alpha,Codex日志中已出现GPT-5.6路由记录
- ultrafast模式本周四上线,速度提升2-3倍,专为延迟敏感任务设计
- GPT-5.3-Codex成为首个参与自身训练的模型,85%内部员工每周使用Codex
- 30天切换到Codex的企业获2个月免费使用权,3小时内2000名开发者响应
GPT-5.6ultrafastOpenAICodexASI
- 前Meta FAIR科学家田渊栋联合创立Recursive Superintelligence,融资6.5亿美元,估值46.5亿美元
- GV(谷歌风投)、Greycroft领投,AMD Ventures、英伟达跟投
- CEO为前Salesforce AI研究负责人Richard Socher,8位联创来自OpenAI、DeepMind、Meta AI等
- 核心方向:递归自我改进(AI用AI改进AI),重视可解释性,反对无脑堆算力
- AI泰斗Peter Norvig参与合著,团队25人分布在旧金山和伦敦
田渊栋Recursive Superintelligence$46.5亿递归自我改进Peter Norvig
- Anthropic洽谈新一轮$300-500亿融资,估值目标$9500亿,5月底前可能完成
- 年化收入已飙升至$440亿以上,推理毛利率从38%升至70%以上
- Q1全球LLM市场份额31.4%超越OpenAI的29.0%,月活仅1.34亿但ARPU是OpenAI 7倍
- Claude Code年化收入超$25亿,占同类工具54%市场份额,占GitHub公开提交约4%
- 四大供养者锁定超20吉瓦算力:亚马逊$250亿+谷歌$400亿+SpaceX Colossus 300兆瓦+微软Azure
Anthropic$9500亿$440亿营收Claude CodeIPO
OpenAI指控Anthropic收入注水$80亿:总额法vs净额法会计争议
- OpenAI首席营收官Dresser内部备忘录:Anthropic采用总额法将渠道费计入营收
- 按净额法计算,Anthropic$300亿年化收入应约为$220亿,低于OpenAI同期$250亿
- Bank of America测算2026年Anthropic向AWS和谷歌支付渠道分成$64亿
- 双方都在推进IPO,SEC可能强制统一会计口径,这实质是估值攻防战
AnthropicOpenAI总额法净额法$80亿争议
GPT-5.5首破ProgramBench:0源码盲写程序,编程AI新纪元
- GPT-5.5在Meta+斯坦福+哈佛联合推出的ProgramBench上首次破题,此前所有模型通过率0%
- 26个任务通过95%以上单元测试,xhigh模式在累积直方图全程碾压所有对手
- Claude Opus 4.7花费$10.74仅得最差成绩,GPT-5.5普通版仅$1.04、17次调用
- 推理算力是核心变量:同一模型medium几乎交白卷,xhigh断层碾压
GPT-5.5ProgramBench盲写程序编程AI推理算力
OpenAI前CTO Murati发布Interaction Model:200ms微轮次实现AI"共在"
- Thinking Machines Lab发布交互模型,276B MoE参数(激活12B),200ms micro-turn永不停止
- 解决共在性(多模态统一)、共时性(200ms心跳)、并发性(先读后写串行等效并行)
- TimeSpeak测试64.7% vs GPT-4o realtime 4.3%,CueSpeak测试81.7% vs 2.9%
- 双模型架构:Interaction Model保心跳+Background Model深度推理异步返回
Thinking MachinesMuratiInteraction Model200ms共在性
OpenEvidence:被三分之二美国医生使用的AI医疗搜索工具
- OpenEvidence AI医疗搜索工具称已覆盖约65万美国医生,国际范围另有120万
- 定位面向医疗专业人员的AI辅助搜索和诊断支持工具
- 反映AI在医疗专业场景的快速渗透和信任度建立
OpenEvidenceAI医疗65万医生医疗搜索诊断辅助
百度Create 2026:提出DAA指标,重构AI时代价值度量衡
- 百度在Create 2026大会提出DAA(Daily Active Agents,日活智能体数)新指标
- 李彦宏:DAU代表眼球,Token代表成本,DAA代表生产力闭环
- 百度智能云升级为"面向大规模智能体应用的新全栈AI云"
- 提出"驾驭工程"(Harness Engineering)概念,强调长上下文管理和工具调度
百度DAA智能体Token价值度量衡
Needle:26M参数单次函数调用模型,无FFN架构挑战常识
- Cactus Compute开源Needle,仅26M参数的函数/工具调用模型,采用Simple Attention Network
- 架构完全去掉FFN/MLP层,主张工具调用本质是检索/槽位提取/JSON组装而非深度推理
- 在200B token上预训练27小时,2B Gemini合成数据后训练45分钟,消费设备6000 tok/s prefill
- 在单次函数调用上超越FunctionGemma-270M、Qwen-0.6B、Granite-350M等大模型
Needle26M模型无FFN函数调用Simple Attention
训练推理
10 条
Claude Code推/goal模式:小模型裁判验证完成,不干完不许停
- Claude Code推出/goal目标驱动模式,设定完成条件后自动循环执行直到达标
- 独立小模型Haiku担任裁判,每轮验证是否完成,"做事的人不能同时当裁判"
- 源自澳洲开发者Geoffrey Huntley三行bash脚本Ralph Loop,三家公司11天内集体采纳
- AI编程战场从"生成代码"转向"闭环交付",谁先锁住工作流谁赢
Claude Code/goalRalph Loop闭环交付Anthropic
Codex Goal模式科研实测:博士80小时工作2小时完成,效率40倍
- 机械可解释性研究任务:博士预计80小时,Codex /goal模式仅1小时56分钟完成
- 最优配置为/goal + GPT-5.5 High + Fast Mode,效率提升约40倍
- Darwin Gödel Machine(Sakana AI)能改写自己源代码,SWE-bench从20%自我提升至50%
- 四位跨领域学者发表《AGI案例研究:今日LLM已达标》,行业正对公众进行"煤气灯效应"
Codex科研奇点40倍效率递归自我改进AGI
Bun用AI 6天将96万行Zig重写为Rust:Claude Code亲手重写了自己
- Anthropic收购的Bun在6天内用AI将96万行Zig代码迁移为Rust,5月11日宣布Zig版本终结
- 直接原因:Bun的WebKit Malloc导致Claude Code内存泄漏(RSS从1.7GB暴涨到14GB+)
- Rust版通过99.8%测试套件,但13000+个unsafe调用引发"vibecoded disaster"争议
- 与Zig社区哲学冲突:Zig禁止AI生成代码,而Anthropic是AI编程最激进推动者
BunZig到Rust96万行Claude CodeAI重写
NVIDIA Star Elastic:训练后模型压缩成本降低360倍
- NVIDIA推出Star Elastic技术,实现训练后模型压缩的效率飞跃
- 将模型压缩成本降低360倍,同时保持模型精度基本不损失
- 针对AI推理部署成本高企问题,为大模型在企业端落地提供经济可行路径
NVIDIAStar Elastic模型压缩360倍推理部署
DeepSeek V4基准测试持续刷新,编程能力逼近GPT-5.5
- DeepSeek V4在多项基准测试中持续刷新成绩,编程能力逼近GPT-5.5水平
- 中美定价差距扩大至5-25倍,中国模型在等效性能下成本优势显著
- 估值三周翻五倍,OpenAI跟投$300亿是最大单笔
DeepSeek V4编程能力5-25倍价差估值翻倍
React-doctor日增788星:捕获AI Agent编写的糟糕React代码
- react-doctor在GitHub趋势日增788星,定位AI编码质量检测工具
- 可自动识别AI Agent生成的有问题的React代码模式
- 为AI辅助编码提供质量护栏,减少"看起来对但实际有问题"的代码
react-doctorAI编码质量React代码检测GitHub趋势
Nous Research Token Superposition Training:预训练2-3倍提速无需改推理架构
- Nous Research提出Token Superposition Training,修改预训练早期阶段
- 模型先读取/预测连续token bags再回到标准next-token prediction
- 在匹配FLOPs下实现2-3倍墙钟时间加速,推理时架构完全不变
- 从270M dense到10B-A1B MoE全尺寸验证,预训练效率突破
Token SuperpositionNous Research2-3倍提速预训练MoE
Multi-stream LLM:打破单流限制,实现并行推理和工具调用
- Jonas Geiping等研究者发布多流LLM架构,挑战当前chat训练将Agent限制为单数据流
- 主张Agent推理、工具调用、状态跟踪应由独立流并行处理,降低延迟
- 实现更清晰的关注点分离和更可解释的并行推理/工具使用
- 论文和代码已开源,对Agent架构设计有深远影响
Multi-stream LLM并行推理Agent架构Jonas Geiping工具调用
δ-mem外部记忆:冻结模型+在线联想记忆,基准提升1.10-1.15倍
- δ-mem提出将外部在线联想记忆附加到冻结全注意力backbone上的方案
- 仅8×8状态维度,平均基准分提升1.10倍,对比非δ-mem基线提升1.15倍
- 在记忆密集型benchmark上增益更大,不改变推理架构
- 为大模型提供低成本外部记忆增强路径
δ-mem外部记忆联想记忆基准提升冻结模型
Datology VLM数据策展:2B模型+11.7分提升,训练计算量仅为1/17
- Datology展示VLM数据策展的巨大威力:在2B规模上跨20个公开VLM基准提升11.7分
- 打败InternVL3.5-2B约10分,训练计算量仅为其1/17
- 4B规模接近前沿水平,响应FLOPs比Qwen3-VL-4B低3.3倍
- 证明数据质量而非模型规模是VLM性能关键杠杆
DatologyVLM数据策展11.7分提升训练效率
Agent
9 条
- MiniMax推出Mavis模式(MiniMax as a Jarvis),基于Team Engine多Agent基础设施
- 三类核心角色:Leader管理分配、Worker执行任务、Verifier铁面验收,Worker和Verifier对抗式制衡
- 实测9个并行任务交付10+文件(xls、ppt、html、md),Verifier发现错误后Worker自动重做
- 支持微信/飞书IM接入,秒回与执行逻辑解耦,8个同时任务无语境错乱
- Token Plan与Agent Plan合并为统一套餐,所有额度共享
MiniMaxMavis多Agent对抗式验证上下文隔离
Cline SDK开源:从CLI到完整Agent Harness平台
- Cline开源重建版Cline SDK,附带全新TUI终端界面
- 支持agent teams(多智能体团队)、scheduled jobs(定时任务)、connectors(连接器)
- 定位为可复用的自定义编码Agent基座,成为OpenClaw之外最受欢迎的开源coding harness
- 社区反响热烈,成为当日GitHub最高参与度的技术发布之一
Cline SDK开源Agent HarnessTUICoding Agent
Notion发布开发者平台:工作空间变身AI Agent中枢
- Notion推出全新开发者平台,允许团队将AI Agent、外部数据源和自定义代码集成到工作空间
- 支持接入Claude、Codex、GPT等外部Agent,Business和Enterprise用户可用
- 可部署自定义代码(Notion Workers)实现数据同步和Agent工具构建
- 标志Notion从协作文档工具向Agent驱动生产力平台转型
NotionAI Agent开发者平台外部Agent生产力平台
LangChain发布LangSmith Engine+SmithDB:Agent可观测性12-15倍提速
- LangChain在Interrupt大会一口气发布7大Agent基础设施组件
- 最核心技术亮点SmithDB:专为嵌套长时trace和大型payload设计的可观测性数据库
- 基于Apache DataFusion和Vortex构建,关键workload访问速度提升12-15倍
- 同步发布Sandboxes、Managed Deep Agents、LLM Gateway、Context Hub等
LangChainLangSmith EngineSmithDB可观测性Agent基础设施
微软洽谈收购LLM开发商Inception:为后OpenAI时代布局
- 微软正在洽谈收购LLM开发商Inception,要价超$10亿
- SpaceX也曾接触Inception,微软此举是为OpenAI独立后做准备
- 微软正广泛物色AI创业公司,此前还考虑收购Cursor但因GitHub Copilot冲突放弃
- 反映微软与OpenAI排他性关系的持续松动
微软Inception收购后OpenAI$10亿
Hermes Agent五层防烂尾机制:心跳→僵尸回收→退出拦截→幻觉拦截→重试预算
- Nous Research发布Hermes Agent,五层工程化机制防止Agent任务烂尾
- 第一层心跳检测证明存活,第二层超时僵尸回收,第三层未完成退出拦截
- 第四层幻觉拦截验证代码实际落盘,第五层独立重试预算防无限循环
- 与OpenAI Codex和Anthropic Claude Code /goal共同致敬Ralph Loop精神
Hermes AgentNous Research防烂尾五层机制多Agent
Duet Agent:面向周/月级长时任务的状态机Harness
- Duet Agent提出状态机架构,专为持续数周甚至数月的长周期任务设计
- 支持父/子Agent协调,用持久化记忆替代上下文压缩
- 与Claude Code /goal和Hermes Agent共同指向Agent UX新范式:长时运行+有状态+可检查
- Agent产品正从聊天对话转向"持久执行+中间状态检查+工具原生UI"
Duet Agent状态机长时任务持久执行Agent UX
Anthropic恢复OpenClaw和第三方Agent使用权限
- Anthropic恢复Claude订阅用户对OpenClaw和第三方Agent的使用权
- 6月15日起,付费用户每月获50%编程额度提升,覆盖Claude Agent SDK
- OpenAI同步反击:迁移到Codex的企业获2个月免费使用权(约$400价值)
AnthropicOpenClaw第三方Agent额度提升Claude Agent SDK
AI最先重构的不是产品,而是软件公司自身
- 分析指出软件公司组织逻辑正在根本性变化:从流水线部门→混编小队围绕客户转
- AI拆掉的不是人而是岗位,将"人的经验"变成"系统能力"
- Shopify CEO:新增HC必须先证明AI不能完成;Salesforce一边用AI压缩客服一边增加AI销售
- 未来软件公司=人类与Agent混编的小型作战组织,最大竞争力是响应速度而非规模
软件公司组织重构Agent混编中层压缩响应速度
基础设施
9 条
Cerebras IPO定价$185超预期:募资$55.5亿,估值$564亿
- Cerebras Systems将IPO定价$185/股,远超预期区间$150-160,募资至少$55.5亿
- 完全稀释估值$564亿,3000万股+超额配售450万股,Nasdaq代码CBRS
- 此前OpenAI以$0.00001/股地板价换取Cerebras约3%股权,按480亿估值价值超$40亿
- AI芯片公司密集IPO:Cerebras紧随CoreWeave之后,华尔街预计AI基础设施板块将持续升温
CerebrasIPO$185$55.5亿$564亿估值
CoreWeave暴跌预警:OpenAI的"承诺换股"模式成为最危险资产
- CoreWeave 67%营收来自微软,OpenAI合约金额超$220亿占签约收入三分之一
- 《华尔街日报》报道OpenAI营收与用户增速未达内部预期,CFO担心无力支付
- CoreWeave联合创始人等已套现超$60亿,数据中心行业信用状况恶化10%-12%
- "星际之门"5000亿计划部分推进工作已停滞
CoreWeaveOpenAI营收风险$220亿合约AI基础设施
思科Q3营收$158.4亿创纪录:AI订单上调至$90亿,盘后涨19%+
- 思科Q3营收同比增长12%至$158.4亿,超预期$155.6亿
- AI基础设施YTD订单达$53亿,全年AI订单预测上调至$90亿
- 同步宣布裁员约4000人,AI自动化替代趋势持续
- 反映AI对传统网络设备商的双面影响:需求拉动+人力压缩
Cisco$158.4亿AI订单$90亿裁员4000网络设备
Claude Code定价变更引发开发者反弹,Theo和Jeremy Howard齐批
- Anthropic宣布Claude付费计划每月编程额度改为专用credits,覆盖Agent SDK和第三方SDK应用
- 权限社区视为对订阅补贴harness的重大限制,Theo、Jeremy Howard、Matt Pocock等集体批评
- Anthropic部分安抚:Claude Code周额度提升50%至7月13日,叠加此前2倍5小时限制
- OpenAI趁势推出企业迁移激励:30天内切换Codex获2个月免费
Claude Code定价争议开发者反弹Theo编程额度
OpenEvidence被三分之二美国医生使用的AI医疗搜索工具
- AI医疗搜索工具OpenEvidence称覆盖约65万美国医生,国际另有120万
- 反映AI在医疗专业场景的快速渗透和信任度建立
OpenEvidenceAI医疗65万医生诊断辅助
xAI向金融行业推销Grok:Apollo、大摩内部测试但实际使用率低
- xAI推动金融行业采用Grok,Apollo Global、Morgan Stanley等正在进行内部测试
- 但金融从业者很少在实际工作中使用Grok,实际转化率存疑
- 反映Grok在企业级市场的渗透仍处于早期阶段
xAIGrok金融行业ApolloMorgan Stanley
ClickHouse定位AI日志实时分析引擎:AI Labs都在用
- ClickHouse凭借OLAP+可观测性+AI Observability三重能力,成为AI日志分析热门选择
- 多家AI Labs将其作为模型训练日志、推理监控和Agent行为追踪的底层引擎
- 实时分析能力满足AI系统对毫秒级监控的需求
ClickHouseAI日志实时分析OLAP可观测性
TextGen变身原生桌面应用:oobabooga打造LM Studio开源替代
- oobabooga将text-generation-webui重构为便携式无需安装的Electron桌面应用
- 支持CUDA/Vulkan/CPU-only/ROCm/Apple Silicon多平台,零外部请求
- 集成MCP工具调用(带审批门控)、PDF提取、Web搜索、Claude Code兼容API
- 定位为隐私友好的LM Studio开源替代,社区反响热烈
TextGenoobaboogaLM Studio替代原生桌面MCP
Cursor扩展Cloud Agents:完整开发环境含cloned repos和版本回滚
- Cursor扩展云端Agent功能,支持完整配置的开发环境
- 包含cloned repos、依赖安装、版本历史、回滚、作用域egress和隔离secrets
- 标志coding agent从"生成代码"向"管理完整开发环境"演进
CursorCloud Agents开发环境版本回滚Coding Agent
机器人
7 条
Figure人形机器人8小时自主班次:Helix-02实现多机器人协同分拣
- Figure CEO Brett Adcock直播展示人形机器人执行完整8小时自主包裹分拣班次
- 使用Helix-02模型,机器人从摄像头像素推理,人机parity约3秒/包裹
- 多机器人网络化协同、低电量自主更换、故障自诊断并切换维护
- 这是目前最清晰的多机器人长时无人值守编排公开演示之一
Figure8小时班次Helix-02多机器人人机parity
第二届杭州国际人形机器人与机器人技术展览会开幕
- 2026第二届杭州HRTE在杭州大会展中心举办,为期三天(5月14-16日)
- 中国首个人形机器人全产业链专业展,总面积6万平方米
- 汇聚全球顶尖人形机器人企业,预计接待10万专业观众
- 覆盖整机、核心零部件、传感器、操作系统等全产业链
杭州机器人展HRTE人形机器人全产业链6万平方米
接入AI Agent的家庭机器人交互时长跃升至2小时
- 接入腾讯ClawPro后,家庭机器人内测用户日均交互从30分钟跃升至2小时
- AI Agent赋能让家庭机器人从"工具"升级为"类家人"角色
- 反映AI Agent在消费级机器人场景的巨大商业化潜力
家庭机器人ClawProAI Agent2小时交互消费级
中国具身智能机器人走向高风险工业前沿
- 中国多家具身智能企业部署至高压电巡检、核设施维护等高风险场景
- "操作即收集"反馈循环让机器人越用越聪明,非结构化环境适应性显著增强
- 具身智能被纳入最新五年计划,列为经济增长新引擎
工业机器人高风险场景五年计划非结构化电巡检
Apptronik累计融资$9.35亿,人形机器人商业化领跑
- 人形机器人初创Apptronik累计融资$9.35亿,估值突破$50亿
- 与多家制造业客户签署部署协议,商业化进展领先同类公司
- 2026年被视为人形机器人赛道商业化元年
Apptronik$9.35亿$50亿人形机器人商业化
LangForce破解VLA模型视觉捷径:分布外泛化提升至66.5%
- 华中科技大学等团队发现VLA模型忽视语言指令的"视觉捷径"问题
- 仅视觉模型在OOD场景成功率接近0%,提出LangForce方法引入LLR损失函数
- 在SimplerEnv OOD场景达66.5%(提升11.3%),推理时无额外开销
- 通过显式最大化语言信息增益,确保模型真正理解并遵循指令
LangForceVLA视觉捷径分布外泛化指令跟随
林俊旸创业聚焦世界模型和具身大脑:估值约$20亿
- 前阿里千问大模型技术负责人林俊旸启动创业,聚焦世界模型和具身智能
- 新公司估值约$20亿,已接触红杉中国、高榕创投等,团队含字节腾讯海外背景成员
- 因阿里将Qwen团队拆分重组而离职,具身智能和世界模型成VC和大牛押注方向
- 对标公司:World Labs($50亿)、AMI Labs($35亿)
林俊旸世界模型具身智能$20亿千问
多模态
8 条
AI视频生成工具2026横评更新:Veo 3.1领先,可灵Kling 3.0中国强势
- 最新AI视频生成对比:Veo 3.1支持原生音频和4K,综合表现领先
- 可灵Kling 3.0和Seedance 2.0在中国市场表现强劲,定价远低于海外竞品
- AI视频生成从文生视频进化到物理规律理解和长时长叙事阶段
- Sora已于3月24日停服,因成本不可持续退出市场
Veo 3.1Kling 3.0Seedance 2.0视频生成AI横评
谷歌Gemini Omni视频模型泄露:统一图像+视频+音频生成
- Gemini Omni模型出现在Gemini App视频生成标签页,5月12日截图引发关注
- 定位Gemini自研全新模型家族首个成员,单次前向推理同时完成图像+视频+音频生成
- 支持视频remix、编辑和从简单提示生成高质量样本,早期反馈称赞数学连贯性和语音质量
- 可能于5月19日Google I/O 2026正式发布
Gemini OmniGoogle I/O视频生成统一模型泄露
何恺明CVPR 2026五篇论文:从流匹配到视觉推理
- 何恺明团队在CVPR 2026发表五篇论文,覆盖生成模型、视觉推理与自监督学习
- JiT通过直接预测干净图像实现高质量去噪(FID 1.78)
- VARC用纯视觉模型在ARC-1上达到人类水平,展示视觉推理新范式
何恺明CVPR 2026JiTVARC视觉推理
百度文心走向原生全模态统一
- 百度在Create 2026宣布文心模型走向原生全模态统一架构
- 单一模型同时处理文本、图像、视频、语音、代码等多种模态
- 搜索已全面AI化,MaaS升级为Token Foundry(词元工厂)
百度文心全模态Token Foundry搜索AI化
AI漫剧迎来第一次泡沫破裂
- AI漫剧赛道经历第一波泡沫,多个明星项目用户增长放缓
- AI生成内容同质化严重,用户留存率低,商业化路径不清晰
- 行业需要回归内容本质,AI是工具而非内容本身
AI漫剧泡沫破裂同质化用户留存商业化
Spotify AI DJ扩展多语言覆盖,AI音频成战略重心
- Spotify AI DJ新增法语、德语、意大利语和巴西葡萄牙语支持
- 公司战略从流媒体平台转向AI生成个人音频平台
- AI DJ成为用户留存和差异化竞争的核心功能
SpotifyAI DJ多语言个人音频战略转型
Perceptron Mk1:视频分析AI成本比竞品低80-90%
- Perceptron发布Mk1视频分析AI模型,成本较Anthropic、OpenAI和Google低80-90%
- 定位"Physical AI",目标将物理AI像数字AI一样普及化
- 早期用户已用于体育赛事自动剪辑精彩片段
Perceptron Mk1视频分析80-90%便宜Physical AI体育剪辑
词元经济:AI时代从流量为王到Token为王
- 58同城日消耗近2000亿Token即将突破3000亿,有赞从三四百亿跃至2000亿年底目标5万亿
- 字节豆包日均Token突破120万亿,智谱API涨价83%调用量反增400%
- 阿里成立ATH事业群首次将Token写进组织结构,钉钉称软件已变"日抛品"
- 预测未来10年Token将涨10-50倍,但推理成本持续降低
词元经济Token58同城字节跳动API涨价
投融资
6 条
Cerebras IPO定价$185超预期:募资$55.5亿
- Cerebras Systems将IPO定价$185/股,远超预期$150-160区间
- 发行3000万股,完全稀释估值$564亿,Nasdaq代码CBRS
- AI芯片IPO热潮延续,华尔街对AI基础设施板块热情高涨
CerebrasIPO$55.5亿$564亿估值AI芯片
田渊栋创业融资$6.5亿:估值$46.5亿
- Recursive Superintelligence完成6.5亿美元融资,估值46.5亿美元
- GV、Greycroft领投,AMD Ventures和英伟达跟投
- 8位联创阵容豪华,核心方向为递归自我改进
Recursive Superintelligence$6.5亿$46.5亿田渊栋AI创业
微软洽谈收购Inception:要价超$10亿
- 微软正洽谈收购LLM开发商Inception,要价超$10亿
- SpaceX也曾竞标,微软此举是为OpenAI独立后的战略储备
- 反映大厂争抢AI模型开发能力的激烈程度
微软Inception收购$10亿大厂争夺
词元经济产业逻辑:AI融资热潮下的新秩序
- 字节跳动2026年资本支出1600亿元,饱和式推进Token生产-燃烧-变现体系
- 郭达雅以亿元年薪加盟字节跳动,林俊旸离职引发Qwen团队震荡
- 真格基金推出"Token Grant"计划向早期创业者提供Token
- 预测90%中小玩家可能在这一轮周期中出局
词元经济字节跳动$1600亿资本支出Token Grant行业洗牌
Anthropic vs OpenAI企业竞争白热化:Anthropic首次份额领先
- Ramp数据显示4月Anthropic企业采用率34.4%首次超过OpenAI的32.3%
- Anthropic同步调整编程额度政策引发开发者反弹,OpenAI以2个月免费Codex反击
- 竞争格局从"最好模型赢"转向"补贴+工作流控制+harness兼容性"
AnthropicOpenAI34.4%份额企业竞争定价战
Figure机器人获巨额融资,8小时班次证明商业化路径
- Figure完成新一轮融资,CEO Brett Adcock展示8小时全自主分拣班次
- 多机器人网络协同+低电量自主更换+故障自诊断,商业化演示远超竞品
- 2026年人形机器人赛道融资和商业化进展加速
Figure融资8小时班次商业化人形机器人
行业
9 条
奥特曼首度出庭作证:披露马斯克想让子女继承OpenAI控制权
- 奥特曼首次出庭作证:马斯克曾想让子女继承OpenAI控制权,自己"十分反感"
- 驳斥"OpenAI背叛初心":当年第二次会面就讨论过营利性公司文件,马斯克当时表示赞赏
- 评价马斯克"不懂如何运营研究实验室","电锯管理学"让关键研究人员士气受挫
- OpenAI已累计募集$1750亿,马斯克诉讼核心是将$1800亿转移至非营利母公司
奥特曼马斯克OpenAI诉讼出庭作证$1750亿
《纽约客》深度调查定性奥特曼:"不受真相的约束"
- Ronan Farrow历时一年采访100+人的调查:奥特曼"容易撒谎且觉得被发现了也无所谓"
- 前CTO穆拉蒂视频证词:奥特曼长期向不同高管提供不同版本事实,模糊安全审批节点
- 个人财富超$20亿:Helion核聚变$3.75亿投资纸面价值$16亿,被质疑利用OpenAI推高估值
- 国会5月11日要求奥特曼提交2015年至今所有利益冲突文件,5月22日为截止日
奥特曼纽约客利益冲突Helion国会调查
Claude Mythos Preview首个通过AISI全部端到端网络安全测试
- Anthropic/Glasswing的Claude Mythos Preview成为首个解决UK AISI全部端到端网络靶场的模型
- 包括Cooling Tower靶场,是唯一在250万token限制内清零所有任务项的模型
- UK AISI称前沿模型完成网络任务的长度每几月翻倍,近期模型已超越此趋势
- 独立测试显示更新版Mythos完成率从3/10提升至6/10
Claude MythosAISI网络安全Cooling Tower端到端测试
AI Vibe Coding技术债警示:3月积累361万行废弃代码
- 开发者继承3个月"vibe engineer"生成的仓库:309k LOC、240k文档、100万+markdown日志
- 220个handler仅20个在用,40+ secrets仅2个需要,用Claude一周重写
- 最终PR:+10,197行新增、-3,618,778行删除,成为职业生涯最 satisfying 的PR
- 社区热议:AI生成技术债可能催生"清理vibe-coded mess"新维护赛道
Vibe Coding技术债361万行AI生成代码代码清理
SWE-ZERO-12M:最大开放Agent轨迹数据集,112B token
- Kevin Li发布SWE-ZERO-12M-trajectories,定位最大开放Agent轨迹数据集
- 112B token、12M轨迹、122K PR、3K仓库、16种编程语言
- 为Agent训练和评估提供前所未有的规模数据支撑
- 社区呼吁Agent评估应从"仅看结果"转向"日志分析",更强Agent会暴露benchmark隐藏bug
SWE-ZERO-12MAgent轨迹112B token开放数据集Agent评估
第二届杭州国际人形机器人展:中国首个人形机器人全产业链展
- 展会汇聚全球顶尖人形机器人企业,覆盖整机、核心零部件、传感器、操作系统
- TrendForce预测中国2026年人形机器人产量增长94%,下半年进入商业化关键阶段
- 中国HEIS 2026框架成为全球首个综合国家标准体系
杭州机器人展人形机器人全产业链HEIS 2026商业化
百度Create 2026:DAA指标+新全栈AI云+驾驭工程
- 百度提出DAA(日活智能体数)替代DAU和Token作为AI时代价值度量衡
- 百度智能云升级为面向大规模智能体应用的新全栈AI云
- 提出驾驭工程概念:长上下文管理、持久记忆、工具调用、子智能体调度
- 从2010年NLP部到2026年DAA,百度AI长期主义路径得到验证
百度CreateDAA新全栈驾驭工程长期主义
味之素ABF膜:味精厂成日本最牛AI股,5年涨5倍
- 日本味之素凭借ABF膜(芯片封装绝缘材料)占据全球95%以上份额
- 5月11日宣布ABF涨价30%,股价当日暴涨10%,5年累计涨超500%
- AI GPU先进封装需20层以上ABF(普通CPU仅6层),单颗消耗量是普通CPU的9倍以上
- 年需求增速>40%但供给仅增10%-15%,无敌定价权
味之素ABF膜芯片封装95%份额AI基础设施
AI应用嵌入比例一年翻8倍:岗位正在被悄悄接管
- AI应用在企业中的嵌入比例一年内翻8倍,从辅助工具变为工作流核心
- 昆仑万维要求技术人员通过AI将研发效率提升50%,使用Token少的员工将被淘汰
- 钉钉管理层从5-7层压缩至1-3层,"软件变成日抛品"
- 未来将被淘汰:只会简单执行的文员、初级程序员、只做上传下达的中层管理者
AI渗透岗位替代组织变革中层压缩效率提升