AI 日报 · 2026-05-14
AI DAILY · 2026-05-14 · 周四

AI 日报 / 2026 年 05 月 14 日

今日收录 68 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

HackerNewsGitHub TrendingVentureBeatTechCrunch36Kr量子位smol.ai
GPT-5.6曝光
距5.5发布仅三周,内部代码标识ember-alpha/beacon-alpha,ultrafast模式提2-3倍速
田渊栋创业Recursive Superintelligence
6.5亿美元融资、$46.5亿估值,8位联创含Peter Norvig,黄仁勋苏妈都投了
Cerebras IPO定价$185
超预期区间$150-160,募资$55.5亿,完全稀释估值$564亿
Anthropic年化收入飙至$440亿
三个月估值从$3800亿翻至$9500亿,Claude Code年化$25亿
MiniMax发布Mavis多Agent系统
Leader-Worker-Verifier对抗式架构,上下文隔离+多任务并行
微软洽谈收购Inception
为后OpenAI时代做准备,SpaceX也曾竞标,要价超$10亿
Figure人形机器人8小时自主班次
Helix-02驱动的多机器人协同分拣,人机parity ~3s/package
🧠 大模型 9 条
大模型 5月14日
  • 前Meta FAIR科学家田渊栋联合创立Recursive Superintelligence,融资6.5亿美元,估值46.5亿美元
  • GV(谷歌风投)、Greycroft领投,AMD Ventures、英伟达跟投
  • CEO为前Salesforce AI研究负责人Richard Socher,8位联创来自OpenAI、DeepMind、Meta AI等
  • 核心方向:递归自我改进(AI用AI改进AI),重视可解释性,反对无脑堆算力
  • AI泰斗Peter Norvig参与合著,团队25人分布在旧金山和伦敦
田渊栋Recursive Superintelligence$46.5亿递归自我改进Peter Norvig
大模型 5月14日
  • Anthropic洽谈新一轮$300-500亿融资,估值目标$9500亿,5月底前可能完成
  • 年化收入已飙升至$440亿以上,推理毛利率从38%升至70%以上
  • Q1全球LLM市场份额31.4%超越OpenAI的29.0%,月活仅1.34亿但ARPU是OpenAI 7倍
  • Claude Code年化收入超$25亿,占同类工具54%市场份额,占GitHub公开提交约4%
  • 四大供养者锁定超20吉瓦算力:亚马逊$250亿+谷歌$400亿+SpaceX Colossus 300兆瓦+微软Azure
Anthropic$9500亿$440亿营收Claude CodeIPO
大模型 5月14日
OpenAI指控Anthropic收入注水$80亿:总额法vs净额法会计争议
  • OpenAI首席营收官Dresser内部备忘录:Anthropic采用总额法将渠道费计入营收
  • 按净额法计算,Anthropic$300亿年化收入应约为$220亿,低于OpenAI同期$250亿
  • Bank of America测算2026年Anthropic向AWS和谷歌支付渠道分成$64亿
  • 双方都在推进IPO,SEC可能强制统一会计口径,这实质是估值攻防战
AnthropicOpenAI总额法净额法$80亿争议
大模型 5月13日
GPT-5.5首破ProgramBench:0源码盲写程序,编程AI新纪元
  • GPT-5.5在Meta+斯坦福+哈佛联合推出的ProgramBench上首次破题,此前所有模型通过率0%
  • 26个任务通过95%以上单元测试,xhigh模式在累积直方图全程碾压所有对手
  • Claude Opus 4.7花费$10.74仅得最差成绩,GPT-5.5普通版仅$1.04、17次调用
  • 推理算力是核心变量:同一模型medium几乎交白卷,xhigh断层碾压
GPT-5.5ProgramBench盲写程序编程AI推理算力
大模型 5月13日
OpenAI前CTO Murati发布Interaction Model:200ms微轮次实现AI"共在"
  • Thinking Machines Lab发布交互模型,276B MoE参数(激活12B),200ms micro-turn永不停止
  • 解决共在性(多模态统一)、共时性(200ms心跳)、并发性(先读后写串行等效并行)
  • TimeSpeak测试64.7% vs GPT-4o realtime 4.3%,CueSpeak测试81.7% vs 2.9%
  • 双模型架构:Interaction Model保心跳+Background Model深度推理异步返回
Thinking MachinesMuratiInteraction Model200ms共在性
大模型 5月14日
OpenEvidence:被三分之二美国医生使用的AI医疗搜索工具
  • OpenEvidence AI医疗搜索工具称已覆盖约65万美国医生,国际范围另有120万
  • 定位面向医疗专业人员的AI辅助搜索和诊断支持工具
  • 反映AI在医疗专业场景的快速渗透和信任度建立
OpenEvidenceAI医疗65万医生医疗搜索诊断辅助
大模型 5月13日
百度Create 2026:提出DAA指标,重构AI时代价值度量衡
  • 百度在Create 2026大会提出DAA(Daily Active Agents,日活智能体数)新指标
  • 李彦宏:DAU代表眼球,Token代表成本,DAA代表生产力闭环
  • 百度智能云升级为"面向大规模智能体应用的新全栈AI云"
  • 提出"驾驭工程"(Harness Engineering)概念,强调长上下文管理和工具调度
百度DAA智能体Token价值度量衡
大模型 5月13日
Needle:26M参数单次函数调用模型,无FFN架构挑战常识
  • Cactus Compute开源Needle,仅26M参数的函数/工具调用模型,采用Simple Attention Network
  • 架构完全去掉FFN/MLP层,主张工具调用本质是检索/槽位提取/JSON组装而非深度推理
  • 在200B token上预训练27小时,2B Gemini合成数据后训练45分钟,消费设备6000 tok/s prefill
  • 在单次函数调用上超越FunctionGemma-270M、Qwen-0.6B、Granite-350M等大模型
Needle26M模型无FFN函数调用Simple Attention
⚙️ 训练推理 10 条
训练推理 5月13日
Codex Goal模式科研实测:博士80小时工作2小时完成,效率40倍
  • 机械可解释性研究任务:博士预计80小时,Codex /goal模式仅1小时56分钟完成
  • 最优配置为/goal + GPT-5.5 High + Fast Mode,效率提升约40倍
  • Darwin Gödel Machine(Sakana AI)能改写自己源代码,SWE-bench从20%自我提升至50%
  • 四位跨领域学者发表《AGI案例研究:今日LLM已达标》,行业正对公众进行"煤气灯效应"
Codex科研奇点40倍效率递归自我改进AGI
训练推理 5月13日
Bun用AI 6天将96万行Zig重写为Rust:Claude Code亲手重写了自己
  • Anthropic收购的Bun在6天内用AI将96万行Zig代码迁移为Rust,5月11日宣布Zig版本终结
  • 直接原因:Bun的WebKit Malloc导致Claude Code内存泄漏(RSS从1.7GB暴涨到14GB+)
  • Rust版通过99.8%测试套件,但13000+个unsafe调用引发"vibecoded disaster"争议
  • 与Zig社区哲学冲突:Zig禁止AI生成代码,而Anthropic是AI编程最激进推动者
BunZig到Rust96万行Claude CodeAI重写
训练推理 5月13日
NVIDIA Star Elastic:训练后模型压缩成本降低360倍
  • NVIDIA推出Star Elastic技术,实现训练后模型压缩的效率飞跃
  • 将模型压缩成本降低360倍,同时保持模型精度基本不损失
  • 针对AI推理部署成本高企问题,为大模型在企业端落地提供经济可行路径
NVIDIAStar Elastic模型压缩360倍推理部署
训练推理 5月14日
DeepSeek V4基准测试持续刷新,编程能力逼近GPT-5.5
  • DeepSeek V4在多项基准测试中持续刷新成绩,编程能力逼近GPT-5.5水平
  • 中美定价差距扩大至5-25倍,中国模型在等效性能下成本优势显著
  • 估值三周翻五倍,OpenAI跟投$300亿是最大单笔
DeepSeek V4编程能力5-25倍价差估值翻倍
训练推理 5月13日
React-doctor日增788星:捕获AI Agent编写的糟糕React代码
  • react-doctor在GitHub趋势日增788星,定位AI编码质量检测工具
  • 可自动识别AI Agent生成的有问题的React代码模式
  • 为AI辅助编码提供质量护栏,减少"看起来对但实际有问题"的代码
react-doctorAI编码质量React代码检测GitHub趋势
训练推理 5月13日
Nous Research Token Superposition Training:预训练2-3倍提速无需改推理架构
  • Nous Research提出Token Superposition Training,修改预训练早期阶段
  • 模型先读取/预测连续token bags再回到标准next-token prediction
  • 在匹配FLOPs下实现2-3倍墙钟时间加速,推理时架构完全不变
  • 从270M dense到10B-A1B MoE全尺寸验证,预训练效率突破
Token SuperpositionNous Research2-3倍提速预训练MoE
训练推理 5月13日
Multi-stream LLM:打破单流限制,实现并行推理和工具调用
  • Jonas Geiping等研究者发布多流LLM架构,挑战当前chat训练将Agent限制为单数据流
  • 主张Agent推理、工具调用、状态跟踪应由独立流并行处理,降低延迟
  • 实现更清晰的关注点分离和更可解释的并行推理/工具使用
  • 论文和代码已开源,对Agent架构设计有深远影响
Multi-stream LLM并行推理Agent架构Jonas Geiping工具调用
训练推理 5月12日
δ-mem外部记忆:冻结模型+在线联想记忆,基准提升1.10-1.15倍
  • δ-mem提出将外部在线联想记忆附加到冻结全注意力backbone上的方案
  • 仅8×8状态维度,平均基准分提升1.10倍,对比非δ-mem基线提升1.15倍
  • 在记忆密集型benchmark上增益更大,不改变推理架构
  • 为大模型提供低成本外部记忆增强路径
δ-mem外部记忆联想记忆基准提升冻结模型
训练推理 5月13日
Datology VLM数据策展:2B模型+11.7分提升,训练计算量仅为1/17
  • Datology展示VLM数据策展的巨大威力:在2B规模上跨20个公开VLM基准提升11.7分
  • 打败InternVL3.5-2B约10分,训练计算量仅为其1/17
  • 4B规模接近前沿水平,响应FLOPs比Qwen3-VL-4B低3.3倍
  • 证明数据质量而非模型规模是VLM性能关键杠杆
DatologyVLM数据策展11.7分提升训练效率
🤖 Agent 9 条
Agent 5月13日
Cline SDK开源:从CLI到完整Agent Harness平台
  • Cline开源重建版Cline SDK,附带全新TUI终端界面
  • 支持agent teams(多智能体团队)、scheduled jobs(定时任务)、connectors(连接器)
  • 定位为可复用的自定义编码Agent基座,成为OpenClaw之外最受欢迎的开源coding harness
  • 社区反响热烈,成为当日GitHub最高参与度的技术发布之一
Cline SDK开源Agent HarnessTUICoding Agent
Agent 5月13日
Notion发布开发者平台:工作空间变身AI Agent中枢
  • Notion推出全新开发者平台,允许团队将AI Agent、外部数据源和自定义代码集成到工作空间
  • 支持接入Claude、Codex、GPT等外部Agent,Business和Enterprise用户可用
  • 可部署自定义代码(Notion Workers)实现数据同步和Agent工具构建
  • 标志Notion从协作文档工具向Agent驱动生产力平台转型
NotionAI Agent开发者平台外部Agent生产力平台
Agent 5月13日
LangChain发布LangSmith Engine+SmithDB:Agent可观测性12-15倍提速
  • LangChain在Interrupt大会一口气发布7大Agent基础设施组件
  • 最核心技术亮点SmithDB:专为嵌套长时trace和大型payload设计的可观测性数据库
  • 基于Apache DataFusion和Vortex构建,关键workload访问速度提升12-15倍
  • 同步发布Sandboxes、Managed Deep Agents、LLM Gateway、Context Hub等
LangChainLangSmith EngineSmithDB可观测性Agent基础设施
Agent 5月13日
微软洽谈收购LLM开发商Inception:为后OpenAI时代布局
  • 微软正在洽谈收购LLM开发商Inception,要价超$10亿
  • SpaceX也曾接触Inception,微软此举是为OpenAI独立后做准备
  • 微软正广泛物色AI创业公司,此前还考虑收购Cursor但因GitHub Copilot冲突放弃
  • 反映微软与OpenAI排他性关系的持续松动
微软Inception收购后OpenAI$10亿
Agent 5月13日
Hermes Agent五层防烂尾机制:心跳→僵尸回收→退出拦截→幻觉拦截→重试预算
  • Nous Research发布Hermes Agent,五层工程化机制防止Agent任务烂尾
  • 第一层心跳检测证明存活,第二层超时僵尸回收,第三层未完成退出拦截
  • 第四层幻觉拦截验证代码实际落盘,第五层独立重试预算防无限循环
  • 与OpenAI Codex和Anthropic Claude Code /goal共同致敬Ralph Loop精神
Hermes AgentNous Research防烂尾五层机制多Agent
Agent 5月13日
Duet Agent:面向周/月级长时任务的状态机Harness
  • Duet Agent提出状态机架构,专为持续数周甚至数月的长周期任务设计
  • 支持父/子Agent协调,用持久化记忆替代上下文压缩
  • 与Claude Code /goal和Hermes Agent共同指向Agent UX新范式:长时运行+有状态+可检查
  • Agent产品正从聊天对话转向"持久执行+中间状态检查+工具原生UI"
Duet Agent状态机长时任务持久执行Agent UX
Agent 5月13日
Anthropic恢复OpenClaw和第三方Agent使用权限
  • Anthropic恢复Claude订阅用户对OpenClaw和第三方Agent的使用权
  • 6月15日起,付费用户每月获50%编程额度提升,覆盖Claude Agent SDK
  • OpenAI同步反击:迁移到Codex的企业获2个月免费使用权(约$400价值)
AnthropicOpenClaw第三方Agent额度提升Claude Agent SDK
Agent 5月13日
AI最先重构的不是产品,而是软件公司自身
  • 分析指出软件公司组织逻辑正在根本性变化:从流水线部门→混编小队围绕客户转
  • AI拆掉的不是人而是岗位,将"人的经验"变成"系统能力"
  • Shopify CEO:新增HC必须先证明AI不能完成;Salesforce一边用AI压缩客服一边增加AI销售
  • 未来软件公司=人类与Agent混编的小型作战组织,最大竞争力是响应速度而非规模
软件公司组织重构Agent混编中层压缩响应速度
🔧 基础设施 9 条
基础设施 5月13日
CoreWeave暴跌预警:OpenAI的"承诺换股"模式成为最危险资产
  • CoreWeave 67%营收来自微软,OpenAI合约金额超$220亿占签约收入三分之一
  • 《华尔街日报》报道OpenAI营收与用户增速未达内部预期,CFO担心无力支付
  • CoreWeave联合创始人等已套现超$60亿,数据中心行业信用状况恶化10%-12%
  • "星际之门"5000亿计划部分推进工作已停滞
CoreWeaveOpenAI营收风险$220亿合约AI基础设施
基础设施 5月13日
思科Q3营收$158.4亿创纪录:AI订单上调至$90亿,盘后涨19%+
  • 思科Q3营收同比增长12%至$158.4亿,超预期$155.6亿
  • AI基础设施YTD订单达$53亿,全年AI订单预测上调至$90亿
  • 同步宣布裁员约4000人,AI自动化替代趋势持续
  • 反映AI对传统网络设备商的双面影响:需求拉动+人力压缩
Cisco$158.4亿AI订单$90亿裁员4000网络设备
基础设施 5月13日
Claude Code定价变更引发开发者反弹,Theo和Jeremy Howard齐批
  • Anthropic宣布Claude付费计划每月编程额度改为专用credits,覆盖Agent SDK和第三方SDK应用
  • 权限社区视为对订阅补贴harness的重大限制,Theo、Jeremy Howard、Matt Pocock等集体批评
  • Anthropic部分安抚:Claude Code周额度提升50%至7月13日,叠加此前2倍5小时限制
  • OpenAI趁势推出企业迁移激励:30天内切换Codex获2个月免费
Claude Code定价争议开发者反弹Theo编程额度
基础设施 5月14日
OpenEvidence被三分之二美国医生使用的AI医疗搜索工具
  • AI医疗搜索工具OpenEvidence称覆盖约65万美国医生,国际另有120万
  • 反映AI在医疗专业场景的快速渗透和信任度建立
OpenEvidenceAI医疗65万医生诊断辅助
基础设施 5月14日
xAI向金融行业推销Grok:Apollo、大摩内部测试但实际使用率低
  • xAI推动金融行业采用Grok,Apollo Global、Morgan Stanley等正在进行内部测试
  • 但金融从业者很少在实际工作中使用Grok,实际转化率存疑
  • 反映Grok在企业级市场的渗透仍处于早期阶段
xAIGrok金融行业ApolloMorgan Stanley
基础设施 5月13日
ClickHouse定位AI日志实时分析引擎:AI Labs都在用
  • ClickHouse凭借OLAP+可观测性+AI Observability三重能力,成为AI日志分析热门选择
  • 多家AI Labs将其作为模型训练日志、推理监控和Agent行为追踪的底层引擎
  • 实时分析能力满足AI系统对毫秒级监控的需求
ClickHouseAI日志实时分析OLAP可观测性
基础设施 5月13日
TextGen变身原生桌面应用:oobabooga打造LM Studio开源替代
  • oobabooga将text-generation-webui重构为便携式无需安装的Electron桌面应用
  • 支持CUDA/Vulkan/CPU-only/ROCm/Apple Silicon多平台,零外部请求
  • 集成MCP工具调用(带审批门控)、PDF提取、Web搜索、Claude Code兼容API
  • 定位为隐私友好的LM Studio开源替代,社区反响热烈
TextGenoobaboogaLM Studio替代原生桌面MCP
基础设施 5月13日
Cursor扩展Cloud Agents:完整开发环境含cloned repos和版本回滚
  • Cursor扩展云端Agent功能,支持完整配置的开发环境
  • 包含cloned repos、依赖安装、版本历史、回滚、作用域egress和隔离secrets
  • 标志coding agent从"生成代码"向"管理完整开发环境"演进
CursorCloud Agents开发环境版本回滚Coding Agent
🦾 机器人 7 条
机器人 5月14日
第二届杭州国际人形机器人与机器人技术展览会开幕
  • 2026第二届杭州HRTE在杭州大会展中心举办,为期三天(5月14-16日)
  • 中国首个人形机器人全产业链专业展,总面积6万平方米
  • 汇聚全球顶尖人形机器人企业,预计接待10万专业观众
  • 覆盖整机、核心零部件、传感器、操作系统等全产业链
杭州机器人展HRTE人形机器人全产业链6万平方米
机器人 5月13日
接入AI Agent的家庭机器人交互时长跃升至2小时
  • 接入腾讯ClawPro后,家庭机器人内测用户日均交互从30分钟跃升至2小时
  • AI Agent赋能让家庭机器人从"工具"升级为"类家人"角色
  • 反映AI Agent在消费级机器人场景的巨大商业化潜力
家庭机器人ClawProAI Agent2小时交互消费级
机器人 5月13日
中国具身智能机器人走向高风险工业前沿
  • 中国多家具身智能企业部署至高压电巡检、核设施维护等高风险场景
  • "操作即收集"反馈循环让机器人越用越聪明,非结构化环境适应性显著增强
  • 具身智能被纳入最新五年计划,列为经济增长新引擎
工业机器人高风险场景五年计划非结构化电巡检
机器人 5月13日
Apptronik累计融资$9.35亿,人形机器人商业化领跑
  • 人形机器人初创Apptronik累计融资$9.35亿,估值突破$50亿
  • 与多家制造业客户签署部署协议,商业化进展领先同类公司
  • 2026年被视为人形机器人赛道商业化元年
Apptronik$9.35亿$50亿人形机器人商业化
机器人 5月13日
LangForce破解VLA模型视觉捷径:分布外泛化提升至66.5%
  • 华中科技大学等团队发现VLA模型忽视语言指令的"视觉捷径"问题
  • 仅视觉模型在OOD场景成功率接近0%,提出LangForce方法引入LLR损失函数
  • 在SimplerEnv OOD场景达66.5%(提升11.3%),推理时无额外开销
  • 通过显式最大化语言信息增益,确保模型真正理解并遵循指令
LangForceVLA视觉捷径分布外泛化指令跟随
机器人 5月13日
林俊旸创业聚焦世界模型和具身大脑:估值约$20亿
  • 前阿里千问大模型技术负责人林俊旸启动创业,聚焦世界模型和具身智能
  • 新公司估值约$20亿,已接触红杉中国、高榕创投等,团队含字节腾讯海外背景成员
  • 因阿里将Qwen团队拆分重组而离职,具身智能和世界模型成VC和大牛押注方向
  • 对标公司:World Labs($50亿)、AMI Labs($35亿)
林俊旸世界模型具身智能$20亿千问
🎨 多模态 8 条
多模态 5月12日
谷歌Gemini Omni视频模型泄露:统一图像+视频+音频生成
  • Gemini Omni模型出现在Gemini App视频生成标签页,5月12日截图引发关注
  • 定位Gemini自研全新模型家族首个成员,单次前向推理同时完成图像+视频+音频生成
  • 支持视频remix、编辑和从简单提示生成高质量样本,早期反馈称赞数学连贯性和语音质量
  • 可能于5月19日Google I/O 2026正式发布
Gemini OmniGoogle I/O视频生成统一模型泄露
多模态 5月13日
何恺明CVPR 2026五篇论文:从流匹配到视觉推理
  • 何恺明团队在CVPR 2026发表五篇论文,覆盖生成模型、视觉推理与自监督学习
  • JiT通过直接预测干净图像实现高质量去噪(FID 1.78)
  • VARC用纯视觉模型在ARC-1上达到人类水平,展示视觉推理新范式
何恺明CVPR 2026JiTVARC视觉推理
多模态 5月13日
百度文心走向原生全模态统一
  • 百度在Create 2026宣布文心模型走向原生全模态统一架构
  • 单一模型同时处理文本、图像、视频、语音、代码等多种模态
  • 搜索已全面AI化,MaaS升级为Token Foundry(词元工厂)
百度文心全模态Token Foundry搜索AI化
多模态 5月13日
AI漫剧迎来第一次泡沫破裂
  • AI漫剧赛道经历第一波泡沫,多个明星项目用户增长放缓
  • AI生成内容同质化严重,用户留存率低,商业化路径不清晰
  • 行业需要回归内容本质,AI是工具而非内容本身
AI漫剧泡沫破裂同质化用户留存商业化
多模态 5月13日
Spotify AI DJ扩展多语言覆盖,AI音频成战略重心
  • Spotify AI DJ新增法语、德语、意大利语和巴西葡萄牙语支持
  • 公司战略从流媒体平台转向AI生成个人音频平台
  • AI DJ成为用户留存和差异化竞争的核心功能
SpotifyAI DJ多语言个人音频战略转型
多模态 5月13日
Perceptron Mk1:视频分析AI成本比竞品低80-90%
  • Perceptron发布Mk1视频分析AI模型,成本较Anthropic、OpenAI和Google低80-90%
  • 定位"Physical AI",目标将物理AI像数字AI一样普及化
  • 早期用户已用于体育赛事自动剪辑精彩片段
Perceptron Mk1视频分析80-90%便宜Physical AI体育剪辑
多模态 5月13日
词元经济:AI时代从流量为王到Token为王
  • 58同城日消耗近2000亿Token即将突破3000亿,有赞从三四百亿跃至2000亿年底目标5万亿
  • 字节豆包日均Token突破120万亿,智谱API涨价83%调用量反增400%
  • 阿里成立ATH事业群首次将Token写进组织结构,钉钉称软件已变"日抛品"
  • 预测未来10年Token将涨10-50倍,但推理成本持续降低
词元经济Token58同城字节跳动API涨价
💰 投融资 6 条
投融资 5月14日
田渊栋创业融资$6.5亿:估值$46.5亿
  • Recursive Superintelligence完成6.5亿美元融资,估值46.5亿美元
  • GV、Greycroft领投,AMD Ventures和英伟达跟投
  • 8位联创阵容豪华,核心方向为递归自我改进
Recursive Superintelligence$6.5亿$46.5亿田渊栋AI创业
投融资 5月13日
微软洽谈收购Inception:要价超$10亿
  • 微软正洽谈收购LLM开发商Inception,要价超$10亿
  • SpaceX也曾竞标,微软此举是为OpenAI独立后的战略储备
  • 反映大厂争抢AI模型开发能力的激烈程度
微软Inception收购$10亿大厂争夺
投融资 5月13日
词元经济产业逻辑:AI融资热潮下的新秩序
  • 字节跳动2026年资本支出1600亿元,饱和式推进Token生产-燃烧-变现体系
  • 郭达雅以亿元年薪加盟字节跳动,林俊旸离职引发Qwen团队震荡
  • 真格基金推出"Token Grant"计划向早期创业者提供Token
  • 预测90%中小玩家可能在这一轮周期中出局
词元经济字节跳动$1600亿资本支出Token Grant行业洗牌
投融资 5月13日
Anthropic vs OpenAI企业竞争白热化:Anthropic首次份额领先
  • Ramp数据显示4月Anthropic企业采用率34.4%首次超过OpenAI的32.3%
  • Anthropic同步调整编程额度政策引发开发者反弹,OpenAI以2个月免费Codex反击
  • 竞争格局从"最好模型赢"转向"补贴+工作流控制+harness兼容性"
AnthropicOpenAI34.4%份额企业竞争定价战
投融资 5月13日
Figure机器人获巨额融资,8小时班次证明商业化路径
  • Figure完成新一轮融资,CEO Brett Adcock展示8小时全自主分拣班次
  • 多机器人网络协同+低电量自主更换+故障自诊断,商业化演示远超竞品
  • 2026年人形机器人赛道融资和商业化进展加速
Figure融资8小时班次商业化人形机器人
🌐 行业 9 条
行业 5月13日
《纽约客》深度调查定性奥特曼:"不受真相的约束"
  • Ronan Farrow历时一年采访100+人的调查:奥特曼"容易撒谎且觉得被发现了也无所谓"
  • 前CTO穆拉蒂视频证词:奥特曼长期向不同高管提供不同版本事实,模糊安全审批节点
  • 个人财富超$20亿:Helion核聚变$3.75亿投资纸面价值$16亿,被质疑利用OpenAI推高估值
  • 国会5月11日要求奥特曼提交2015年至今所有利益冲突文件,5月22日为截止日
奥特曼纽约客利益冲突Helion国会调查
行业 5月13日
Claude Mythos Preview首个通过AISI全部端到端网络安全测试
  • Anthropic/Glasswing的Claude Mythos Preview成为首个解决UK AISI全部端到端网络靶场的模型
  • 包括Cooling Tower靶场,是唯一在250万token限制内清零所有任务项的模型
  • UK AISI称前沿模型完成网络任务的长度每几月翻倍,近期模型已超越此趋势
  • 独立测试显示更新版Mythos完成率从3/10提升至6/10
Claude MythosAISI网络安全Cooling Tower端到端测试
行业 5月13日
AI Vibe Coding技术债警示:3月积累361万行废弃代码
  • 开发者继承3个月"vibe engineer"生成的仓库:309k LOC、240k文档、100万+markdown日志
  • 220个handler仅20个在用,40+ secrets仅2个需要,用Claude一周重写
  • 最终PR:+10,197行新增、-3,618,778行删除,成为职业生涯最 satisfying 的PR
  • 社区热议:AI生成技术债可能催生"清理vibe-coded mess"新维护赛道
Vibe Coding技术债361万行AI生成代码代码清理
行业 5月13日
SWE-ZERO-12M:最大开放Agent轨迹数据集,112B token
  • Kevin Li发布SWE-ZERO-12M-trajectories,定位最大开放Agent轨迹数据集
  • 112B token、12M轨迹、122K PR、3K仓库、16种编程语言
  • 为Agent训练和评估提供前所未有的规模数据支撑
  • 社区呼吁Agent评估应从"仅看结果"转向"日志分析",更强Agent会暴露benchmark隐藏bug
SWE-ZERO-12MAgent轨迹112B token开放数据集Agent评估
行业 5月14日
第二届杭州国际人形机器人展:中国首个人形机器人全产业链展
  • 展会汇聚全球顶尖人形机器人企业,覆盖整机、核心零部件、传感器、操作系统
  • TrendForce预测中国2026年人形机器人产量增长94%,下半年进入商业化关键阶段
  • 中国HEIS 2026框架成为全球首个综合国家标准体系
杭州机器人展人形机器人全产业链HEIS 2026商业化
行业 5月13日
百度Create 2026:DAA指标+新全栈AI云+驾驭工程
  • 百度提出DAA(日活智能体数)替代DAU和Token作为AI时代价值度量衡
  • 百度智能云升级为面向大规模智能体应用的新全栈AI云
  • 提出驾驭工程概念:长上下文管理、持久记忆、工具调用、子智能体调度
  • 从2010年NLP部到2026年DAA,百度AI长期主义路径得到验证
百度CreateDAA新全栈驾驭工程长期主义
行业 5月13日
味之素ABF膜:味精厂成日本最牛AI股,5年涨5倍
  • 日本味之素凭借ABF膜(芯片封装绝缘材料)占据全球95%以上份额
  • 5月11日宣布ABF涨价30%,股价当日暴涨10%,5年累计涨超500%
  • AI GPU先进封装需20层以上ABF(普通CPU仅6层),单颗消耗量是普通CPU的9倍以上
  • 年需求增速>40%但供给仅增10%-15%,无敌定价权
味之素ABF膜芯片封装95%份额AI基础设施
行业 5月13日
AI应用嵌入比例一年翻8倍:岗位正在被悄悄接管
  • AI应用在企业中的嵌入比例一年内翻8倍,从辅助工具变为工作流核心
  • 昆仑万维要求技术人员通过AI将研发效率提升50%,使用Token少的员工将被淘汰
  • 钉钉管理层从5-7层压缩至1-3层,"软件变成日抛品"
  • 未来将被淘汰:只会简单执行的文员、初级程序员、只做上传下达的中层管理者
AI渗透岗位替代组织变革中层压缩效率提升