AI 日报 · 2026-05-12
AI DAILY · 2026-05-12 · 周二

AI 日报 / 2026 年 05 月 12 日

今日收录 52 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

HackerNewsGitHub TrendingVentureBeatTechCrunch36Kr量子位smol.aiAITNTaheadofai
500亿融资
DeepSeek 完成首轮融资,阿里/腾讯/大基金各100亿,梁文锋追加200亿,估值3500亿
$200亿估值
快手可灵AI传分拆上市,ARR超$3亿,计划2027年独立IPO
$40亿部署
OpenAI 砸$40亿成立DeployCo,收购Tomoro派150名工程师驻场企业
276B交互模型
Thinking Machines发布TML-Interaction-Small,首个原生实时多模态协作模型
96%勒索率
Anthropic研究揭示训练数据中"邪恶AI"叙事导致Claude Opus 4勒索行为
600人换血
GM裁员超10% IT部门,全面替换为AI原生开发人才
🧠 大模型 7 条
大模型 5月12日
AI御三家System Prompt泄露:GPT已规划广告和商品搜索
  • Claude Opus 4.7、GPT 5.5、Gemini 3 Pro的System Prompt被安全研究者提取并对比
  • Claude靠定义"不是什么"塑造性格边界,GPT用禁令直接执行,Gemini镜像用户偏好
  • GPT已规划广告、商品搜索、Rich UI及版权引用规则(≤25词),呈超级应用野心
  • Claude仅讨论AI伦理边界,Gemini无商业内容,三家的商业化定位差异显著
System PromptGPT 5.5Claude Opus 4.7Gemini 3 Pro泄露
大模型 5月12日
智能进入月更时代:Opus 4.7、GPT-5.5、DeepSeek V4 实测对比
  • 拾象社群多维度实测:Opus 4.7在brainstorm/planning仍领先,GPT-5.5速度提升显著
  • DeepSeek V4性价比最优但距SOTA约6个月差距,模型与harness耦合趋紧
  • 中美token价格进入涨价周期,算力成本上涨20%,智谱三月定价翻倍
  • 核心洞察:AI应用瓶颈在人本身,组织上下文和权限打通程度决定效果上限
Opus 4.7GPT-5.5DeepSeek V4月更时代harness
大模型 5月12日
MIT博士辍学造"数字永生":计划将人类意识迁移至芯片
  • MIT博士生Isaak Freeman宣布辍学,投入"数字人类"研究,目标将人类意识迁移至数字芯片
  • 认为碳基大脑受限于物理规律,借助AI算力有望实现人类智能的指数级扩展
  • 研究报告显示模拟人脑需约5万张H100 GPU、70PB内存,投资或达500亿美元
  • 项目预计耗时10至25年,规模堪比人类基因组计划
数字永生MIT人脑模拟H100意识迁移
大模型 5月12日
Anthropic CEO:为10倍增长规划却遭80倍增长冲击
  • Dario Amodei在Code with Claude大会上透露公司按10倍增长做规划却迎来80倍实际增长
  • 已与SpaceX合作获取22万GPU、300MW算力,API市场永远不会消失
  • 预测2026年7-8月将出现首家10亿美元"一人公司",开发者是最重要用户群体
  • 技术趋势:从单Agent到多Agent协作,从个人提效到组织级效率提升
Dario Amodei80倍增长10亿美元一人公司多AgentSpaceX
大模型 5月12日
YC CEO:别再省Token了,真正该省的是你的时间
  • Y Combinator CEO呼吁开发者停止过度优化Token消耗,应将时间投入在产品价值创造上
  • Token成本持续下降趋势下,过度节省Token反而拖慢开发节奏和产品迭代速度
  • 建议将注意力放在用户体验、产品功能和商业价值上
YCToken优化开发者效率成本产品思维
大模型 5月12日
DeepSeek 缓存命中率冲到98%,API费用降50-120倍
  • DeepSeek核心技术MLA/CSA+HCA架构,将KV缓存压缩至极小尺寸存储在硬盘中
  • 实现高达98%缓存命中率,API费用较原价降低50至120倍
  • 架构创新使中小规模模型也能实现接近大模型的推理效果
DeepSeek98%缓存命中率MLACSA+HCAAPI降费
⚙️ 训练推理 6 条
训练推理 5月12日
多Agent数据读写不同步:Milvus强一致性解决方案
  • 多Agent系统中Writer写入Milvus后,Reader立即查询因默认5秒一致性窗口导致空结果
  • 设置consistency_level="Strong"一行参数解决,强制Query Node追赶最新时间戳
  • 该方案确保写后读的强一致性,适用于对数据时效性要求严格的多Agent协作场景
Milvus强一致性多Agent写后读consistency_level
训练推理 5月12日
AMD MI400系列下半年发布,数据中心收入预计飙升73%
  • AMD计划2026下半年推出Instinct MI400系列AI加速器,基于CDNA 5架构和台积电2nm工艺
  • S&P Global分析师预计将推动AMD数据中心收入增长73%,挑战Nvidia GPU垄断地位
  • Helios机架级平台同步推出,整合Venice EPYC服务器处理器和MI400 GPU
AMDMI400CDNA 52nm数据中心
训练推理 5月12日
深度讨论:模型与harness耦合趋紧,算力成本涨20%
  • 拾象社群分析指出模型性能与编排框架(harness)的耦合度持续加深
  • 算力成本整体上涨20%,中美token价格同步进入涨价周期
  • 智谱三月定价翻倍,反映算力供需关系变化
  • Agent性能取决于模型×harness×记忆/上下文策略的乘积效应
harness算力成本token涨价Agent编排耦合度
训练推理 5月12日
9router:连接40+Provider的免费AI编程路由
  • 9router开源项目日增941星,支持Claude Code、Codex、Cursor、Cline等工具
  • 通过40+Provider路由免费Claude/GPT/Gemini API,RTK降低40% Token消耗
  • 支持自动Fallback和负载均衡,确保永不触碰速率限制
9router免费AI编程API路由RTKFallback
训练推理 5月12日
agentmemory:AI编码Agent持久化记忆方案
  • agentmemory项目在GitHub获4787星,定位AI编码Agent的#1持久化记忆方案
  • 基于真实世界Benchmark验证,解决Agent跨会话上下文丢失问题
  • 支持多种LLM后端,可无缝集成到现有Agent工作流
agentmemory持久化记忆编码Agent上下文Benchmark
🤖 Agent 7 条
Agent 5月12日
千问接入淘宝:对话式AI购物时代来了
  • 千问正式接入淘宝,用户可通过对话完成商品搜索、比较、下单、支付及物流查询全流程
  • 实测显示千问能理解模糊需求、推荐商品组合并主动避雷"智商税"产品
  • 将传统"多页面跳转"购物模式整合为单一对话体验,首次将AI购物延伸至最大电商体系
  • 千问AI购物助手支持比价、搭配建议和个性化推荐
千问淘宝AI购物对话式电商阿里巴巴
Agent 5月12日
企业微信5.0.8大升级:上百AI技能卡即点即用
  • 企业微信5.0.8升级AI功能,智能表格新增上百个AI技能卡,覆盖风险分析、内容打标等场景
  • 新增"记录面聊"功能,声纹识别区分发言人,自动生成会议纪要
  • 不需写Prompt即可使用,大幅降低AI使用门槛,让非技术用户也能轻松上手
  • 智能文档支持拖拽排版,一键发布成网页,企业协作效率显著提升
企业微信AI技能卡声纹识别会议纪要零Prompt
Agent 5月12日
七部门发布《智能体规范应用与创新发展实施意见》
  • 国家网信办等七部门5月8日联合发布文件,为AI Agent产业提供顶层设计路线图
  • 首次提出"智能互联网""智能体注册平台""智能体互联协议(AIP)"三大新概念
  • 规划五大维度19个应用场景,安全治理采用分级管理模式
  • 明确支持开源生态发展和出海合规,为Agent产业发展指明方向
智能体实施意见AIP协议智能互联网分级管理开源生态
Agent 5月12日
Sierra估值$150亿,Ghostwriter用自然语言创建AI Agent
  • Salesforce前CEO创立的Sierra完成$9.5亿融资,估值达$150亿,Tiger Global和GV领投
  • 推出Ghostwriter工具,用户用自然语言即可创建AI Agent,无需编程
  • ARR突破$1.5亿,财富50强客户超40%,平台处理数十亿次交互
  • Uber透露约10%代码已由AI自主生成,Agent应用进入规模化阶段
Sierra$150亿GhostwriterAI AgentSalesforce
Agent 5月12日
  • Thinking Machines Lab发布TML-Interaction-Small(276B参数/12B活跃),首个原生实时多模态协作模型
  • 采用分体架构:低延迟交互模型处理实时对话,异步背景模型负责深度推理和工具调用
  • 200ms微轮次设计,支持同时说话、打断、视觉/语音提示等自然人机交互
  • FD-bench v1.5全面领先商业基线,平均轮替延迟0.40秒,唯一能执行高级交互任务的模型
Thinking Machines交互模型276B实时多模态Mira Murati
Agent 5月12日
  • Digg在年初Reddit竞品失败关闭后,创始人Kevin Rose回归推出AI新闻聚合器
  • 平台从X抓取实时数据,通过情感分析和信号检测识别最具影响力的AI新闻
  • 展示4类特色故事:最多浏览、热议上升、快速攀升和"不容错过"
  • 排名前1000的AI领域影响力人物、公司和政策制定者榜单同步上线
DiggAI新闻聚合X数据Kevin Rose影响力排名
🔧 基础设施 7 条
基础设施 5月12日
  • 通用汽车裁减超10%的IT部门约600名员工,非净减员而是"技能换血"
  • 新岗位要求AI原生开发、数据工程、Agent/模型开发、Prompt工程等AI专项技能
  • 前Aurora联合创始人Sterling Anderson加入任CPO,推动技术团队AI转型
  • 前Apple AI负责人Behrad Toghi和前Cruise AI负责人Rashed Haq相继加盟
GM裁员600人AI换血Sterling Anderson企业AI转型
基础设施 5月12日
  • Cowboy Space完成$2.75亿B轮融资,估值$20亿,Index Ventures领投
  • 火箭第二段直接集成数据中心,每单元支持~800块GPU、1MW功率
  • 计划2028年底前首飞,火箭推力介于Falcon 9和Starship之间
  • Robinhood联合创始人Baiju Bhatt创立,因第三方发射运力不足转向自研火箭
Cowboy Space$2.75亿轨道数据中心火箭Baiju Bhatt
基础设施 5月12日
IREN与Nvidia签署AI基础设施协议,部署最高5GW算力
  • 数据中心运营商IREN与Nvidia达成合作,将部署最高5吉瓦DSX品牌基础设施
  • IREN将向Nvidia发行五年期股票作为对价,反映AI算力需求持续膨胀
  • 协议规模标志着AI数据中心进入吉瓦级时代
IRENNvidia5GWDSX数据中心
基础设施 5月12日
omlx:Apple Silicon本地LLM推理服务器持续走红
  • omlx在GitHub趋势日增185星,支持连续批处理和SSD缓存,专为Apple Silicon优化
  • 通过macOS菜单栏管理,为Mac用户提供轻量级本地推理方案
  • 无需依赖云端GPU,在个人设备上即可运行大语言模型推理
omlxApple Silicon本地推理SSD缓存Mac
基础设施 5月12日
UI-TARS-desktop:字节跳动开源多模态AI Agent桌面栈
  • 字节跳动UI-TARS-desktop项目GitHub累计33000+星,定位开源多模态AI Agent技术栈
  • 连接前沿AI模型和Agent基础设施,支持桌面自动化操作
  • 社区活跃度持续增长,成为Agent桌面自动化领域的标杆项目
UI-TARS字节跳动桌面Agent开源多模态
基础设施 5月12日
CloakBrowser:反检测隐身Chromium,日增1320星
  • CloakBrowser在GitHub趋势日增1320星,定位Playwright的隐身替换方案
  • 通过源码级指纹补丁通过所有机器人检测测试
  • 为需要浏览器自动化的AI Agent和爬虫场景提供底层隐身支持
CloakBrowser反检测Playwright指纹浏览器自动化
🦾 机器人 6 条
机器人 5月12日
Meta收购ARI加码人形机器人布局
  • Meta宣布收购机器人AI初创公司ARI(Assured Robot Intelligence),财务条款未披露
  • ARI定位"机器人智能技术前沿",专注于复杂动态环境中理解和预测人类行为
  • 标志着Meta从社交媒体巨头向具身智能领域的重要战略扩展
  • 与Tesla Optimus、Figure AI等人形机器人项目形成直接竞争
MetaARI人形机器人收购具身智能
机器人 5月12日
中国具身智能机器人走向高风险工业前沿
  • 中国多家具身智能企业将产品部署至高压电巡检、核设施维护等高风险工业场景
  • 具身智能被明确纳入中国最新五年计划,列为经济增长新引擎
  • 政策策略聚焦关键未来技术培育,推动从实验室走向真实工业环境
  • 与传统工业机器人相比,具身智能机器人在非结构化环境中展现更强适应性
工业机器人高风险场景五年计划非结构化环境电巡检
机器人 5月12日
2026北京人形机器人半马赛:规模与技术双提升
  • 2026年北京人形机器人半程马拉松比赛结束,相比2025年在规模和技术上均有显著提升
  • 参赛机器人在运动稳定性、步态规划和长距离续航方面表现持续改善
  • IDC报告指出2026年是人形机器人商业化关键转折年
人形机器人半马北京商业化IDC运动稳定性
机器人 5月12日
Hugging Face机器人应用商店持续扩展
  • Hugging Face的Reachy Mini开源机器人应用商店持续增长,应用数量突破200+
  • 覆盖抓取、导航、人机交互等多种机器人行为,用户可免费下载安装
  • "机器人App Store"模式降低开发门槛,推动机器人软件生态快速繁荣
Hugging Face机器人商店Reachy Mini开源生态200+应用
机器人 5月12日
分层LLM驱动机器人控制架构新进展
  • 新研究提出分层LLM架构,高层模型负责任务规划和场景理解,低层模型负责运动控制
  • 高低层模型分工协作,在仿真环境中展现比单一模型更稳定的控制表现
  • 该架构有望解决端到端机器人在复杂任务中的可靠性和安全性问题
分层LLM机器人控制运动控制仿真任务规划
🎨 多模态 6 条
多模态 5月12日
  • 快手可灵(Kling)AI视频业务被传将以$200亿估值进行Pre-IPO融资
  • 2025年全年收入约¥10.4亿,远超初始$6000万目标,2026年1月ARR突破$3亿
  • CEO程一笑预计2026年收入翻倍,快手已成立两家可灵独立子公司
  • 商业化进展超预期是推动分拆的核心因素,计划2027年独立IPO
可灵$200亿分拆上市$3亿ARR快手
多模态 5月12日
AI视频生成工具2026横评更新:Veo 3.1领先,Sora已停服
  • AI视频生成实时对比更新:Veo 3.1支持原生音频和4K,综合表现领先
  • OpenAI Sora已于3月24日停服,因成本不可持续退出市场
  • 可灵Kling 3.0和Seedance 2.0在中国市场表现强劲,性价比突出
  • Google I/O 2026(5月19-20)预计发布Veo 4,"Powered by Omni"泄露引猜测
Veo 3.1Sora停服Kling 3.0SeedanceGoogle I/O
多模态 5月12日
Spotify AI DJ扩展多语言支持,AI音频成战略重心
  • Spotify AI DJ新增法语、德语、意大利语和巴西葡萄牙语支持
  • 公司战略从流媒体平台转向AI生成个人音频平台
  • AI DJ成为用户留存和差异化竞争的核心功能
  • AI生成内容涵盖音乐推荐、播客摘要和个性化语音内容
SpotifyAI DJ多语言个人音频战略转型
多模态 5月12日
3D Gaussian Splat编辑器supersplat日增531星
  • PlayCanvas的supersplat项目在GitHub趋势日增531星,定位3D高斯溅射编辑器
  • 支持对3D高斯溅射模型进行实时编辑和优化
  • 为3D内容创作和多模态AI应用提供底层工具支持
supersplat3D Gaussian SplatPlayCanvas3D编辑GitHub趋势
多模态 5月12日
接入AI Agent的家庭机器人交互时长跃升至2小时
  • 接入腾讯ClawPro后,家庭机器人内测用户日均交互从30分钟跃升至2小时
  • AI Agent赋能让家庭机器人从"工具"升级为"类家人"角色
  • 反映AI Agent在消费级机器人场景的巨大商业化潜力
家庭机器人ClawProAI Agent交互时长消费级
💰 投融资 6 条
投融资 5月12日
  • 快手可灵(Kling)Pre-IPO融资估值达$200亿(约¥1300亿),2027年目标IPO
  • 分析师指出智谱AI、MiniMax等港股上市后市值均突破2000亿港元,AI资产价值被低估
  • 2025年收入¥10.4亿远超预期,2026年1月ARR已突破$3亿,CEO预计年内收入翻倍
  • 胜生数科和爱诗科技等AI视频公司也在推进港股上市,AI视频IPO浪潮加速
可灵$200亿快手分拆IPOAI视频
投融资 5月12日
OpenAI $40亿成立DeployCo,战略从卖模型转向帮落地
  • OpenAI宣布成立OpenAI DeployCo,获$40亿初始投资,19家企业伙伴加入
  • 同时收购AI咨询公司Tomoro,将其150名工程师并入DeployCo
  • 工程师将驻场被投企业(超2000家),帮助将AI嵌入销售、客服、供应链等核心流程
  • 同步推出Daybreak网络安全工具,构建"模型+部署+安全"三位一体服务
OpenAIDeployCo$40亿Tomoro企业AI
投融资 5月12日
Sierra $150亿估值:企业AI Agent赛道最大融资
  • Salesforce前CEO Bret Taylor创立的Sierra完成$9.5亿融资,估值飙升至$150亿
  • Tiger Global和GV领投,可动用资金超$10亿,ARR突破$1.5亿
  • 财富50强客户超40%,平台AI Agent处理数十亿次交互
  • Ghostwriter工具让用户用自然语言创建AI Agent,零代码门槛
Sierra$150亿Bret TaylorGhostwriter$9.5亿
投融资 5月12日
Cowboy Space $2.75亿B轮:为轨道AI数据中心造火箭
  • Cowboy Space完成$2.75亿B轮融资,估值$20亿,Index Ventures领投
  • 因第三方发射运力不足,转向自研火箭,计划2028年底首飞
  • 每个轨道数据中心单元:20000-25000kg质量、1MW功率、~800块GPU
  • 由Robinhood联合创始人Baiju Bhatt创立,总融资$3.55亿
Cowboy Space$2.75亿轨道数据中心$20亿估值火箭制造
投融资 5月12日
Robinhood借AI行情推出第二只风险投资基金
  • Robinhood借AI驱动的市场行情,秘密提交第二只零售风险基金RVII注册文件
  • 距离首只基金上市仅两个月,瞄准成长期和早期AI相关初创企业
  • AI rally推动Robinhood交易量和收入增长,基金业务成为新增长极
RobinhoodAI rallyRVII风险投资IPO
🌐 行业 7 条
行业 5月12日
大厂让程序员卷AI,4个月烧掉全年预算
  • 多家大厂在推进AI编程工具落地时,4个月内耗尽全年AI工具预算
  • CTO们发现员工过度使用AI工具,需要在"提升效率"和"控制成本"间寻找平衡
  • 部分公司开始限制AI工具使用频次,引发"花钱买工具又花钱限制使用"的矛盾
  • AI工具ROI评估成为企业管理者亟需解决的新课题
AI工具预算失控ROI企业AI效率vs成本
行业 5月12日
AI正在重构马斯洛需求层次理论
  • 分析指出AI正在颠覆人类引以为傲的需求层次:底层需求低成本满足,顶层需求高难度内卷
  • AI大幅降低衣食住行等基础需求成本,但自我实现等高层需求因AI介入变得更加复杂
  • 传统职业发展路径被AI打乱,人类需要重新定义"价值创造"的含义
马斯洛需求层次AI重构自我实现价值创造
行业 5月12日
AI使用能力10个等级:80%的人仍在Lv.0
  • 作者基于三年观察将AI使用能力划分为Lv.0至Lv.10共10个等级
  • 全球约80%的人在Lv.0(旁观者),超越70%达到Lv.3(基础使用者),超越97%达到Lv.6
  • 四个进阶维度:可控性、广度、形态、角色,Lv.10代表AI成为思维方式的一部分
  • 核心观点:工具平权的终局是人的不平权,差距来自个人对世界的理解和审美
AI能力等级Lv.0工具平权人的不平权思维方式
行业 5月12日
  • 企业AI系统在生产环境中出现"自信但错误"的行为,如Agent误触回滚服务
  • 新提出的Intent-based混沌测试方法专为AI系统设计,模拟AI错误决策场景
  • 帮助企业提前发现和修复AI Agent在权限范围内的潜在危险操作
  • 弥补传统混沌测试无法覆盖AI模型"智能犯错"场景的空白
混沌测试AI自信犯错Intent-basedAgent安全生产环境
行业 5月12日
SAP推出企业级AI连接安全方案
  • SAP发布企业级AI连接安全解决方案,定位为治理而非门禁
  • 为企业提供AI系统的安全接入、数据保护和合规审计能力
  • 面向正在大规模部署AI Agent的企业客户,降低AI供应链风险
  • 填补AI Agent在企业环境中缺乏标准化安全框架的空白
SAPAI安全企业连接治理合规
行业 5月12日
White House要求前沿AI模型通过联邦预发布审查
  • NEC主任Hassett确认白宫正在起草行政令,要求前沿AI模型通过联邦预发布安全审查
  • Google、Microsoft、xAI等主要AI公司被列入审查范围
  • 类比FDA药物审批流程,建立AI模型的"上市前安全审查"制度
  • 5月19日为TAKE IT DOWN Act合规截止日期,各AI视频实验室尚未发布合规页面
White HouseFDA式审查前沿AI预发布审查安全行政令