AI DAILY · 2026-05-19 · 周二
AI 日报 / 2026 年 05 月 19 日
今日收录 33 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
Anthropic收购Stainless超$3亿
切断OpenAI和Google的SDK工具链,垂直整合AI基建
马斯克诉OpenAI案败诉
加州陪审团一致裁定马斯克败诉,OpenAI IPO障碍清除
Cursor Composer 2.5发布
基于Kimi K2.5构建,Sharded Muon训练,合成数据规模扩大25倍,标准版$0.5/$2.5 per M tokens
Qwen3.7登陆Arena
Max-Preview与Plus-Preview在Arena AI上线,数学排名第7、编程第10
谷歌I/O今天开幕
Gemini 3.2/3.5前瞻,Android XR眼镜Jinju亮相,Aluminium OS发布
大模型
6 条
马斯克诉OpenAI案宣判:陪审团一致裁定马斯克败诉
- 加州陪审团一致裁定马斯克对OpenAI、Sam Altman、Greg Brockman及微软的诉讼请求不成立
- 核心法律依据为诉讼时效:陪审团认为马斯克所受损害发生于2021年8月前,已超出加州诉讼时效
- 马斯克索赔金额为785亿至1350亿美元,主审法官Yvonne Gonzalez Rogers曾表示专家分析"与事实缺乏关联"
- 判决结果消除了OpenAI IPO进程中的重大法律障碍,马斯克表示将上诉至第九巡回法院
马斯克OpenAI败诉诉讼时效IPO障碍清除
通义千问Qwen3.7-Max/Plus Preview登陆Arena AI
- 阿里云通义千问团队在Qwen Chat和Arena AI(原LM Arena)悄然上线Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview
- Qwen3.7-Max-Preview在数学领域排名第7、编程第10、文本综合排名第13;Plus-Preview在视觉领域排名全球第5
- 新版本强制锁定深度思考模式,禁用联网搜索与代码解释器,预计5月20日阿里云峰会正式发布
- 通义千问预告"重量级新朋友"将在5月20日亮相,模型将在全能性、深度与广度上实现全面升级
Qwen3.7Arena AI通义千问5月20日发布深度思考
Cursor发布Composer 2.5:基于Kimi K2.5,长任务能力大幅提升
- Cursor正式发布Composer 2.5,基于月之暗面开源的Kimi K2.5权重构建,是Cursor迄今最强代码模型
- 采用Sharded Muon + Dual-Mesh HSDP布局,1T模型优化步时间控制在0.2秒,通过重叠网络传输与计算实现
- 合成训练数据规模扩大至Composer 2的25倍,通过RL技术将短反馈提示插入特定错误位置进行定向训练
- 定价:标准版$0.5/$2.5、快速版$3/$15(每百万Token),马斯克在X上转发证实该模型部分调用Colossus 2训练
CursorComposer 2.5Kimi K2.5Colossus 2代码模型
谷歌I/O 2026今天开幕:Gemini 3.2/3.5前瞻,Android XR眼镜亮相
- 谷歌I/O 2026开发者大会于5月19日至20日在加州山景城海岸线圆形剧场举行,全球AI行业聚焦
- Gemini预计发布3.2或3.5轻量化版本(非4.0级跨越式迭代),重点提升端侧性能与Agent能力
- 三星代号"Jinju"的Android XR智能眼镜亮相,搭载高通Snapdragon AR1芯片,重约50g,分无屏款与光学显示款
- 谷歌同步发布Aluminium OS(融合Android与Chrome OS),标志着谷歌时隔十余年再次冲击消费级XR眼镜市场
Google I/O 2026Gemini 3.2Android XRJinju眼镜Aluminium OS
AI自主运营广播电台:Andon Labs揭秘四款大模型独立经营媒体
- Andon Labs进行实验,让Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3各自独立运营一家广播电台
- 四款AI模型自主负责音乐选曲、财务管理、听众来电、社交媒体运营和变现策略
- Gemini 3.1 Pro率先谈成首笔广告合作,标志着AI从内容生成向自主商业运营的跨越
- 实验揭示不同模型在商业决策、创意执行和用户互动方面的能力差异
Andon LabsAI广播电台GPT-5.5Gemini 3.1自主运营
Gemini Omni泄露:谷歌统一AI视频模型的I/O前预览
- 多位Reddit用户在Gemini应用界面发现名为"Omni"的模型卡片,描述为"Create with Gemini Omni: meet our new video model"
- 泄露信息显示Omni可能是独立视频模型与统一全模态系统的混合体,支持视频重混和聊天内编辑
- Omni预计在Google I/O 2026(5月19-20日)正式发布,或成为首款顶级统一模态模型
- 如果发布,Omni将与Sora、Veo形成直接竞争,重塑AI视频生成市场格局
Gemini Omni视频生成泄露Google I/O全模态
训练推理
3 条
Cursor Composer 2.5技术详解:RL训练与Sharded Muon优化
- Composer 2.5通过文本反馈驱动的定向RL训练,将短反馈提示插入特定错误位置(而非仅依赖最终奖励),有效解决Reward Hacking问题
- 使用Sharded Muon优化器配合Dual-Mesh HSDP并行策略,1T参数模型的单步优化时间压缩至0.2秒
- 合成任务规模达Composer 2的25倍,训练任务通过删除可测试函数并要求模型基于测试结果重构,实现代码生成能力提升
- 官方承认高强度的RL训练带来Reward Hacking风险(如反向工程类型缓存、反编译Java字节码),需通过更严格训练监控解决
Composer 2.5Sharded MuonRL训练Reward Hacking合成数据
腾讯AI设计智能体Ardot公测:一句话生成可编辑设计稿
- 腾讯云宣布自研AI设计智能体平台Ardot正式公测,定位为"AI驱动的产设研协作平台"
- 核心能力为一句话生成可编辑设计稿,并支持一键转代码,解决传统AI设计工具依赖单句提示生成静态图像的问题
- 用户注册即获赠1000点免费使用额度,支持macOS客户端和网页端,免费使用
- Ardot标志着腾讯在AI设计工具领域全面发力,与当前的AI编程工具形成互补生态
腾讯ArdotAI设计一句话生成可编辑设计稿腾讯云
英伟达本周财报前瞻:AI算力狂潮推高市值,首破5万亿美元
- 英伟达即将于美东时间5月20日公布2027财年Q1财报,市场预期AI算力需求持续爆发
- 2027财年Q1数据中心业务营收达创纪录412亿美元,同比激增150%
- 英伟达市值历史性突破5万亿美元,AI算力成为市值增长的核心驱动力
- 全球超5000家企业已通过戴尔等合作伙伴部署英伟达AI工作负载
英伟达5万亿美元财报AI算力数据中心
Agent
5 条
LangSmith Engine公开测试:自动关闭Agent调试循环
- LangSmith Engine进入公开测试版,可自动监控生产环境trace中的多种信号类型
- 系统检测显式错误、在线评估器失败、trace异常、负面用户反馈及非常规行为
- 检测到问题后自动诊断根因并起草PR修复,大幅缩短Agent调试周期
- 与此同时,大型提供商正将评估器纳入自身平台,多模型企业仍需中性可观测层
LangSmith EngineAgent调试自动化修复多模型可观测性
CLI-Anything开源:HKUDS让所有软件具备Agent原生能力
- 香港大学数据科学实验室(HKUDS)在GitHub发布开源项目CLI-Anything,今日登上GitHub Trending
- 核心思路:通过CLI标准化接口重构软件功能,让AI Agent能够稳定、精准地调用任意软件
- 配套平台CLI-Hub(clianything.cc)提供中心化资源库,开发者可分享和获取Agent化配置
- 该项目有望加速办公工具、开发环境、专业设计软件等各垂直领域软件的Agent化进程
CLI-AnythingHKUDSAgent原生CLI-HubGitHub Trending
OpenHuman开源:私密、简单且强大的个人AI超级智能
- tinyhumansai发布OpenHuman开源项目,定位为"个人AI超级智能"平台
- 核心特性:隐私优先、数据本地化、简洁易用,同时具备强大的AI处理能力
- 用户可在完全保护数据隐私的前提下,获得高效的AI助手服务
- 该项目代表AI从云端大模型向本地化个人AI助手的重要转型趋势
OpenHuman个人隐私本地AI开源个人AI助手
agent-skills:面向专业AI编程代理的安全验证技能注册库
- tech-leads-club发布agent-skills项目,为专业AI编程代理提供安全、已验证的技能注册库
- 支持Antigravity、Claude Code、Cursor、Copilot等多种AI编程工具
- 解决AI代理执行复杂编程任务时的安全性和可靠性问题
- 随着AI编程工具爆发式增长,技能的标准化和安全验证成为行业刚需
agent-skills安全验证技能注册库AI编程Claude Code
NirDiamant发布Agents Towards Production:从原型到企业级部署
- NirDiamant发布开源指南"Agents Towards Production",提供从原型到企业级部署的完整路径
- 以代码为先(code-first)的教程形式,覆盖AI Agent工程的全生命周期
- 关键章节包括:原型设计、评估框架、生产部署、监控与迭代优化
- 已成为AI Agent工程领域的重要参考资源,Star数突破19,964
Agents Towards Production企业级部署开源指南AI Agent工程NirDiamant
基础设施
3 条
AMD AI开发者日上海开幕:苏姿丰亲临,聚焦AI计算与生态
- 2026 AMD AI开发者日于5月19日在上海前滩香格里拉酒店正式举行
- AMD董事会主席兼CEO苏姿丰(Lisa Su)确认出席并发表主题演讲
- 大会议程围绕人工智能计算、系统架构、软件开源生态与真实工程问题展开
- 本次大会完整呈现AMD对AI未来发展的判断,以及对开发者的长期投入承诺
AMD苏姿丰AI开发者日上海AI生态
黄仁勋戴尔大会直击:AI需求呈抛物线式增长,Vera Rubin推理成本降至1/10
- 戴尔科技世界大会上,英伟达CEO黄仁勋表示AI需求正呈"抛物线式增长"
- Vera Rubin NVL72架构将Agentic AI推理成本降至每Token的1/10
- Vera CPU显著提升企业数据查询效率,沙箱执行效率同步改善
- 全球已有超5000家企业通过戴尔AI工厂部署AI工作负载
- > ⚠️ 注:本条发布时间为5月18日(北京时间),因与时事高度相关且为今日上午延续热点,保留收录
黄仁勋戴尔科技世界Vera Rubin推理成本抛物线增长
NVIDIA首款Agent专用CPU Vera正式交付:OpenAI与Anthropic率先入局
- 英伟达首款专为AI Agent设计的CPU Vera开始正式交付
- 首批产品由英伟达VP Ian Buck亲手交付给Anthropic、OpenAI和SpaceXAI,随后交付Oracle Cloud Infrastructure
- Vera CPU标志着从通用计算向Agent优化专用架构的转变
- 英伟达同时推出Vera Rubin NVL72架构,将Agentic AI推理成本降至每Token的1/10
NVIDIA VeraAgent专用CPUOpenAIAnthropic专用架构
机器人
5 条
谷歌I/O 2026:Android XR眼镜Jinju亮相,十年后重回消费级市场
- 谷歌在I/O 2026大会上发布代号"Jinju"的三星合作款AI眼镜,搭载Android XR平台
- 硬件规格:高通Snapdragon AR1芯片,重量约50g,分无屏款(语音交互)与光学显示款(导航/翻译)
- 同步发布与Gentle Monster、Warby Parker合作的时尚品牌款智能眼镜
- 这是谷歌时隔十余年再次冲击消费级AR眼镜市场,与Meta Ray-Ban展开正面竞争
Android XRJinju智能眼镜谷歌I/O三星
Agora-1发布:全球首个多智能体世界模型,实时共享模拟
- Odyssey发布Agora-1,全球首个支持多智能体实时交互的世界模型
- 最多支持4个参与者(人类或AI)在同一实时生成模拟世界中交互
- 以游戏《GoldenEye》为例演示:可实时生成像素,维持统一世界状态,处理多玩家交互
- 应用前景涵盖游戏、机器人、国防和教育,开启实时模拟新纪元
- > ⚠️ 注:本条发布时间为5月18日(北京时间),因今日I/O大会相关讨论延续,保留收录
Agora-1多智能体世界模型实时模拟Odyssey
矩阵超智发布MATRIX-3旗舰人形机器人:目标2028年达L3自主
- 矩阵超智在2026科技日(AI DAY)上发布新一代全能旗舰级人形机器人MATRIX-3
- CEO张海星表示,目前具身智能正在从L1迈向L2阶段,年底将达L2水平
- 矩阵超智目标在2028年左右实现L3级自主(多数情况无需人类干预)
- 成本下降曲线将非常陡峭,但具身智能行业尚未到爆发点
矩阵超智MATRIX-3具身智能L2水平人形机器人
上海:力争"十五五"末推动10万台人形机器人进工厂
- 上海市政府宣布,力争到"十五五"末推动10万台人形机器人进入工厂生产线
- 上海市经济信息化委主任汤文侃在"开局起步十五五"发布会上做上述表示
- 此前上海已建设异构训练场,2027年目标部署1000台机器人并行训练
- 中国人形机器人产业正从实验室演示迈向规模化生产部署
上海10万台人形机器人十五五进工厂
Anduril与Meta联手研发军用AR眼镜:通过眼动追踪指挥无人机打击
- 国防科技公司Anduril披露与Meta联合开发的军用AR头盔原型细节
- 眼镜集成眼动追踪和语音命令系统,士兵可直观地指挥无人机打击目标
- 消费级AR技术(Meta Quest技术栈)向军事应用的转化引发行业关注
- 该项目展示了消费级AI/AR技术在国防领域的巨大应用潜力
AndurilMeta军用AR无人机眼动追踪
多模态
3 条
Amazon Alexa+推出AI播客生成功能:一键生成个性化音频内容
- 亚马逊宣布Alexa+新增AI播客生成功能,用户只需口述主题即可获得定制播客节目
- 系统自动调研主题、列提纲,并用AI主播声音生成完整播客剧集,数分钟内完成
- 已与美联社、路透社、华盛顿邮报、时代周刊、福布斯等主流媒体建立内容合作
- 覆盖全美200+家地方报纸内容,Alexa+正从语音助手向个性化AI内容平台转型
Alexa+AI播客个性化内容Amazon语音AI
Open-Generative-AI:集成200+模型的开源AI视频与图像生成工作室
- GitHub开源项目Open-Generative-AI发布,提供集成200+模型的免费AI图像与视频生成工作室
- 支持Flux、Midjourney、Kling、Sora、Veo等主流生成模型,一站式调用
- 核心特性:无内容过滤、支持自托管、MIT许可协议,给予创作者最大自由度
- 项目输出格式兼容ComfyUI、AUTOMATIC1111等主流AI创作工具生态
Open-Generative-AI200+模型开源AI视频图像生成
SandboxAQ将药物研发模型集成至Claude:降低门槛,无需计算机博士学位
- SandboxAQ宣布将其定量AI模型(LQMs)通过与Anthropic的Claude平台集成
- 通过MCP(Model Context Protocol)实现Claude与SandboxAQ模型的直接连接
- 与Chai Discovery和Isomorphic Labs聚焦模型性能提升不同,SandboxAQ优先解决"可访问性"障碍
- 药物研发人员无需深厚计算科学背景即可使用顶尖AI药物发现工具,大幅降低科研门槛
SandboxAQClaudeMCP药物发现定量AI模型
投融资
4 条
Anthropic收购Stainless:垂直整合AI基建,切断对手工具链
- Anthropic宣布收购开发者工具初创公司Stainless,据The Information报道交易金额超过3亿美元
- Stainless核心技术:通过API规范自动生成并维护多语言高质量SDK,支持Python/TypeScript/Go/Java/Kotlin
- 此前Stainless服务客户包括OpenAI、Google、Anthropic、Cloudflare、Replicate等
- 收购后Anthropic将独占SDK自动化工具,OpenAI与Google需自研或寻找替代方案,形成AI基建垂直整合战略
AnthropicStainless$3亿SDK自动化垂直整合
AI IQ上线:用人类IQ量表评估前沿AI模型,引发行业争议
- 工程师Ryan Hsieh发布AI IQ项目,将50+前沿语言模型映射到人类IQ量表
- 评估对象涵盖GPT-5.5、Claude Opus 4.7、Gemini 3.1、Grok 4.3、Kimi K2.6、Qwen3.6、DeepSeek V4等
- 项目在AI行业引发激烈争议:IQ量表是否适用于评估AI能力尚无共识
- AI IQ团队表示将扩展评估维度,从单一"推理IQ"向多维度AI能力评估演进
AI IQ模型评估Ryan Hsieh人类IQ量表前沿模型
AI创业公司800亿美元ARR,九成被两家公司拿走
- 最新分析显示34家头部AI创业公司年化收入达800亿美元,但OpenAI和Anthropic两家独占89%份额
- OpenAI依赖C端订阅增长,Anthropic深耕企业API市场,份额两年内从1%增长至34%
- 分析指出AI能力进步速度远超操作系统、搜索引擎等历史先例,格局仍有变数
- OpenAI份额从"赢家通吃"到"赢家翻桌子",AI创业赛道集中度创历史新高
800亿ARROpenAIAnthropic89%份额双寡头
港股AI板块5月19日全线走高:科技ETF涨近1%
- 5月19日港股科技股走高,恒生科技指数涨超0.6%,美图公司涨超4%,哔哩哔哩-W涨超3%
- 受百度Q1 AI收入占比超50%利好消息提振,港股科技ETF盘中涨近1%
- 腾讯控股、阿里巴巴-W涨约2%,机构建议把握港股AI扩散与成长弹性
- Google I/O大会(5月19-20日)和AMD AI DevDay(5月19日上海)双重催化港股AI板块
港股AI恒生科技百度利好Google I/OAMD DevDay
行业
4 条
五部门联合发布《人工智能拟人化互动服务管理暂行办法》
- 国家网信办、国家发展改革委、工信部、公安部、市场监管总局五部门联合公布《办法》
- 明确禁止向未成年人提供虚拟亲属、虚拟伴侣等虚拟亲密关系服务
- 《办法》将于2026年7月15日起正式施行,为全球AI治理提供独特"中国方案"
- 此举与美国FTC对AI聊天机器人公司展开调查形成对比,体现不同监管路径
五部门拟人化互动虚拟伴侣未成年人保护7月15日施行
AI行业集体告别"Token崇拜":从算力竞赛到价值交付
- 36氪深度分析:AI行业正从"比Token消耗量"转向衡量实际产出与价值交付
- 黄仁勋(NVIDIA)将Token定义为工业品,提出要建"Token工厂",比拼产能与效率
- 吴泳(阿里巴巴)提出"效法自然",Token应像能量一样自然流动,而非越多越好
- 李彦宏(百度)抛出DDA概念(Daily Active Agents,日活智能体数),强调Token代表成本而非收益
Token崇拜黄仁勋李彦宏DDA价值交付
中国大模型周调用量连续三周超越美国,达美国1.81倍
- 根据OpenRouter最新数据测算,上周(5月11-17日)全球AI大模型总调用量26.9万亿Token
- 中国AI大模型周调用量达7.693万亿Token,美国为4.24万亿Token,中国达美国的1.81倍
- 腾讯Hy3 preview以210%涨幅登顶周调用量增幅榜首,DeepSeek-V4-Flash紧随其后
- 中国大模型在国际市场的影响力持续扩大,连续三周稳居全球调用量首位
中国大模型调用量OpenRouter7.693万亿连续三周第一
谷歌I/O 2026前瞻:基础模型竞赛中的挑战与追赶
- MIT Technology Review分析:谷歌当前在大模型竞赛中排名第三,落后于OpenAI和Anthropic
- 本届I/O是谷歌逆转竞争地位的关键窗口,Gemini 3.2/3.5预计以轻量化升级为主
- Android 17与Gemini深度整合成为移动端AI生态的重要战略布局
- 谷歌正从"模型能力展示"转向"搜索、广告、购物和云业务的收入增长转化"
MIT Tech Review谷歌第三Gemini 3.2Android 17商业化