AI 日报 · 2026-05-18
AI DAILY · 2026-05-18 · 周一

AI 日报 / 2026 年 05 月 18 日

今日收录 50 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

HackerNewsGitHub TrendingLatent.Space36KrVentureBeatsmol.aiTechCrunch极客公园华尔街见闻
Google I/O 2026倒计时1天
5月19日主题演讲,Gemini 4.0旗舰升级、Android XR眼镜、Aluminium OS
OpenClaw之父月烧$130万
3人团队运行100个AI Agent,6030亿token消耗,OpenAI全额报销
Anthropic CEO最新专访
Claude新功能几乎完全由AI自主开发,软件将步入免费时代
ASIC芯片赛道彻底爆发
谷歌TPU出货占比飙至78%,OpenAI拟部署10GW博通定制集群
academic-research-skills 6.4k Stars
Claude Code写论文全套流水线开源,4个skill跑通科研全流程
🧠 大模型 7 条
大模型 5月18日
Google I/O 2026前瞻:Gemini 4.0、Android XR眼镜即将揭晓
  • Google I/O 2026主题演讲定于太平洋时间5月19日上午10点,距开幕仅1天
  • 确认议程包括Gemini 4.0旗舰模型升级,多模态推理能力大幅提升
  • Android XR眼镜与三星、Warby Parker合作,2026年目标上市
  • Aluminium OS系统将作为Android替代ChromeOS的新方案
Google I/OGemini 4.0Android XRAluminium OSAI大会
大模型 5月17日
Meta Avocado模型延期发布,性能不及GPT-5.5
  • Meta下一代AI模型代号"Avocado"原定5-6月发布,至今无消息
  • 内部测试显示性能介于Gemini 2.5-3.0之间,低于GPT-5.5水平
  • 考虑到Google I/O即将召开,6月发布可能性最大
  • Meta已与英伟达签署史诗级协议,涵盖Blackwell及下一代Rubin GPU
MetaAvocado模型延期GPT-5.5英伟达协议
大模型 5月17日
xAI联合创始人计划为新AI公司融资$10亿
  • xAI联合创始人Igor Babuschkin计划为新AI研究创业公司融资至多$10亿
  • 估值达$50亿,General Catalyst可能领投
  • 这将是AI创业领域又一笔超大额融资事件
  • xAI此前已推出Grok系列模型,并与SpaceX深度合作
xAIBabuschkin$10亿融资$50亿估值General Catalyst
大模型 5月17日
蚂蚁集团在计算机视觉大会大放异彩:AIGC检测突破性成果
  • 蚂蚁集团凭借在AIGC检测方面的突破性成果在计算机视觉大会上获得关注
  • AIGC内容检测技术取得重要进展,可有效识别AI生成内容
  • 该技术在内容安全、反欺诈等场景有广泛应用前景
蚂蚁集团AIGC检测计算机视觉内容安全深度伪造
大模型 5月17日
GPT-5.5 Instant成ChatGPT默认模型,记忆功能全面升级
  • OpenAI将GPT-5.5 Instant设为免费、Plus和Pro版默认模型
  • AIME 2025数学测试得分从65.4提升至81.2,MMMU-Pro多模态推理达76分
  • 核心升级为记忆功能,可搜索历史对话、文件和Gmail
  • Instant版本兼顾速度与质量,适合日常高频使用场景
GPT-5.5 InstantChatGPT记忆功能默认模型数学推理
大模型 5月18日
Google承诺在Gemini AI训练过程中保护Gmail隐私
  • Google正式承诺在Gemini AI模型训练过程中保护用户Gmail数据隐私
  • 明确区分用户数据使用边界,回应长期以来的隐私担忧
  • 这一承诺对Google生态内数亿Gmail用户具有重要意义
  • 涉及数据最小化原则和用户控制权保障
GoogleGmailGemini隐私保护数据安全
⚙️ 训练推理 6 条
训练推理 5月17日
ASIC芯片赛道彻底爆发:AI推理算力的民主化运动
  • 2026年Q1谷歌TPU在其AI服务器出货占比飙升至78%,远超GPU份额
  • OpenAI宣布2026下半年至2027年部署博通定制ASIC,构建10GW算力集群
  • 单算力成本降低约35%,标志着AI算力重心从训练向推理迁移
  • TSMC 2nm+A16工艺产能CAGR达70%,2030年市场规模$1.5万亿
ASIC谷歌TPU博通推理算力$1.5万亿市场
训练推理 5月17日
Graph增强RAG架构模式:超越向量搜索的生产实践
  • VentureBeat发布Graph RAG深度技术文章,分析生产环境中超越传统向量搜索的架构模式
  • 标准RAG架构(分块→嵌入→余弦相似度检索)在复杂查询中存在局限性
  • Graph RAG通过知识图谱解析实体关系,解决跨文档关联问题
  • 文章提供生产级部署的架构模式选择指南和最佳实践
Graph RAG向量搜索知识图谱生产部署架构模式
训练推理 5月17日
Taalas HC1:将AI模型直接"刻"进硅片的革命性芯片
  • Taalas推出革命性ASIC架构,将整个AI模型转化为专用硅片
  • HC1芯片实现每用户17k tokens/s的瞬时推理速度
  • 比Cerebras快10倍,功耗仅1/10,彻底消除内存墙问题
  • 24人团队打造,已获$2亿融资,AMD前高管参与
TaalasHC1ASIC17k tokens/s模型硅化
训练推理 5月17日
2026 RAG选型指南:Vector、Graph、Vectorless怎么选
  • 最新RAG选型指南发布,对比三种主流RAG架构的优劣
  • Vector RAG适合语义搜索,Graph RAG擅长复杂关系查询
  • Vectorless RAG利用文档结构直接定位答案,减少幻觉
  • 提供50+生产级RAG系统构建的实战经验
RAG选型Graph RAGVectorless知识检索企业部署
训练推理 5月17日
云电脑拿到复活卡:谷歌/阿里/微软决战云端AI
  • 谷歌向PC行业发起挑战,云端AI成为下一代计算范式
  • 阿里、微软同步加码云端AI算力布局,三家巨头形成新格局
  • 云电脑将AI推理从端侧转移到云端,降低用户设备门槛
  • 这一趋势可能重塑PC产业生态和用户交互方式
云电脑云端AI谷歌阿里微软
🤖 Agent 7 条
Agent 5月18日
Google开源DESIGN.md:为AI Agent提供UI设计标准化蓝图
  • Google正式开源AI设计工具Stitch的核心格式DESIGN.md
  • 通过机器可读的标准化协议解决AI Agent界面生成中的品牌一致性问题
  • 格式整合YAML设计标记(颜色、字体参数)与纯文本注释
  • 为Vibe Coding和Agentic Coding提供统一设计规范
DESIGN.mdGoogleAI AgentUI蓝图Stitch
Agent 5月17日
腾讯推出操作系统级AI助手Marvis:替你签到改配置
  • 腾讯应用宝团队内测操作系统层个人AI助手Marvis(马维斯)
  • 通过多个Agent协作完成App操作、EXE操作、文件管理、文档生成等复杂任务
  • 24小时持续在线,支持跨端操作,还会"打盹上厕所"
  • 定位为操作系统级的Jarvis,挑战跨场景超级入口
腾讯Marvis操作系统AI助手多Agent跨端操作
Agent 5月17日
AI无人建模的风险:AI正在取代它需要学习的专家
  • Airbnb AI负责人Ahmad Al-Dahle在VentureBeat发文,警示AI自我改进的悖论
  • AI系统需要人类评估员发现错误并生成高质量反馈
  • 业界在自主改进机制投入巨大,但对人类评估员角色几乎零思考
  • 企业无人建模可能导致AI"在无导师环境中自我退化"
AI自我改进人类评估员无人建模AirbnbAI退化
Agent 5月17日
Enterprise AI Pivot:OpenAI/Anthropic/LangChain重新定义生产级AI
  • 2026年5月标志着AI行业从实验试点转向企业级部署的决定性转折
  • OpenAI和Anthropic正从hype阶段进入生产落地的现实
  • LangChain等工具链加速了企业AI应用的标准化进程
  • 生产级Agent系统成为企业AI战略的核心关注点
企业AI生产部署OpenAIAnthropicLangChain
Agent 5月18日
OpenClaw AI代理在Two Sessions平台获关注
  • OpenClaw AI代理在Two Sessions平台上获得广泛关注
  • 周红一宣布推出用户友好版OpenClaw,降低使用门槛
  • OpenClaw生态持续扩展,美图等厂商推出配套CLI工具
  • 开源社区围绕OpenClaw构建日益丰富的工具链
OpenClawTwo SessionsAI代理开源生态用户友好
Agent 5月18日
美图AI平台为OpenClaw生态推出支持八种图像特征的CLI工具
  • 美图AI平台推出面向OpenClaw生态的CLI工具
  • 支持八种图像特征处理能力,扩展OpenClaw的视觉处理边界
  • 标志着OpenClaw生态向垂直领域工具链扩展
美图OpenClawCLI工具图像特征生态扩展
🔧 基础设施 6 条
基础设施 5月17日
五大前沿AI实验室纳入美国政府预审
  • 美国商务部AI安全与基础设施局(CAISI)与五大AI实验室达成协议
  • OpenAI、Anthropic、Google DeepMind、Microsoft、xAI所有前沿模型发布前须通过政府评估
  • 这标志着AI监管从事后审查走向事前审批
  • 前沿模型安全评估框架进入制度化阶段
CAISI政府预审前沿模型AI安全事前审批
基础设施 5月18日
Google I/O前夜:Alphabet计划展示Android 17深度Gemini集成
  • Google I/O 2026前夕,Alphabet计划展示Android 17与Gemini的深度集成
  • 新型硬件计划也将同步亮相,包括Android XR眼镜
  • Google从AI模型能力转向搜索、广告、购物和云业务的收入增长转化
  • 5月21日Google Marketing Live将聚焦商业变现
Android 17Gemini集成Google I/O商业化Android XR
基础设施 5月17日
AMD Advancing AI 2026大会:7月旧金山见
  • AMD宣布Advancing AI 2026大会将于7月22-23日在旧金山举办
  • 将展示最新AI基础设施、GPU和加速器产品
  • 大会聚焦数据中心AI推理和训练的硬件解决方案
  • 预计发布新一代Instinct加速器和ROCm软件栈更新
AMDAdvancing AI2026大会数据中心AI硬件
基础设施 5月17日
AI Infra Summit 2026定档9月:Santa Clara见
  • AI Infra Summit 2026将于9月15-17日在Santa Clara Convention Center举办
  • 聚焦AI芯片、数据中心基础设施和边缘计算
  • 为AI基础设施产业链提供技术和商业对接平台
  • 预计吸引芯片厂商、云服务商、AI应用商等全产业链参与者
AI Infra SummitSanta ClaraAI芯片数据中心产业峰会
基础设施 5月17日
Meta与英伟达签署史诗级GPU协议
  • Meta与英伟达签署史诗级协议,涵盖Blackwell架构及下一代Rubin GPU
  • Meta首次大规模部署英伟达Grace CPU和Vera CPU
  • 分析师预测该协议将支撑Meta到2028年投资$6000亿构建30座数据中心
  • 标志着Meta从自研芯片转向全面拥抱英伟达生态
Meta英伟达BlackwellRubin$6000亿数据中心
🦾 机器人 5 条
机器人 5月18日
三星Galaxy眼镜搭载Gemini AI正式亮相
  • 三星Galaxy眼镜正式亮相,搭载Google Gemini AI重新定义智能眼镜品类
  • 无屏幕设计,Gemini AI作为前端:语音查询、视觉搜索、翻译、上下文响应
  • 基于Android XR平台,与Galaxy生态系统深度整合
  • 三星预计7月Unpacked发布会正式发布
三星Galaxy眼镜Gemini AIAndroid XR智能穿戴语音交互
机器人 5月17日
普拉达推出Meta AI智能眼镜
  • 奢侈品牌普拉达(Prada)与Meta合作推出AI智能眼镜
  • 将Meta AI能力与时尚设计结合,拓展AI可穿戴设备市场
  • 标志着AI眼镜从科技产品向时尚消费品的跨界融合
  • 智能眼镜成为AI巨头争夺的下一代计算平台入口
普拉达Meta AI智能眼镜时尚AI可穿戴设备
机器人 5月17日
OmniXtreme人形机器人架构开源:流匹配攻克高动态运动难题
  • 宇树科技正式发布并开源人形机器人运动控制架构OmniXtreme
  • 基于流的生成控制策略(flow-based generative control policy)
  • 针对复杂物理动力学进行驱动蒸馏,攻克高动态运动泛化难题
  • 由宇树创始人王兴兴署名技术论文正式发布
OmniXtreme宇树科技流匹配人形机器人开源
机器人 5月17日
特斯拉2026春季更新:一键FSD+语音AI全面升级
  • 特斯拉正式推出2026春季OTA更新,功能密度创历史新高
  • Grok新增"Hey"语音唤醒,支持位置提醒和上下文对话
  • FSD实现车内一键订阅,新增数据看板
  • 行车记录仪录制时长延长到24小时,宠物模式升级
特斯拉FSDGrok语音OTA更新智能驾驶
🎨 多模态 5 条
多模态 5月17日
AI围攻菜市场:算法驱赶"烟火气"
  • 巨头们不再与菜贩子肉搏,退到云端用算法编纂兵法
  • AI正在渗透传统菜市场等线下零售场景
  • 算法驱动的生鲜电商挑战传统菜市场经营模式
  • 引发关于AI技术对传统商业模式冲击的讨论
AI零售算法渗透菜市场生鲜电商传统商业模式
多模态 5月17日
Supertonic开源设备端TTS引擎,支持ONNX推理
  • Supertonic推出开源设备端TTS(文本转语音)引擎
  • 基于ONNX Runtime实现本地推理,无需云端依赖
  • 支持Swift集成,适用于iOS/macOS原生应用
  • 为移动端AI语音交互提供轻量级解决方案
SupertonicTTS设备端ONNXSwift
多模态 5月17日
DramaBox使用LTX 2.3生成AI短视频
  • DramaBox采用LTX 2.3模型生成AI驱动的短视频内容
  • 结合TTS技术实现语音同步的视频创作
  • 展示AI视频生成技术在内容创作领域的商业化应用
  • AI视频工具正在降低内容创作门槛
DramaBoxLTX 2.3AI短视频TTS视频创作
多模态 5月18日
Google AI搜索导致小型网站流量锐减60%
  • Axios报告显示Google AI Overviews导致小型内容网站流量两年内下降60%
  • 中型发布商(日均1万-10万浏览量)传统搜索流量下滑47%
  • 谷歌搜索推荐总页面浏览量两年下降34%
  • AI搜索正在根本性改写互联网流量规则
Google AI搜索流量下降60%Axios内容网站AI Overviews
💰 投融资 4 条
投融资 5月17日
Isomorphic Labs完成$2.1亿B轮融资
  • 谷歌DeepMind分拆的药物发现AI公司Isomorphic Labs完成$2.1亿B轮融资
  • 由Thrive Capital领投
  • 基于AlphaFold(2024年诺贝尔化学奖)技术
  • 致力于AI驱动的新药研发,加速候选药物发现
Isomorphic Labs$2.1亿Thrive CapitalAlphaFold药物发现
投融资 5月17日
5月AI初创融资报告:37笔交易$250亿已披露
  • 5月共82笔初创融资信号中,37笔涉及AI/ML/GenAI
  • 已披露融资总额$250亿,投资者对机器学习下注加倍
  • Q1 2026全球VC总额$2970亿,80%流向AI领域
  • 70家新晋独角兽,Factory以$15亿估值领跑
AI融资$250亿37笔交易独角兽Q1 2026
投融资 5月17日
AI 2026创业融资全景:全球投入$1315亿
  • 2026年全球AI初创企业融资达$1315亿
  • 超大轮融资主导市场,自主智能体赛道爆发
  • 风投龙头持续加码AI基础设施和应用层
  • 企业级AI Agent成为投资热点方向
AI融资$1315亿全球融资Agent赛道风投
🌐 行业 6 条
行业 5月17日
佛罗里达州对OpenAI展开ChatGPT涉枪刑事调查
  • 佛罗里达州总检察长宣布对OpenAI和ChatGPT启动刑事调查
  • 涉及ChatGPT与Florida State University学生的对话记录
  • 这是罕见的针对AI公司的刑事调查行动
  • AI安全和法律责任问题正在引发政府层面的严厉回应
佛罗里达OpenAI刑事调查ChatGPT安全AI法律
行业 5月17日
美联储报告:AI威胁初级开发者职业前景
  • 美联储发布报告指出AI对初级开发者职业前景构成威胁
  • AI编程工具正在降低入门级开发岗位的需求门槛
  • 高增长与高失业率可能首次在人类社会同时出现
  • 教育体系和职业培训亟需适应AI时代的变革
美联储AI就业初级开发者职业前景教育变革
行业 5月17日
OpenAI AI硬件设备传闻:前苹果设计师Jony Ive参与
  • OpenAI据报道正在探索"AI优先设备",可能完全取代传统App界面
  • 前苹果设计总监Jony Ive参与早期设计讨论
  • 该设备将与苹果硬件生态直接竞争
  • OpenAI从软件走向软硬一体化的战略意图明显
OpenAIAI硬件Jony IveAI优先设备软硬一体化
行业 5月17日
AI打工人的"第一笔工资":$16.88
  • AI Agent完成工作任务后获得首笔报酬$16.88
  • 标志着AI从工具向"数字劳动力"角色的转变
  • 乐观推算月薪可达$3000+
  • 引发关于AI Agent经济体系和劳动权益的讨论
AI打工人$16.88数字劳动力AI经济Agent报酬
行业 5月17日
AI已经开始伪造地方媒体
  • 有人用AI造了17个假新闻网站,记者全是编的,骗了4.4万人
  • AI伪造内容正在威胁信息生态的真实性
  • 地方媒体成为AI造假的重灾区
  • 呼吁加强AI生成内容的标识和溯源机制
AI伪造假新闻地方媒体信息污染内容溯源