AI 日报 · 2026-05-04
AI DAILY · 2026-05-04 · 周一

AI 日报 / 2026 年 05 月 04 日

今日收录 43 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

TechCrunchHackerNewsGitHub Trending钛媒体36Kr
SonicMoE
Tri Dao 团队发布新一代 MoE 加速框架,Blackwell GPU 吞吐量峰值,比 DeepGEMM 加速 1.87-4.04 倍
DeepClaude
Claude Code + DeepSeek V4 Pro 组合成本降 17 倍,HN 199 分爆火
四大巨头 $7250亿
谷歌、亚马逊、微软、Meta 2026 年 AI 资本开支暴增 77%
Kimi K2.6
编程挑战击败 Claude、GPT-5.5 和 Gemini,HN 329 分
80%富人用 Claude
美国 AI 用户调查显示 Claude 用户中高收入家庭占比远超其他模型
VS Code Copilot 争议
自动插入 AI 署名引发社区强烈不满,HN 1349 分
🧠 大模型 6 条
大模型 5月3日
四大科技巨头 2026 年 AI 资本开支猛增 77% 至 $7250 亿
谷歌、亚马逊、微软、Meta 计划 2026 年 AI 资本开支达 7250 亿美元,较 2025 年增长 77%,Q1 已投入 1300 亿美元。投入覆盖 NVIDIA 及自研芯片、液冷技术(降低功耗 25%)、模型训练三维度,全球 AI 基础设施市场规模预计达 1.2 万亿。
资本开支7250亿谷歌Meta算力基建
大模型 5月4日
普林斯顿 Tri Dao(FlashAttention 一作)联合伯克利 Ion Stoica 团队发布 SonicMoE,可在英伟达 Blackwell GPU 上以峰值吞吐量运行,相比现有框架加速 1.87-4.04 倍,已开源。与 DeepSeek 的 Mega MoE 走不同方向,SonicMoE 侧重极致速度。
SonicMoETri DaoBlackwellMoEFlashAttention
大模型 5月3日
谷歌确认 Gemini 将引入广告,2026 年内落地
谷歌在 2026 年 5 月财报电话会议上透露 Gemini 将引入广告功能,移动端或成首批测试平台。单次大型模型迭代训练成本高达 3500 万美元,广告模式能以较低边际成本覆盖运营支出。OpenAI 已在 Q1 实现广告收入占总营收 8%。
Gemini广告商业化谷歌OpenAI
大模型 5月3日
DeepClaude 用 DeepSeek V4 Pro 替换 Claude Code 底层模型,成本从 $15/百万输出 token 降至约 $0.87,LiveCodeBench 评分达 96.4%,支持文件编辑和 bash 执行,HN 199 分、96 条评论爆火。
DeepClaude成本优化DeepSeek V4 ProClaude Code开源工具
大模型 5月3日
中国日均 Token 调用量超 140 万亿,较 2024 年初增长 1000 倍以上
钛媒体早报引用数据:全球 AI 大模型 Token 日调用量两年增长超千倍至 140 万亿/日,英伟达 H100 GPU 租赁价格半年涨幅近 40%,反映 AI 推理需求爆发式增长。
Token调用量140万亿推理需求H100增长
⚙️ 训练推理 4 条
训练推理 5月3日
DeepClaude:用 DeepSeek V4 Pro 替换 Claude Code 后端
通过模型路由/切换将 Claude Code 的底层模型替换为 DeepSeek V4 Pro,在保持原用户体验和工具集的前提下将成本降低 17 倍,$0.87 vs $15 每百万输出 token,HN 社区验证可行。
DeepClaude模型路由成本优化DeepSeek V4Claude Code
训练推理 5月4日
RouteMoA:无需预推理的动态路由,成本降 89.8%
上海交大等机构论文被 ACL 2026 接收,提出 RouteMoA 实现无需预推理的动态路由,在 15 个模型实验中成本降低 89.8%,延迟降低 63.6%,准确率同时提升,是多模型路由推理的实用突破。
RouteMoA动态路由多模型ACL 2026效率
训练推理 5月4日
ACL 2026|世界模型能让智能体"预知未来"吗?反直觉答案
中美四校研究发现,多数主流大模型中的智能体无法稳定有效利用世界模型进行前瞻决策,指出瓶颈在于"前瞻治理能力"不足——不是世界模型不够好,而是智能体不知道何时用、怎么用。
世界模型智能体前瞻决策ACL 2026研究
🤖 Agent 8 条
Agent 5月4日
TauricResearch 发布 TradingAgents,通过多个 LLM 驱动的专业 Agent 协调完成复杂金融交易操作,将生成式 AI 应用于市场分析和执行,连续两天 GitHub Trending。
TradingAgents多Agent金融交易开源
Agent 5月4日
Ruflo 由 ruvnet 开发,专注 Claude 生态的企业级 Agent 编排,支持分布式集群智能、无缝 RAG 集成,原生兼容 Claude Code 和 Codex,定位企业级生产场景。
RufloClaude多Agent编排企业级RAG
Agent 5月4日
Browserbase 推出 Skills SDK,将高级网页浏览工具集成至 Claude Code,使 Agent 能够实时导航、解读并对网页信息采取行动,填补本地代码执行与动态网页交互之间的空白。
BrowserbaseClaude Code网页浏览Agent SDK工具扩展
Agent 5月3日
warpdotdev 推出 Warp,定位"源自终端的智能体开发环境",将终端命令行体验与 AI Agent 开发需求深度融合,在终端原生集成 Agent 开发能力,GitHub Trending 热榜。
Warp终端Agent开发IDEGitHub Trending
Agent 5月3日
simstudioai 发布 Sim,定位 AI 劳动力队伍的"核心智能层",简化复杂 Agent 系统的管理流程,提供从开发到协同作业的全栈支持,GitHub Trending。
SimAgent编排智能层开源GitHub Trending
Agent 5月3日
obra 发布 Superpowers,基于可组合的技能模块和初始指令(instruct),为代码 Agent 提供结构化的软件开发方法论,规范和优化 Agent 在开发过程中的行为与效能。
Superpowers代码Agent方法论技能框架GitHub Trending
Agent 5月3日
知名开发者 Matt Pocock 开源个人 .claude 目录中的工程技能配置,为 AI 辅助编程提供实战参考,展示资深开发者如何通过结构化方式管理 AI 协作指令。
Matt PocockClaude技能库.claude开源
🔧 基础设施 4 条
基础设施 5月3日
AWS 计划 2026 年招聘 1.1 万开发实习生
AWS CEO 表示 2026 年拟招 11000 名软件开发工程师实习生,同比增长 25%,AI 辅助开发工具可使基础编码效率提升 35%-50%,但推动开发者转向更高价值环节,全球云服务相关岗位缺口达 1200 万。
AWS招聘实习生AI辅助开发人才培养
基础设施 5月3日
AI 时代的网络安全:需以 AI 为核心重构安全体系
钛媒体报道:生成式 AI 使钓鱼邮件成功率提升 300%,2025 年中国网络安全市场规模达 1800 亿元,零信任架构普及率提升 28 个百分点,头部 SOC 智能化水平超 70%,传统安全体系亟需 AI 赋能升级。
网络安全AI安全零信任SOC钓鱼
基础设施 5月3日
英伟达 H100 GPU 租赁价格半年涨幅近 40%
钛媒体引用数据指出 AI 算力需求持续推高 GPU 租赁价格,H100 半年涨幅近 40%,与四大巨头 $7250 亿资本开支形成呼应,算力供需紧张局面短期难以缓解。
H100GPU租赁涨价算力供需NVIDIA
🦾 机器人 4 条
机器人 5月4日
Meta 儿童安全审判 5 月 4 日迎来关键结果
Meta 与新墨西哥州的儿童安全案件将于今日迎来关键审判结果,法院已裁定 Meta 对未成年人构成公共滋扰。若新墨西哥州诉求获支持,将为美国各州监管树立先例,大型科技公司年合规成本可能增加 15-20 亿美元。
Meta儿童安全监管合规新墨西哥州
机器人 5月3日
软银计划 $1000 亿 IPO:机器人+AI 电力需求驱动
RoboToday 周报汇总:软银计划通过 $1000 亿 IPO 推进机器人与 AI 基础设施布局,通过能源业务承接 AI 电力需求。巴菲特接班人阿贝尔在股东大会上也强调能源业务与 AI 的结合将是未来重点。
软银IPO1000亿AI电力机器人
机器人 5月3日
加州将对违反交通法的无人驾驶汽车开罚单
加利福尼亚州监管机构宣布将开始对违反交通法规的无人驾驶汽车开正式罚单,是全球首个对 AI 驾驶系统实施"交通执法"的监管措施,为自动驾驶责任认定建立先例。
无人驾驶交通执法加州监管自动驾驶
🎨 多模态 4 条
多模态 5月3日
KC Green 公开指控 AI 初创公司 Artisan 在地铁站广告中未经授权使用其 "This is Fine" 梗图(将台词改为"my pipeline is on fire"并叠加" Hire Ava the AI BDR")。Green 表示将寻求法律途径,Artisan 回应称正在联系他沟通。
AI版权This is FineArtisan侵权梗图
多模态 5月3日
OpenAI Codex 推出宠物模式:桌宠可视化编程
OpenAI Codex 5 月 2 日发布宠物模式(Pet Mode),通过桌面可视化组件实时显示代码生成进度,延迟 <100ms,CPU 占用 <2%、内存 <50MB,为 AI 编程工具的交互方式提供新方向。
Codex宠物模式可视化编程交互OpenAI
多模态 5月3日
AMD 锐龙 AI Halo 迷你主机曝光:本地运行 2000 亿参数模型
AMD 4 月底推出搭载锐龙 AI Max+395 处理器的迷你主机,最高 128GB 统一内存,能本地运行 2000 亿参数 AI 模型,全球 AI 终端设备市场规模预计达 500 亿美元。
AMD锐龙AI端侧AI迷你主机本地推理
💰 投融资 5 条
投融资 5月4日
寻明生科 A+ 轮 $3500 万:AI 研发抗体药效率提升 50%
顶尖科学家赵伟安回国创办寻明生科,用 AI 研发抗体药,研发效率提升 50%,首款药物即将进入临床。完成 A+ 轮 3500 万美元融资,累计融资近亿美元,红杉、经纬重仓。
AI制药寻明生科抗体药红杉经纬
投融资 5月3日
2026 Q1 全球 AI 融资 450 亿美元,同比 +130%
钛媒体引用数据:2026 年 Q1 全球 AI 融资达 450 亿美元,同比增长 130%,中国占比 35%。大模型训练电力消耗同比 +200%,绿色 AI 和低功耗模型成为行业必答题。
AI融资450亿增长130%中国占比绿色AI
投融资 5月3日
Robotera 再融资超 2 亿美元,具身智能融资进入新阶段
RoboToday 周报:具身智能初创公司 Robotera 完成超 2 亿美元新一轮融资,距上一轮 10 亿元人民币融资不到一个月,计划大规模交付数千台机器人。4 月具身智能赛道已有多起重磅融资。
Robotera具身智能融资机器人量产
投融资 5月3日
OpenAI × 高通联合研发 AI 手机芯片,2028 年量产
RoboToday 周报汇总:OpenAI 与高通官宣联合研发 AI 手机芯片,目标在手机端本地运行百亿参数大模型,立讯精密为独家系统设计商。消息发布后苹果市值一夜蒸发约 500 亿美元。
OpenAI高通AI芯片端侧AI立讯精密
🌐 行业 9 条
行业 5月4日
80% 富人在用 Claude:美国 AI 用户大调查
Epoch AI 与益普索发布美国 AI 用户调查,近 80% Claude 周活用户来自年收入 10 万美元以上家庭,占比远高于其他大模型,但整体用户规模仅 3%,呈现"高收入浓度、低覆盖率"特征。
Claude用户调查高收入市场渗透Epoch AI
行业 5月4日
巴菲特接班人阿贝尔首秀:用 AI 视频演示 AI 风险
伯克希尔·哈撒韦 2026 年度股东大会(阿贝尔接任 CEO 首秀),阿贝尔用 AI 生成无巴菲特输入的视频展示 AI 风险,称公司已在多业务落地 AI,能源业务承接 AI 电力需求。
巴菲特阿贝尔伯克希尔AI风险能源
行业 5月3日
奥尔特曼回应 AI 失业焦虑:2026 Q1 美国科技裁员 52050 人
2026 年 Q1 美国科技企业裁员 52050 个岗位,同比增长 40%,近半数归因于 AI 实施与自动化。奥尔特曼回应 AI 失业焦虑,提出"人本 AI"路径,强调技术应赋能而非替代人类。
AI失业裁员52050奥尔特曼OpenAI
行业 5月3日
VS Code 拟默认在提交中添加 Copilot 署名,HN 1349 分大争论
VS Code 被发现会在 Git 提交中自动插入"Co-Authored-by Copilot"标记,即使用户未使用 Copilot,GitHub PR 记录了此问题,HN 1349 分、723 条评论,社区对不需要的 AI 归属表示强烈不满。
VS CodeCopilotAI归属GitHub开发者
行业 5月2日
美国电影艺术与科学学院裁定 AI 生成的演员和剧本不再具备奥斯卡参评资格,是好莱坞对 AI 生成内容最明确的政策表态,将深刻影响影视行业的 AI 应用边界。
奥斯卡AI生成演员剧本好莱坞
行业 5月3日
Anubis:网站防御 AI 抓取的新手段 — PoW 反爬虫
Anubis 利用工作量证明(PoW)机制反制大规模 AI 爬虫,要求客户端完成计算密集型验证才能访问内容,是网站应对 AI 公司大规模抓取训练数据的新一代防御工具,HN 热议。
AnubisPoW反爬虫AI抓取网站防御
行业 5月4日
大厂逼员工用 AI 成形式主义?
媒体调查发现国内部分大厂强制员工使用 AI 并纳入考核,引发应付式使用。中欧教授王安智指出单纯以降本提效为目的强迫用 AI 不利于组织长期成长,企业应聚焦创造。
AI形式主义大厂考核企业AI组织变革
行业 5月3日
AWS Transform:BI 迁移自动化从数月到数天
AWS 推出 AI 驱动的 BI 迁移工具 Transform,将传统需数月的 Power BI/Tableau 迁移至 Amazon QuickSight 缩短至几天,采用聊天式界面两步操作,无服务器架构+AI 自然语言查询+亚秒级查询。
AWSBI迁移QuickSight自动化企业AI