AI DAILY · 2026-05-02 · 周六
AI 日报 / 2026 年 05 月 02 日
今日收录 42 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
xAI Grok 4.3
支持始终在线推理、100万token上下文,同步发布语音克隆套件
$7250亿
Alphabet、亚马逊、微软、Meta四大巨头2026年AI资本支出合计
Meta收购ARI
收购人形机器人初创公司Assured Robot Intelligence,进军具身AI
Factory $1.5亿
AI编程初创公司完成C轮融资,估值15亿美元成独角兽
Claude下载激增100%
Anthropic估值冲破9000亿美元,Claude美国下载量首超ChatGPT
Cerebras IPO
拟募资最高40亿美元,目标估值约400亿美元
大模型
6 条
xAI正式推出Grok 4.3,具备始终在线推理能力(always-on reasoning)、100万token上下文长度与低API定价,同时发布名为Custom Voices的语音克隆工具套件。这是xAI在模型能力上的重大升级,直接对标GPT-5和Claude系列。
xAIGrok 4.3推理上下文语音克隆
美团发布万亿参数大模型LongCat-2.0-Preview,训推全流程使用国产芯片,英伟达算力占比为零,业内尚属首次。目前已完成邀测,每日提供1000万token额度。这标志着国产芯片在大模型训练推理全流程的突破。
美团LongCat国产芯片万亿参数内测
研究人员李博杰在arXiv发布论文,提出仅通过黑盒API调用逆向估算LLM参数量的方法,估算GPT-5.5约9万亿参数。该结果在AI社区引发广泛争议,有人认为方法合理,有人质疑准确性。
参数量API逆向估算GPT-5.5争议
OpenAI研究员在官方播客中分享,ChatGPT数学能力已从2025年初算不清日常计算,提升至能解决埃尔德什开放问题,已给出超10个全新解法,还协助解决了困扰42年的数学难题。数学是衡量模型进步的重要基准。
ChatGPT数学埃尔德什OpenAI基准
OpenAI上线ChatGPT高级账户安全(AAS)模式,禁用密码登录及邮箱短信找回,仅支持passkey或物理安全密钥,密钥丢失客服不协助找回。与Yubico推出联名定制YubiKey套装,启用后对话不参与模型训练。
OpenAIChatGPT安全passkeyYubiKey
腾讯混元团队推出CL-Bench Life,用于评估大模型对日常生活碎片化场景的理解推理能力,包含405个真实任务,测试显示12个模型平均仅解决14.5%任务。这揭示了当前大模型在日常生活推理上的巨大差距。
腾讯混元CL-Bench评测日常推理
训练推理
3 条
英伟达在GTC大会披露,其AI工具NB-Cell可一夜完成原本需8名资深工程师10个月的芯片标准单元库迁移工作,性能指标可达甚至超过人类设计水平。这标志着AI在芯片设计领域的重大突破。
英伟达NB-Cell芯片设计AIGTC
Meta发布Autodata智能框架,可将AI模型转化为自主数据科学家,自动生成高质量AI训练数据。这一框架解决了AI训练数据质量瓶颈问题,有望大幅提升模型训练效率。
MetaAutodata数据生成训练框架
研究显示Claude Code中仅1.6%为AI决策逻辑,98.4%为工程基础设施。业界流行通过CLAUDE.md等文件构建AI编程工程架构,让AI适配项目规则,提升开发效率。这说明AI工具的成功更多依赖工程设计而非模型能力。
ClaudeCode工程AI编程
Agent
5 条
OpenAI升级Codex,从代码工具变为可操控整台电脑的通用智能体,支持多应用集成,可全自动完成音频修复、设计等工作。开发者实测全程零操作,8分钟完成人类2小时任务。
OpenAICodexAgent自动化Mac
Cloudflare与Stripe联合发布新协议,允许AI Agent自主创建Cloudflare账户、订阅付费方案、注册域名并获取API token部署代码。Stripe默认每月每个服务商设置100美元支出上限,该协议基于现有标准重构,任何有登录用户的平台均可复制Stripe的协调者角色。
AgentCloudflareStripe自主部署
千问推出PPT Agent,采用模板系统+Agent拆解内容的方案,平衡风格化与可二次编辑性,通过多场景测试,能满足不同用户的PPT制作需求。这是AI Agent在办公场景的又一落地应用。
千问PPTAgent办公二次编辑
开发者阿真基于OpenAI Codex的Image 2功能,开发出visual-style-ppt技能,可提取参考图风格生成图片版PPT,保持多页视觉一致性,代码已开源至GitHub。展示了Codex在多模态任务中的潜力。
CodexPPTImage 2开源多模态
开发者利用10天婚假独立开发出WorldX项目,实现输入一句话5分钟生成完整可运行AI世界,支持AI角色自主互动、多时间线与历史回放,已开源至GitHub。这是AI生成虚拟世界的重要尝试。
WorldXAI世界生成开源虚拟
基础设施
3 条
Alphabet、亚马逊、微软、Meta四大科技巨头发布超预期财报,公布2026年AI相关资本支出合计最高达7250亿美元,较此前预判高出1025亿美元,四家均加码AI投入。这显示了科技巨头对AI基础设施的疯狂投入。
Alphabet亚马逊微软Meta资本支出
AI芯片公司Cerebras Systems计划推进IPO,拟募资最高40亿美元,目标估值约400亿美元。Cerebras的WSE芯片在推理领域具有独特优势,此次IPO将为其与英伟达竞争提供资金支持。
CerebrasIPO芯片估值融资
Ubuntu及母公司Canonical的服务器遭遇持续跨境网络攻击,已宕机超过24小时。这一事件凸显了开源基础设施面临的安全威胁,也提醒AI开发者关注基础设施安全。
UbuntuCanonical攻击宕机安全
机器人
4 条
Meta宣布收购人形机器人初创公司Assured Robot Intelligence (ARI),强化其人形机器人AI模型能力。ARI整个团队(包括联合创始人)将加入Meta的Superintelligence Labs研究部门。这是Meta在具身AI领域的重要布局。
Meta收购ARI人形机器人具身AI
美西时间4月28日,中国具身智能公司魔法原子MagicLab在硅谷举办GE IS大会,发布新一代人形机器人MagicBot X1、灵巧手MagicHand H01及自研世界模型Magic-Mix,披露日均采集1.6万条训练数据,目标2036年营收达140亿美元。
魔法原子MagicBot世界模型具身智能硅谷
前蔚来AI平台负责人白宇利创立补天石科技,聚焦具身数据Infra方向,为机器人企业提供数据相关工程体系,首轮融资由红杉资本领投,公司处于早期组建阶段。这反映了具身智能数据基础设施的重要性。
补天石具身数据Infra红杉机器人
日本将开始在机场测试人形机器人,支持行李和货物处理,旨在减少地面运营中的劳动力短缺和工作量。这是人形机器人在服务场景的重要应用场景。
日本机场人形机器人测试服务
多模态
4 条
OpenAI GPT Image 2主力训练者陈博远分享幕后花絮:修复模型中文渲染能力,设计多种文字能力测试彩蛋,项目代号为"布基胶带",双盲测试中断崖领先第二名。这标志着OpenAI在多模态生成中的全球化布局。
OpenAIGPT Image 2中文渲染多模态
爱奇艺3月30日发布专业级影视制作AI平台纳逗Pro,覆盖影视创作全流程,支持多模型全模态生成,可实现专业级画面、细节统一,降低专业影视创作门槛。这是AI在多模态影视制作领域的重要应用。
爱奇艺纳逗Pro影视多模态AI平台
2026年最佳文本生成视频AI基准测试确定了行业最高性能的生成模型,基于提示词一致性、时间一致性、场景稳定性进行评估。这为用户选择合适的视频生成模型提供了参考。
文本生成视频基准测试多模态评估模型
ElatoAI推出免费开源实时AI语音交互系统,基于Arduino编程和ESP32开发板,支持多AI模型,可实现跨设备实时语音对话,降低AI语音硬件开发门槛,硬件成本仅65元。这是AI语音交互的平民化尝试。
AI语音开源ESP32实时硬件
投融资
4 条
AI编程初创公司Factory完成1.5亿美元C轮融资,投后估值15亿美元成独角兽。文章对比了Anysphere、Cognition、Factory三家公司在AI编程领域的不同产品定位和技术路线。这显示了AI编程领域的投资热度。
Factory融资AI编程独角兽估值
天弘基金数据显示,2025年末其AI产业链指数产品中,95后持有人增92.14%,00后增超2倍,05后增十倍,30岁以下占比近乎翻倍。公募加速布局AI产业链基金产品。这反映了年轻人对AI投资的热情。
AI基金年轻人投资产业链公募
AI初创企业融资报告揭开新闻标题背后的每一个数字——究竟是谁筹集了资金,风投们在哪些领域展开激烈争夺,又在哪些领域放弃了投资,以及所有这些风险投资最终流向了哪里。这是了解AI投融资趋势的重要报告。
AI融资创业风投报告趋势
2026年第一季度风投融资打破所有纪录,OpenAI完成$122亿美元融资轮,Anthropic $30亿,xAI $20亿。四大最大风投轮中有三个发生在Q1 2026。这显示了AI领域的资本狂热。
Q1 2026融资OpenAIAnthropicxAI
行业
11 条
4月29日消息,Anthropic正谈判新一轮融资,估值或突破9000亿美元,成立不到四年估值一年涨15倍。同期Claude下载量一周激增199%,美国单日下载量首超ChatGPT。这反映了Anthropic在AI领域的强势崛起。
AnthropicClaude融资估值下载
Anthropic开展Project Deal实验,69名员工参与,每人100美元预算,由Claude全权代理交易。一周达成186笔交易,总交易额超4000美元,其中Claude给自己买了19个乒乓球。实验显示更大模型交易表现更好。这是AI Agent在经济活动中的有趣实验。
Claude代购Agent实验交易
用户发现Anthropic开发的Claude虽不对中国大陆开放服务,但已完成官网文档、Claude Code、支持中心等多方面完整简体中文化,投入大量资源。这反映了AI产品的全球化与本地化矛盾。
Claude中文本地化Anthropic矛盾
奥斯卡主办方美国电影艺术与科学学院发布新规则,明确参评奥斯卡的表演、编剧类作品必须由人类完成,不得使用AI生成内容。这是AI生成内容在创意领域的监管里程碑。
奥斯卡AI监管人类创意
调查显示,推广美国AI、反对中国AI的网红背后资金来自Leading the Future组织,该组织由OpenAI、Palantir、安德森·霍洛维茨(a16z)等机构高管资助。这揭示了AI行业背后的政治游说活动。
AI游说OpenAIa16z政治资金
小宿科技推出专为AI Agent调用的智能搜索引擎,以权威性优先排序过滤低质内容,破解GEO铺量逻辑,不卖搜索排名,Kimi、DeepSeek等产品已使用。这是AI搜索领域的新思路。
小宿科技AI搜索Agent权威性排名
用户测试发现,字节跳动豆包AI搜索回答用户问题时,编造李沐相关Proactive Agent视频链接,其中一个链接实际为B站擦边舞蹈视频,暴露AI搜索存在编造信息、内容失实问题。这警示了AI搜索的可靠性问题。
豆包AI搜索编造失实可靠性
淘宝拍立淘上线AI启发式图搜功能,支持图片上传搜索,可识需求推商品、总结真实评价,覆盖多场景适配全人群。截至2026年4月,单日搜索近1亿次,近4年用户规模涨幅近150%。这是AI在电商搜索的 successful application。
淘宝拍立淘AI搜索电商图搜
新加坡国立大学等机构研究人员提出ViF轻量范式,重构多智能体视觉信息传递逻辑,无需改造模型即可抑制视觉幻觉滚雪球,已入选ICLR 2026,在多测试中实现稳定提升。这是多智能体系统的重要技术突破。
ViF视觉幻觉多智能体ICLR新加坡国立
Anthropic发布生物信息学评测集BioMysteryBench,含99道客观题,76道人类可解、23道人类未解。Claude Mythos在人类可解题准确率达82.6%,超人类专家,人类未解难题准确率29.6%。这展示了Claude在专业领域的卓越能力。
Claude生物信息学评测人类专家Anthropic
HooRii在Kickstarter上线结合OpenClaw龙虾概念的AI陪伴硬件ClawStage,众筹最终仅获约50万美元,成绩远逊同类产品,被认定是一次失败尝试。这警示了AI硬件产品的市场风险。
ClawStageAI硬件众筹失败陪伴