AI技术日报 2026-05-02

🧠 大模型 6 条

大模型 5月2日

xAI正式推出Grok 4.3，具备始终在线推理能力（always-on reasoning）、100万token上下文长度与低API定价，同时发布名为Custom Voices的语音克隆工具套件。这是xAI在模型能力上的重大升级，直接对标GPT-5和Claude系列。

xAIGrok 4.3推理上下文语音克隆

大模型 5月2日

美团万亿级大模型LongCat-2.0-Preview开启内测，训推全程用国产芯片

美团发布万亿参数大模型LongCat-2.0-Preview，训推全流程使用国产芯片，英伟达算力占比为零，业内尚属首次。目前已完成邀测，每日提供1000万token额度。这标志着国产芯片在大模型训练推理全流程的突破。

美团LongCat国产芯片万亿参数内测

大模型 5月2日

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

研究人员李博杰在arXiv发布论文，提出仅通过黑盒API调用逆向估算LLM参数量的方法，估算GPT-5.5约9万亿参数。该结果在AI社区引发广泛争议，有人认为方法合理，有人质疑准确性。

参数量API逆向估算GPT-5.5争议

大模型 5月2日

ChatGPT数学进阶：从数不清数到给出埃尔德什问题全新解法

OpenAI研究员在官方播客中分享，ChatGPT数学能力已从2025年初算不清日常计算，提升至能解决埃尔德什开放问题，已给出超10个全新解法，还协助解决了困扰42年的数学难题。数学是衡量模型进步的重要基准。

ChatGPT数学埃尔德什OpenAI基准

大模型 5月2日

OpenAI突然宣布：ChatGPT账号进入「高危模式」！密码直接废掉

OpenAI上线ChatGPT高级账户安全(AAS)模式，禁用密码登录及邮箱短信找回，仅支持passkey或物理安全密钥，密钥丢失客服不协助找回。与Yubico推出联名定制YubiKey套装，启用后对话不参与模型训练。

OpenAIChatGPT安全passkeyYubiKey

大模型 5月2日

腾讯混元CL-bench续作发布，让大模型读懂你的日常生活

腾讯混元团队推出CL-Bench Life，用于评估大模型对日常生活碎片化场景的理解推理能力，包含405个真实任务，测试显示12个模型平均仅解决14.5%任务。这揭示了当前大模型在日常生活推理上的巨大差距。

腾讯混元CL-Bench评测日常推理

⚙️ 训练推理 3 条

训练推理 5月2日

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

英伟达在GTC大会披露，其AI工具NB-Cell可一夜完成原本需8名资深工程师10个月的芯片标准单元库迁移工作，性能指标可达甚至超过人类设计水平。这标志着AI在芯片设计领域的重大突破。

英伟达NB-Cell芯片设计AIGTC

训练推理 5月2日

Meta推出Autodata：将AI模型转化为自主数据科学家的智能框架

Meta发布Autodata智能框架，可将AI模型转化为自主数据科学家，自动生成高质量AI训练数据。这一框架解决了AI训练数据质量瓶颈问题，有望大幅提升模型训练效率。

MetaAutodata数据生成训练框架

训练推理 5月2日

撕开Claude Code真相：让它好用的98.4%，是工程不是AI

研究显示Claude Code中仅1.6%为AI决策逻辑，98.4%为工程基础设施。业界流行通过CLAUDE.md等文件构建AI编程工程架构，让AI适配项目规则，提升开发效率。这说明AI工具的成功更多依赖工程设计而非模型能力。

ClaudeCode工程AI编程

🤖 Agent 5 条

Agent 5月2日

永别了，终端！OpenAI疯狂升级Codex，接管Mac人类全程0操作围观

OpenAI升级Codex，从代码工具变为可操控整台电脑的通用智能体，支持多应用集成，可全自动完成音频修复、设计等工作。开发者实测全程零操作，8分钟完成人类2小时任务。

OpenAICodexAgent自动化Mac

Agent 5月2日

Agent可开Cloudflare账户了：自主买付钱、买域名、做部署

Cloudflare与Stripe联合发布新协议，允许AI Agent自主创建Cloudflare账户、订阅付费方案、注册域名并获取API token部署代码。Stripe默认每月每个服务商设置100美元支出上限，该协议基于现有标准重构，任何有登录用户的平台均可复制Stripe的协调者角色。

AgentCloudflareStripe自主部署

Agent 5月2日

实测千问新出的PPT Agent，可算不用为了风格化牺牲二次编辑了

千问推出PPT Agent，采用模板系统+Agent拆解内容的方案，平衡风格化与可二次编辑性，通过多场景测试，能满足不同用户的PPT制作需求。这是AI Agent在办公场景的又一落地应用。

千问PPTAgent办公二次编辑

Agent 5月2日

当我用Codex做PPT，这可能是目前最好的解法之一

开发者阿真基于OpenAI Codex的Image 2功能，开发出visual-style-ppt技能，可提取参考图风格生成图片版PPT，保持多页视觉一致性，代码已开源至GitHub。展示了Codex在多模态任务中的潜力。

CodexPPTImage 2开源多模态

Agent 5月2日

一句话造世界！开发者用10天婚假爆肝，让AI小镇真正「活」了过来

开发者利用10天婚假独立开发出WorldX项目，实现输入一句话5分钟生成完整可运行AI世界，支持AI角色自主互动、多时间线与历史回放，已开源至GitHub。这是AI生成虚拟世界的重要尝试。

WorldXAI世界生成开源虚拟

🔧 基础设施 3 条

基础设施 5月2日

"AAMM四人组"，今年AI烧钱7250亿

Alphabet、亚马逊、微软、Meta四大科技巨头发布超预期财报，公布2026年AI相关资本支出合计最高达7250亿美元，较此前预判高出1025亿美元，四家均加码AI投入。这显示了科技巨头对AI基础设施的疯狂投入。

Alphabet亚马逊微软Meta资本支出

基础设施 5月2日

消息称Cerebras IPO拟募资最高40亿美元，目标估值约400亿美元

AI芯片公司Cerebras Systems计划推进IPO，拟募资最高40亿美元，目标估值约400亿美元。Cerebras的WSE芯片在推理领域具有独特优势，此次IPO将为其与英伟达竞争提供资金支持。

CerebrasIPO芯片估值融资

基础设施 5月2日

Ubuntu及母公司Canonical服务器因持续跨境攻击宕机超24小时

Ubuntu及母公司Canonical的服务器遭遇持续跨境网络攻击，已宕机超过24小时。这一事件凸显了开源基础设施面临的安全威胁，也提醒AI开发者关注基础设施安全。

UbuntuCanonical攻击宕机安全

🦾 机器人 4 条

机器人 5月2日

Meta收购人形机器人初创公司Assured Robot Intelligence，推进具身AI布局

Meta宣布收购人形机器人初创公司Assured Robot Intelligence (ARI)，强化其人形机器人AI模型能力。ARI整个团队（包括联合创始人）将加入Meta的Superintelligence Labs研究部门。这是Meta在具身AI领域的重要布局。

Meta收购ARI人形机器人具身AI

机器人 5月2日

魔法原子进军硅谷背后：世界模型野望与生态卡位

美西时间4月28日，中国具身智能公司魔法原子MagicLab在硅谷举办GE IS大会，发布新一代人形机器人MagicBot X1、灵巧手MagicHand H01及自研世界模型Magic-Mix，披露日均采集1.6万条训练数据，目标2036年营收达140亿美元。

魔法原子MagicBot世界模型具身智能硅谷

机器人 5月2日

独家｜前蔚来AI平台负责人白宇利创立「补天石科技」，聚焦具身数据Infra方向

前蔚来AI平台负责人白宇利创立补天石科技，聚焦具身数据Infra方向，为机器人企业提供数据相关工程体系，首轮融资由红杉资本领投，公司处于早期组建阶段。这反映了具身智能数据基础设施的重要性。

补天石具身数据Infra红杉机器人

机器人 5月2日

日本将从2026年5月开始在机场测试人形机器人

日本将开始在机场测试人形机器人，支持行李和货物处理，旨在减少地面运营中的劳动力短缺和工作量。这是人形机器人在服务场景的重要应用场景。

日本机场人形机器人测试服务

🎨 多模态 4 条

多模态 5月2日

GPT Image 2研究科学家陈博远：我在OpenAI修中文

OpenAI GPT Image 2主力训练者陈博远分享幕后花絮：修复模型中文渲染能力，设计多种文字能力测试彩蛋，项目代号为"布基胶带"，双盲测试中断崖领先第二名。这标志着OpenAI在多模态生成中的全球化布局。

OpenAIGPT Image 2中文渲染多模态

多模态 5月2日

实测纳逗 Pro：能做专业影视级内容的AI平台长啥样

爱奇艺3月30日发布专业级影视制作AI平台纳逗Pro，覆盖影视创作全流程，支持多模型全模态生成，可实现专业级画面、细节统一，降低专业影视创作门槛。这是AI在多模态影视制作领域的重要应用。

爱奇艺纳逗Pro影视多模态AI平台

多模态 5月2日

Best Text to Video AI Benchmark 2026：顶级模型排名

2026年最佳文本生成视频AI基准测试确定了行业最高性能的生成模型，基于提示词一致性、时间一致性、场景稳定性进行评估。这为用户选择合适的视频生成模型提供了参考。

文本生成视频基准测试多模态评估模型

多模态 5月2日

65元，免费开源！实时AI语音伴侣，支持DeepSeek、Qwen、豆包

ElatoAI推出免费开源实时AI语音交互系统，基于Arduino编程和ESP32开发板，支持多AI模型，可实现跨设备实时语音对话，降低AI语音硬件开发门槛，硬件成本仅65元。这是AI语音交互的平民化尝试。

AI语音开源ESP32实时硬件

💰 投融资 4 条

投融资 5月2日

Factory完成1.5亿美元C轮融资，估值15亿美元成独角兽

AI编程初创公司Factory完成1.5亿美元C轮融资，投后估值15亿美元成独角兽。文章对比了Anysphere、Cognition、Factory三家公司在AI编程领域的不同产品定位和技术路线。这显示了AI编程领域的投资热度。

Factory融资AI编程独角兽估值

投融资 5月2日

年轻人涌向AI基金

天弘基金数据显示，2025年末其AI产业链指数产品中，95后持有人增92.14%，00后增超2倍，05后增十倍，30岁以下占比近乎翻倍。公募加速布局AI产业链基金产品。这反映了年轻人对AI投资的热情。

AI基金年轻人投资产业链公募

投融资 5月2日

AI 2026年创业融资报告：数据揭示了什么

AI初创企业融资报告揭开新闻标题背后的每一个数字——究竟是谁筹集了资金，风投们在哪些领域展开激烈争夺，又在哪些领域放弃了投资，以及所有这些风险投资最终流向了哪里。这是了解AI投融资趋势的重要报告。

AI融资创业风投报告趋势

投融资 5月2日

Q1 2026风投纪录：OpenAI $122亿、Anthropic $30亿、xAI $20亿

2026年第一季度风投融资打破所有纪录，OpenAI完成$122亿美元融资轮，Anthropic $30亿，xAI $20亿。四大最大风投轮中有三个发生在Q1 2026。这显示了AI领域的资本狂热。

Q1 2026融资OpenAIAnthropicxAI

🌐 行业 11 条

行业 5月2日

Claude下载激增100%！Anthropic被爆新一轮融资，估值冲破9000亿美元

4月29日消息，Anthropic正谈判新一轮融资，估值或突破9000亿美元，成立不到四年估值一年涨15倍。同期Claude下载量一周激增199%，美国单日下载量首超ChatGPT。这反映了Anthropic在AI领域的强势崛起。

AnthropicClaude融资估值下载

行业 5月2日

我让Claude做「代购」，结果它给自己买了一堆乒乓球

Anthropic开展Project Deal实验，69名员工参与，每人100美元预算，由Claude全权代理交易。一周达成186笔交易，总交易额超4000美元，其中Claude给自己买了19个乒乓球。实验显示更大模型交易表现更好。这是AI Agent在经济活动中的有趣实验。

Claude代购Agent实验交易

行业 5月2日

Claude嘴上说不要中国，背地里把中文做得飞起

用户发现Anthropic开发的Claude虽不对中国大陆开放服务，但已完成官网文档、Claude Code、支持中心等多方面完整简体中文化，投入大量资源。这反映了AI产品的全球化与本地化矛盾。

Claude中文本地化Anthropic矛盾

行业 5月2日

美国电影艺术与科学学院新规：参评奥斯卡的表演、编剧工作必须由人类完成

奥斯卡主办方美国电影艺术与科学学院发布新规则，明确参评奥斯卡的表演、编剧类作品必须由人类完成，不得使用AI生成内容。这是AI生成内容在创意领域的监管里程碑。

奥斯卡AI监管人类创意

行业 5月2日

美AI游说网红资金链曝光：由OpenAI、Palantir、a16z等高管资助

调查显示，推广美国AI、反对中国AI的网红背后资金来自Leading the Future组织，该组织由OpenAI、Palantir、安德森·霍洛维茨（a16z）等机构高管资助。这揭示了AI行业背后的政治游说活动。

AI游说OpenAIa16z政治资金

行业 5月2日

对话小宿科技：他们重新定义了AI时代的「搜索」，却拒绝卖排名

小宿科技推出专为AI Agent调用的智能搜索引擎，以权威性优先排序过滤低质内容，破解GEO铺量逻辑，不卖搜索排名，Kimi、DeepSeek等产品已使用。这是AI搜索领域的新思路。

小宿科技AI搜索Agent权威性排名

行业 5月2日

我在豆包看擦边

用户测试发现，字节跳动豆包AI搜索回答用户问题时，编造李沐相关Proactive Agent视频链接，其中一个链接实际为B站擦边舞蹈视频，暴露AI搜索存在编造信息、内容失实问题。这警示了AI搜索的可靠性问题。

豆包AI搜索编造失实可靠性

行业 5月2日

淘宝拍立淘上线AI启发式图搜功能，单日搜索近1亿次

淘宝拍立淘上线AI启发式图搜功能，支持图片上传搜索，可识需求推商品、总结真实评价，覆盖多场景适配全人群。截至2026年4月，单日搜索近1亿次，近4年用户规模涨幅近150%。这是AI在电商搜索的 successful application。

淘宝拍立淘AI搜索电商图搜

行业 5月2日

终结多智能体视觉幻觉"滚雪球"！新国立等提出ViF：无需改造模型

新加坡国立大学等机构研究人员提出ViF轻量范式，重构多智能体视觉信息传递逻辑，无需改造模型即可抑制视觉幻觉滚雪球，已入选ICLR 2026，在多测试中实现稳定提升。这是多智能体系统的重要技术突破。

ViF视觉幻觉多智能体ICLR新加坡国立

行业 5月2日

「生物信息学」评测，Claude反超人类专家

Anthropic发布生物信息学评测集BioMysteryBench，含99道客观题，76道人类可解、23道人类未解。Claude Mythos在人类可解题准确率达82.6%，超人类专家，人类未解难题准确率29.6%。这展示了Claude在专业领域的卓越能力。

Claude生物信息学评测人类专家Anthropic

行业 5月2日

最终仅拿下50万美元，龙虾陪伴硬件的一次失败尝试

HooRii在Kickstarter上线结合OpenClaw龙虾概念的AI陪伴硬件ClawStage，众筹最终仅获约50万美元，成绩远逊同类产品，被认定是一次失败尝试。这警示了AI硬件产品的市场风险。

ClawStageAI硬件众筹失败陪伴