AI 日报 · 2026-04-28
AI DAILY · 2026-04-28 · 周二

AI 日报 / 2026 年 04 月 28 日

今日收录 56 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

HackerNewsGitHub TrendingLatent.Spaceaheadofai36Kr极客公园华尔街见闻腾讯新闻TechCrunchVentureBeat
微软OpenAI解绑
双方终止独家协议,OpenAI可向AWS/Google Cloud销售,微软停止收入分成
Ineffable $11亿
前DeepMind研究员David Silver融资11亿美元,史上最大种子轮,构建无人类数据AI
小米MiMo开源
MiMo-V2.5系列今日开源,商用MIT协议,Pro版登顶全球开源模型第一
马斯克奥特曼对簿
世纪诉讼开庭,$1340亿索赔,OpenAI IPO或因此受阻
ASI-EVOLVE自进化
SII-GAIR发布框架,全自主优化训练数据/架构/算法,MMLU提升超人类基线
HappyHorse正式灰测
阿里视频大模型4月28日灰测开启,150B参数,H100推理5秒视频仅38秒
🧠 大模型 7 条
大模型 4月28日
研究团队发布13B参数复古语言模型Talkie,完全使用1931年前出版的文本训练。模型能够反映其时代的文化与价值观,研究者结合《纽约时报》历史数据衡量历史事件的"意外性",为语言模型训练数据的价值研究开辟新方向。HackerNews得分103分。
Talkie历史语料13B训练数据
大模型 4月28日
小米MiMo-V2.5-Pro完整基准今日公布,超越DeepSeek-V4
小米MiMo-V2.5-Pro完整基准测试结果今日公布,首日即适配华为昇腾、海光、寒武纪等5家国产芯片。在GDPVal等多项评测中超越DeepSeek-V4,V2.5平均推理速度更快,适合对时延敏感的任务。OpenRouter平台上MiMo-V2-Pro已拿下30%+市占率。
MiMo-V2.5-Pro国产芯片基准测试推理速度
大模型 4月28日
SII-GAIR发布ASI-EVOLVE,一个自主优化AI训练数据、模型架构和学习算法的智能体框架。该框架在MMLU评分上全面超越人类设计的基线,全程无需任何人工干预,代表了AI自动化研发的重要突破。VentureBeat报道,该研究来自约旦AI研究机构。
ASI-EVOLVE自进化AutoML无人干预训练
大模型 4月28日
MCP vs A2A vs Open Responses:2026年AI智能体通信协议深度对比
深度技术分析对比MCP、A2A、Open Responses三个协议的设计目标与生态。研究指出OpenAI、Google、Anthropic在智能体通信标准上存在竞争,MCP已成为工具调用事实标准,A2A适合跨智能体协作场景,三者有望共存互补而非非此即彼。
MCPA2A协议智能体通信
大模型 4月28日
2026 Mac推理框架实测:vllm-mlx vs Ollama vs llama.cpp
最新实测报告对比M4 Pro上的vllm-mlx、Ollama与llama.cpp推理框架性能。vllm-mlx利用Metal API优化吞吐量表现最优,Ollama易用性最佳,llama.cpp在GGUF量化方面效率突出。报告指出苹果Silicon已成为本地AI推理不可忽视的平台。
Macvllm-mlxOllama本地推理M4
大模型 4月28日
DeepSeek V4 HAA架构深度解析:推理算力降至V3.2的27%
DeepSeek V4采用混合注意力架构(HAA),结合CSA和HCA两种注意力机制,实现推理算力仅为V3.2的27%。百万级超长上下文处理能力通过稀疏注意力实现,API迁移指南已发布,多家云平台完成接入适配。
DeepSeek V4HAA架构混合注意力推理效率
⚙️ 训练推理 7 条
训练推理 4月28日
ICLR 2026"递归自改进AI"工作坊圆满落幕
ICLR 2026于里约热内卢举办的"AI递归自改进"专题工作坊(RSI 2026)落幕,480位研究者参与。会议聚焦让AI系统自动优化自身的提示词、权重和架构,多篇论文展示了超越人类设计基线的实验结果。这是全球首个专注RSI研究的学术工作坊。
ICLR 2026RSI递归自改进自动化研发
训练推理 4月28日
vLLM 与 SGLang 竞速:2026年推理框架格局报告
最新行业报告显示vLLM与SGLang分别占据不同推理场景主导地位。vLLM凭借PagedAttention和更好的生态兼容性在企业部署中领先;SGLang在长序列批处理和多轮对话场景中吞吐量更高。两大框架均已完成DeepSeek V4和MiMo-V2.5适配。
vLLMSGLang推理框架PagedAttention
训练推理 4月28日
小米MiMo-V2.5推理速度实测:比Pro版更快,适合时延敏感场景
小米MiMo-V2.5(标准版)相比Pro版平均推理速度更快,更适合对时延敏感的实时交互任务。官方开放MIT协议允许二次训练,国产芯片首日适配5家,包括华为昇腾、海光DCU等,推动国产算力生态完善。
MiMo-V2.5推理速度时延国产芯片适配
训练推理 4月28日
企业AI Agent落地现状调研:79%企业入局,平均ROI提升31%
深度调研报告显示2026年79%企业已部署或测试AI Agent,平均ROI提升31%。多智能体协作(MAS)成为企业首选架构,MCP协议采用率超过60%。金融、法律、研发三大场景落地最快,主要挑战集中于数据安全与幻觉控制。
AI Agent企业落地MASROI
训练推理 4月28日
DeepSeek V4全球接入量突破10亿日调用
据第三方监测数据,DeepSeek V4发布后日均API调用量突破10亿次,较V3.2增长约3倍。叠加折扣后最低0.025元/百万Token的价格,大量原本使用GPT-5.5 Pro的中小企业开始迁移至DeepSeek V4。
DeepSeek V4API调用价格战迁移
训练推理 4月28日
量化与蒸馏新进展:70B模型压缩至7B性能不降
最新研究报告展示通过结合DPO和知识蒸馏,可将70B级别模型压缩至7B规模同时保持95%以上性能。该技术路线降低了本地部署成本,吸引大量中小企业关注边缘AI部署可行性。
知识蒸馏量化模型压缩边缘部署
🤖 Agent 7 条
Agent 4月28日
free-claude-code:免费使用Claude Code的开源工具爆火
开发者Alishahryar1在GitHub发布免费使用Claude Code的开源工具,支持终端CLI、VSCode插件和Discord三种方式,无需Anthropic付费API密钥。GitHub Trending今日第一,今日新增2949颗星,总星数突破16000。
Claude Code免费开源VSCode
Agent 4月28日
GitNexus:浏览器端零服务器代码知识图谱引擎
GitNexus推出完全在客户端浏览器运行的代码分析工具,用户可分析GitHub仓库或本地ZIP文件,生成交互式知识图谱,内置Graph RAG智能体辅助深度代码探索,实现隐私优先的本地代码智能。GitHub Trending今日新增1102颗星。
GitNexusGraph RAG知识图谱代码分析
Agent 4月28日
OpenAI Codex Agent深度实测:完成真实工程任务通过率达73%
最新独立评测显示OpenAI Codex Agent在SWE-Bench Verified上通过率达73%,位居Agentic编程任务榜首。该Agent由GPT-5.5驱动并运行在NVIDIA GB200 NVL72机架上,已在OpenAI内部大规模部署,用于加速研发效率。
CodexSWE-Bench编程AgentGPT-5.5
Agent 4月28日
AI Agent沙箱安全研究:14+起MCP安全事件深度分析
AI-Insight Research发布报告,梳理2026年至今14起以上MCP相关安全事件,总结Simon Willison提出的"致命三要素":提示注入、过度权限、不可审计执行链。报告提出OWASP ASI Top 10框架,为企业Agent部署提供安全规范。
MCP安全提示注入沙箱OWASP
Agent 4月28日
mattpocock/skills:TypeScript大神开源AI编码技能目录持续爆火
Matt Pocock的skills开源目录今日持续在GitHub Trending前列,累计星数突破2万。该项目为Claude等Agent提供可复用的TypeScript编程技能集,涵盖类型系统、框架适配等领域,已成为AI辅助编程生态的重要组件。
skillsTypeScriptClaudeAI编程
Agent 4月28日
PostHog集成AI调试:一站式开发者平台引入AI产品助手
PostHog宣布将AI调试功能深度集成到其产品分析平台,内置AI产品助手专门帮助开发者调试代码并加速新功能部署。平台集产品分析、会话回放、错误追踪、功能管理于一体,AI化升级受到开发者社区热烈欢迎。
PostHogAI调试开发工具产品分析
🔧 基础设施 6 条
基础设施 4月28日
Google TPU v7 Ironwood获Anthropic百万芯片订单
谷歌TPU v7 Ironwood正式向外部客户开放,首批获得Anthropic百万芯片订单。相比TPU v6e,Ironwood训练吞吐量提升4倍,推理速度提升2.5倍,并首次支持外部用户通过Google Cloud直接访问,打破了此前仅对内部用例开放的限制。
TPU v7IronwoodAnthropicGoogle Cloud
基础设施 4月28日
AMD MI350系列声称推理性能达MI300X的35倍
AMD正式宣布MI350系列GPU技术规格,官方声称推理性能达上代MI300X的35倍,同时支持FP4精度推理以进一步提升效率。vLLM和SGLang已完成MI350适配,这是AMD史上针对AI推理场景的最大架构跃升,预计将给NVIDIA H100/H200带来实质竞争压力。
AMD MI350推理性能GPUFP4
基础设施 4月28日
华为昇腾首日完成DeepSeek V4全系适配
华为昇腾超节点全系列硬件产品宣布完成对DeepSeek V4的全面适配,包括910C、910B和新一代Atlas系列。此次适配覆盖预填充和解码两大推理阶段,首批商业客户已完成接入验证,进一步推动国产AI算力生态与前沿大模型的深度整合。
华为昇腾DeepSeek V4国产算力适配
基础设施 4月28日
微软Azure与OpenAI合作扩大GW级数据中心建设
尽管商业条款重构,微软与OpenAI确认将持续合作扩展GW(吉瓦)级AI数据中心容量,并共同研发下一代AI专用芯片。分析师认为此举表明双方"脱钩"的同时保留了深度技术绑定,AI基础设施投资规模将持续攀升。
Azure数据中心GW级AI基础设施
基础设施 4月28日
AI芯片格局报告:NVIDIA统治地位首次面临实质挑战
AI-Insight Research发布芯片全景报告,指出AI芯片格局正经历三重变革:AMD MI350推理性能反超;Google TPU v7拿下Anthropic大单;国产芯片通过DeepSeek V4适配加速商业化。报告认为NVIDIA的统治地位在推理市场首次面临实质性挑战。
AI芯片NVIDIAAMD国产芯片推理市场
🦾 机器人 6 条
机器人 4月28日
Applied Intuition:物理AI走向矿山、军舰、无人机等实体重工场景
Applied Intuition CEO在Latent Space播客深入探讨"物理AI"概念,即将AI集成到采矿设备、无人机、卡车、军舰等实体重型机械中。公司已签约多家国防和工业客户,重点解决高对抗性真实环境下的感知-决策-执行闭环,是AI从数字领域向物理世界扩展的最前沿。
物理AI具身智能工业机器人自动驾驶
机器人 4月28日
腾讯Robotics X具身模型HY-Embodied-0.5-X屠榜10项benchmark
腾讯Robotics X发布HY-Embodied-0.5-X具身模型并开源,在覆盖规划、空间推理、具身问答、视觉指代与轨迹理解的10项benchmark中取得6项第一、3项第二成绩。模型专注机器人在真实环境的感知-决策-执行能力,依托HY-Embodied-0.5-MoT-2B架构。
腾讯Robotics X具身模型开源benchmark
机器人 4月28日
清华大学具身智能与机器人研究院正式揭牌
清华大学具身智能与机器人研究院正式揭牌成立,聚焦具身智能与实体产业融合,加速新质生产力落地。研究院将依托清华AI研究基础,推进人形机器人感知、决策与执行关键技术攻关,对接国家"未来产业投资基金"政策。
清华具身智能研究院人形机器人
机器人 4月28日
世航智能海洋具身机器人"虎鲸"登上新加坡海事周C位
中国世航智能(SEAHI Robotics)携海洋具身机器人"虎鲸"亮相2026新加坡海事周,成为全场唯一官方特邀海洋具身机器人企业,与中国船级社CCS联手站上世界海事舞台,吸引大量国际船东和港口运营商关注。
海洋机器人具身智能虎鲸新加坡海事
机器人 4月28日
2026年具身智能世界模型与数据集大爆发
行业报告梳理2026年具身智能领域进展,AGIBOT World 2026、ABot-M0推出包含600万条机器人操作轨迹的数据集,打破训练数据瓶颈。端云协同架构成为主流:云端大模型预训练结合机器人端轻量化推理,降低部署门槛同时保留复杂任务能力。
世界模型训练数据端云协同具身智能
🎨 多模态 7 条
多模态 4月28日
微软开源VibeVoice前沿语音AI项目
微软开源VibeVoice语音AI项目,今日GitHub Trending新增757颗星,总星数突破43000。VibeVoice支持高质量语音合成与理解,代表微软在开源语音AI领域的最新布局,与ElevenLabs、OpenAI TTS形成竞争,开发者可直接调用API构建语音应用。
VibeVoice微软语音AI开源
多模态 4月28日
阿里Happy Oyster:从文本/图像生成可交互3D场景与沉浸视频
阿里4月16日发布的世界模型产品Happy Oyster今日获更多技术解析,该模型可从文本和图像提示生成可交互3D场景,支持最长3分钟的沉浸式视频。HappyHorse和Happy Oyster构成阿里AI创新事业部双线多模态矩阵,另有一款多模态模型即将发布。
Happy Oyster世界模型3D场景多模态
多模态 4月28日
字节Seedance 2.0继续领跑:文生视频赛道反超HappyHorse
字节Seedance 2.0在文生视频赛道成功反超HappyHorse 1.0,保持文生视频第一位置。Seedance 2.0支持文字/图像/视频/音频四种输入,日Token消耗在字节漫剧场景突破7000万,生态壁垒已形成,头部客户迁移成本极高,短期内格局难以撼动。
Seedance 2.0字节视频生成文生视频
多模态 4月28日
三星Galaxy Glasses"Jinju"谍照曝光,预计479美元
三星首款智能眼镜代号Jinju的设计谍照流出,外观类似Meta雷朋智能眼镜(无显示屏设计),预计售价379至499美元。分析师预测将在下月Google I/O大会期间正式发布,将与Meta雷朋直接竞争,AI语音助手为核心卖点。
三星智能眼镜JinjuMeta雷朋
多模态 4月28日
AI驱动iPhone主屏幕应用Skye上线前获融资
Skye开发了一款AI感知的iPhone主屏幕应用,在正式上线前已成功获得天使投资,重塑手机静态界面的AI化演进。该应用根据用户习惯、时间、地点动态调整主屏幕布局和推荐应用,代表消费级AI个性化体验的新方向。
SkyeiPhoneAI主屏幕个性化
多模态 4月28日
AIGC视频商业化加速:HappyHorse定价1.6元/秒vs Seedance比价
阿里HappyHorse公布商业定价:1080P为1.6元/秒,720P为0.9元/秒,折扣后分别降至0.78元和0.44元。720P比Seedance 2.0每秒便宜约1毛钱,但并非价格屠夫策略,阿里定价底气来自更高生成效率(相同算力可服务更多请求),降低了单位服务成本。
视频定价HappyHorseSeedance商业化
💰 投融资 7 条
投融资 4月28日
谷歌豪掷400亿美元投资Anthropic,含TPU计算资源
谷歌与Anthropic签署史上最大AI投资协议,总额高达400亿美元,其中包含大量Google TPU计算资源,是自2019年微软首次投资OpenAI以来行业最大的单笔AI投资。协议同步要求Anthropic优先使用Google Cloud基础设施,进一步巩固Anthropic与谷歌的深度绑定。
谷歌Anthropic$400亿TPU
投融资 4月28日
2026 Q1全球AI融资创纪录:807起事件总额2748亿美元
最新统计报告显示2026年第一季度全球AI初创融资达2748亿美元,807起事件,单季创历史新高。超大轮融资(10亿美元以上)共6起,主导了总金额的约70%。自主智能体赛道吸引最多新增资本,医疗AI和企业智能体两大方向融资量同比增长均超150%。
2026 Q1融资$2748亿AI投资智能体
投融资 4月28日
福布斯AI 50榜单:OpenAI、Anthropic累计融资2426亿美元
2026福布斯AI 50榜单显示OpenAI、Anthropic两家公司累计融资2426亿美元,约占榜单企业总融资额的近半。除两巨头外,xAI、Mistral、Cohere等也进入榜单,国产AI公司MiniMax、智谱AI首次跻身榜单前列。
福布斯AI 50OpenAIAnthropic融资
投融资 4月28日
AI商业模式之困:炒作到利润之间缺失的"第二阶段"
MIT Technology Review深度分析指出当前AI行业面临关键商业化挑战:第一阶段(研发炒作)已完成,第三阶段(规模盈利)尚未到达,关键的"第二阶段"(可持续变现机制)仍不清晰。多家AI公司仍处于烧钱换增长模式,订阅和API收费尚未覆盖研发成本。
AI商业化盈利商业模式变现
投融资 4月28日
DeepSeek首次对外融资:100亿美元估值,至少3亿美元
DeepSeek首次接受外部融资,估值定在100亿美元,募资规模至少3亿美元,为此前多次拒绝一线机构后的首次例外。此轮融资被业内视为信号事件,标志着DeepSeek从纯技术驱动转向更主动的商业化布局,将加速国际市场开拓与基础设施建设。
DeepSeek融资100亿美元估值商业化
投融资 4月28日
Skye AI主屏幕应用上线前融资,重塑手机交互界面
AI感知iPhone主屏幕应用Skye在正式上线前已完成融资,是2026年消费级AI个性化领域的重要新玩家。投资者认为其有望成为手机AI化演进的新入口,与苹果Apple Intelligence形成互补或竞争关系,代表了消费侧AI应用的新方向。
SkyeAI应用消费级AI手机
🌐 行业 7 条
行业 4月28日
OpenAI与微软协议重构:AGI条款正式移除,关系走向独立
微软与OpenAI修订协议移除了此前管辖双方合作的"人工通用智能"(AGI)条款,双方关系被描述为更加灵活但保持距离。此举被解读为OpenAI IPO前的法律清场,也表明微软认为AGI短期内无法实现,不再通过合同条款锁定潜在利益。
AGI条款微软OpenAIIPO
行业 4月28日
企业AI应用指数:79%已落地,金融法律研发领跑
香港大学与德勤中国联合发布2026企业AI应用指数,79%受访企业已完成AI Agent至少一个场景落地,金融、法律、研发为进展最快的三大行业。主要障碍集中于数据合规(61%)、模型幻觉(54%)和集成复杂度(49%)三方面。
企业AI落地德勤应用指数
行业 4月28日
LLM行为漂移:生成式AI随机性打破传统单元测试方法
微软研究员在VentureBeat撰文指出生成式AI的随机性和不可预测性打破了传统的单元测试范式。LLM行为漂移问题在生产环境中普遍存在,提出需要构建"概率性测试"框架,通过多次采样和统计分析替代二元通过/失败判断。
LLM行为漂移测试生产可靠性微软
行业 4月28日
AI"静默失败"现象:企业部署最昂贵的失败不报错
VentureBeat报道企业AI部署中最昂贵的失败来自"静默失败"——系统正常运行但持续自信地给出错误结果,不产生报错信息。这一问题在医疗AI、法律AI和金融AI场景中危害最大,推动行业转向构建AI系统的"可信度仪表盘"和异常检测机制。
静默失败AI可靠性企业AI监控
行业 4月28日
2026 AI合成受众技术:72%准确率对行为建模,颠覆咨询行业
WPP高管在VentureBeat撰文称AI合成受众技术已能以72%准确率对特定人口统计群体的行为进行建模,将颠覆传统市场调研和咨询行业。该技术仅凭年龄、社区和性别等基本信息即可模拟消费者反应,大幅降低新产品测试成本。
AI合成受众市场调研行为建模咨询
行业 4月28日
AI模型幻觉问题报告:73%企业在生产中遭遇重大幻觉事件
行业调研显示73%企业在生产环境中经历过重大LLM幻觉事件,其中医疗和法律场景损失最大。推理型模型(o4-mini、QwQ-32B等)幻觉率显著低于通用对话模型,推动企业加速迁移至推理优先架构。
幻觉LLM可靠性推理模型企业AI