AI技术日报 2026-04-28

🧠 大模型 7 条

大模型 4月28日

小米MiMo-V2.5系列今日正式开源，Pro版登顶全球开源第一

小米MiMo-V2.5系列正式开源，采用MIT协议，允许商用推理部署与二次训练无需额外授权。MiMo-V2.5-Pro在Clawe val榜单中比Kimi K2.6节省42%的Token消耗，全模态Agent能力支持图像/音频/视频处理，支持100万Token上下文。由原DeepSeek核心成员罗福莉领衔研发，继上版36天后再度重磅更新。

MiMo小米开源AgentMIT协议

大模型 4月28日

Talkie：完全基于1931年前文本训练的13B复古语言模型

研究团队发布13B参数复古语言模型Talkie，完全使用1931年前出版的文本训练。模型能够反映其时代的文化与价值观，研究者结合《纽约时报》历史数据衡量历史事件的"意外性"，为语言模型训练数据的价值研究开辟新方向。HackerNews得分103分。

Talkie历史语料13B训练数据

大模型 4月28日

小米MiMo-V2.5-Pro完整基准今日公布，超越DeepSeek-V4

小米MiMo-V2.5-Pro完整基准测试结果今日公布，首日即适配华为昇腾、海光、寒武纪等5家国产芯片。在GDPVal等多项评测中超越DeepSeek-V4，V2.5平均推理速度更快，适合对时延敏感的任务。OpenRouter平台上MiMo-V2-Pro已拿下30%+市占率。

MiMo-V2.5-Pro国产芯片基准测试推理速度

大模型 4月28日

ASI-EVOLVE：全自主AI自进化框架问世，无需人工干预击败人类基线

SII-GAIR发布ASI-EVOLVE，一个自主优化AI训练数据、模型架构和学习算法的智能体框架。该框架在MMLU评分上全面超越人类设计的基线，全程无需任何人工干预，代表了AI自动化研发的重要突破。VentureBeat报道，该研究来自约旦AI研究机构。

ASI-EVOLVE自进化AutoML无人干预训练

大模型 4月28日

MCP vs A2A vs Open Responses：2026年AI智能体通信协议深度对比

深度技术分析对比MCP、A2A、Open Responses三个协议的设计目标与生态。研究指出OpenAI、Google、Anthropic在智能体通信标准上存在竞争，MCP已成为工具调用事实标准，A2A适合跨智能体协作场景，三者有望共存互补而非非此即彼。

MCPA2A协议智能体通信

大模型 4月28日

2026 Mac推理框架实测：vllm-mlx vs Ollama vs llama.cpp

最新实测报告对比M4 Pro上的vllm-mlx、Ollama与llama.cpp推理框架性能。vllm-mlx利用Metal API优化吞吐量表现最优，Ollama易用性最佳，llama.cpp在GGUF量化方面效率突出。报告指出苹果Silicon已成为本地AI推理不可忽视的平台。

Macvllm-mlxOllama本地推理M4

大模型 4月28日

DeepSeek V4 HAA架构深度解析：推理算力降至V3.2的27%

DeepSeek V4采用混合注意力架构（HAA），结合CSA和HCA两种注意力机制，实现推理算力仅为V3.2的27%。百万级超长上下文处理能力通过稀疏注意力实现，API迁移指南已发布，多家云平台完成接入适配。

DeepSeek V4HAA架构混合注意力推理效率

⚙️ 训练推理 7 条

训练推理 4月28日

ASI-EVOLVE发布：自主进化框架全面超越人类设计基线

SII-GAIR研究院发布ASI-EVOLVE智能体框架，实现AI训练全流程自动化：自主选择训练数据、调整模型架构、优化强化学习算法。在MMLU等主流基准上全面超越人类设计基线，且无需专家介入，标志着AI自动化研发进入新阶段。

ASI-EVOLVEAutoML强化学习自主训练

训练推理 4月28日

ICLR 2026"递归自改进AI"工作坊圆满落幕

ICLR 2026于里约热内卢举办的"AI递归自改进"专题工作坊（RSI 2026）落幕，480位研究者参与。会议聚焦让AI系统自动优化自身的提示词、权重和架构，多篇论文展示了超越人类设计基线的实验结果。这是全球首个专注RSI研究的学术工作坊。

ICLR 2026RSI递归自改进自动化研发

训练推理 4月28日

vLLM 与 SGLang 竞速：2026年推理框架格局报告

最新行业报告显示vLLM与SGLang分别占据不同推理场景主导地位。vLLM凭借PagedAttention和更好的生态兼容性在企业部署中领先；SGLang在长序列批处理和多轮对话场景中吞吐量更高。两大框架均已完成DeepSeek V4和MiMo-V2.5适配。

vLLMSGLang推理框架PagedAttention

训练推理 4月28日

小米MiMo-V2.5推理速度实测：比Pro版更快，适合时延敏感场景

小米MiMo-V2.5（标准版）相比Pro版平均推理速度更快，更适合对时延敏感的实时交互任务。官方开放MIT协议允许二次训练，国产芯片首日适配5家，包括华为昇腾、海光DCU等，推动国产算力生态完善。

MiMo-V2.5推理速度时延国产芯片适配

训练推理 4月28日

企业AI Agent落地现状调研：79%企业入局，平均ROI提升31%

深度调研报告显示2026年79%企业已部署或测试AI Agent，平均ROI提升31%。多智能体协作（MAS）成为企业首选架构，MCP协议采用率超过60%。金融、法律、研发三大场景落地最快，主要挑战集中于数据安全与幻觉控制。

AI Agent企业落地MASROI

训练推理 4月28日

DeepSeek V4全球接入量突破10亿日调用

据第三方监测数据，DeepSeek V4发布后日均API调用量突破10亿次，较V3.2增长约3倍。叠加折扣后最低0.025元/百万Token的价格，大量原本使用GPT-5.5 Pro的中小企业开始迁移至DeepSeek V4。

DeepSeek V4API调用价格战迁移

训练推理 4月28日

量化与蒸馏新进展：70B模型压缩至7B性能不降

最新研究报告展示通过结合DPO和知识蒸馏，可将70B级别模型压缩至7B规模同时保持95%以上性能。该技术路线降低了本地部署成本，吸引大量中小企业关注边缘AI部署可行性。

知识蒸馏量化模型压缩边缘部署

🤖 Agent 7 条

Agent 4月28日

CUA开源跨平台计算机使用代理基础设施

CUA项目发布开源框架，专门用于开发和部署"计算机使用代理"，提供沙箱、SDK和基准测试工具。支持macOS、Linux和Windows三大操作系统，为AI控制桌面环境提供标准化解决方案。GitHub Trending今日上榜，生态建设迅速。

CUA计算机使用桌面Agent沙箱

Agent 4月28日

free-claude-code：免费使用Claude Code的开源工具爆火

开发者Alishahryar1在GitHub发布免费使用Claude Code的开源工具，支持终端CLI、VSCode插件和Discord三种方式，无需Anthropic付费API密钥。GitHub Trending今日第一，今日新增2949颗星，总星数突破16000。

Claude Code免费开源VSCode

Agent 4月28日

GitNexus：浏览器端零服务器代码知识图谱引擎

GitNexus推出完全在客户端浏览器运行的代码分析工具，用户可分析GitHub仓库或本地ZIP文件，生成交互式知识图谱，内置Graph RAG智能体辅助深度代码探索，实现隐私优先的本地代码智能。GitHub Trending今日新增1102颗星。

GitNexusGraph RAG知识图谱代码分析

Agent 4月28日

OpenAI Codex Agent深度实测：完成真实工程任务通过率达73%

最新独立评测显示OpenAI Codex Agent在SWE-Bench Verified上通过率达73%，位居Agentic编程任务榜首。该Agent由GPT-5.5驱动并运行在NVIDIA GB200 NVL72机架上，已在OpenAI内部大规模部署，用于加速研发效率。

CodexSWE-Bench编程AgentGPT-5.5

Agent 4月28日

AI Agent沙箱安全研究：14+起MCP安全事件深度分析

AI-Insight Research发布报告，梳理2026年至今14起以上MCP相关安全事件，总结Simon Willison提出的"致命三要素"：提示注入、过度权限、不可审计执行链。报告提出OWASP ASI Top 10框架，为企业Agent部署提供安全规范。

MCP安全提示注入沙箱OWASP

Agent 4月28日

mattpocock/skills：TypeScript大神开源AI编码技能目录持续爆火

Matt Pocock的skills开源目录今日持续在GitHub Trending前列，累计星数突破2万。该项目为Claude等Agent提供可复用的TypeScript编程技能集，涵盖类型系统、框架适配等领域，已成为AI辅助编程生态的重要组件。

skillsTypeScriptClaudeAI编程

Agent 4月28日

PostHog集成AI调试：一站式开发者平台引入AI产品助手

PostHog宣布将AI调试功能深度集成到其产品分析平台，内置AI产品助手专门帮助开发者调试代码并加速新功能部署。平台集产品分析、会话回放、错误追踪、功能管理于一体，AI化升级受到开发者社区热烈欢迎。

PostHogAI调试开发工具产品分析

🔧 基础设施 6 条

基础设施 4月28日

微软OpenAI重构合作：解除独家云绑定，联合开发下一代芯片

微软与OpenAI正式修订合作协议：OpenAI可在任何云提供商（包括AWS、Google Cloud）销售产品；微软IP许可从独家变为非独家；双方将持续合作扩展GW级数据中心并共同开发下一代AI芯片。微软停止向OpenAI支付收入分成，OpenAI分成义务持续至2030年并设上限。

微软OpenAI云解绑数据中心芯片合作

基础设施 4月28日

Google TPU v7 Ironwood获Anthropic百万芯片订单

谷歌TPU v7 Ironwood正式向外部客户开放，首批获得Anthropic百万芯片订单。相比TPU v6e，Ironwood训练吞吐量提升4倍，推理速度提升2.5倍，并首次支持外部用户通过Google Cloud直接访问，打破了此前仅对内部用例开放的限制。

TPU v7IronwoodAnthropicGoogle Cloud

基础设施 4月28日

AMD MI350系列声称推理性能达MI300X的35倍

AMD正式宣布MI350系列GPU技术规格，官方声称推理性能达上代MI300X的35倍，同时支持FP4精度推理以进一步提升效率。vLLM和SGLang已完成MI350适配，这是AMD史上针对AI推理场景的最大架构跃升，预计将给NVIDIA H100/H200带来实质竞争压力。

AMD MI350推理性能GPUFP4

基础设施 4月28日

华为昇腾首日完成DeepSeek V4全系适配

华为昇腾超节点全系列硬件产品宣布完成对DeepSeek V4的全面适配，包括910C、910B和新一代Atlas系列。此次适配覆盖预填充和解码两大推理阶段，首批商业客户已完成接入验证，进一步推动国产AI算力生态与前沿大模型的深度整合。

华为昇腾DeepSeek V4国产算力适配

基础设施 4月28日

微软Azure与OpenAI合作扩大GW级数据中心建设

尽管商业条款重构，微软与OpenAI确认将持续合作扩展GW（吉瓦）级AI数据中心容量，并共同研发下一代AI专用芯片。分析师认为此举表明双方"脱钩"的同时保留了深度技术绑定，AI基础设施投资规模将持续攀升。

Azure数据中心GW级AI基础设施

基础设施 4月28日

AI芯片格局报告：NVIDIA统治地位首次面临实质挑战

AI-Insight Research发布芯片全景报告，指出AI芯片格局正经历三重变革：AMD MI350推理性能反超；Google TPU v7拿下Anthropic大单；国产芯片通过DeepSeek V4适配加速商业化。报告认为NVIDIA的统治地位在推理市场首次面临实质性挑战。

AI芯片NVIDIAAMD国产芯片推理市场

🦾 机器人 6 条

机器人 4月28日

荣耀"闪电"机器人半马破纪录：50分26秒，甩开人类男子世界纪录

4月19日北京亦庄人形机器人半程马拉松，荣耀"闪电"机器人以50分26秒完赛，不仅大幅领先人类男子半马世界纪录，更将一年前机器人半马成绩压缩了110分钟。102支赛队300余台机器人参赛，展示了中国具身智能硬件迭代的狂飙速度。

人形机器人马拉松具身智能运动能力

机器人 4月28日

Applied Intuition：物理AI走向矿山、军舰、无人机等实体重工场景

Applied Intuition CEO在Latent Space播客深入探讨"物理AI"概念，即将AI集成到采矿设备、无人机、卡车、军舰等实体重型机械中。公司已签约多家国防和工业客户，重点解决高对抗性真实环境下的感知-决策-执行闭环，是AI从数字领域向物理世界扩展的最前沿。

物理AI具身智能工业机器人自动驾驶

机器人 4月28日

腾讯Robotics X具身模型HY-Embodied-0.5-X屠榜10项benchmark

腾讯Robotics X发布HY-Embodied-0.5-X具身模型并开源，在覆盖规划、空间推理、具身问答、视觉指代与轨迹理解的10项benchmark中取得6项第一、3项第二成绩。模型专注机器人在真实环境的感知-决策-执行能力，依托HY-Embodied-0.5-MoT-2B架构。

腾讯Robotics X具身模型开源benchmark

机器人 4月28日

清华大学具身智能与机器人研究院正式揭牌

清华大学具身智能与机器人研究院正式揭牌成立，聚焦具身智能与实体产业融合，加速新质生产力落地。研究院将依托清华AI研究基础，推进人形机器人感知、决策与执行关键技术攻关，对接国家"未来产业投资基金"政策。

清华具身智能研究院人形机器人

机器人 4月28日

世航智能海洋具身机器人"虎鲸"登上新加坡海事周C位

中国世航智能（SEAHI Robotics）携海洋具身机器人"虎鲸"亮相2026新加坡海事周，成为全场唯一官方特邀海洋具身机器人企业，与中国船级社CCS联手站上世界海事舞台，吸引大量国际船东和港口运营商关注。

海洋机器人具身智能虎鲸新加坡海事

机器人 4月28日

2026年具身智能世界模型与数据集大爆发

行业报告梳理2026年具身智能领域进展，AGIBOT World 2026、ABot-M0推出包含600万条机器人操作轨迹的数据集，打破训练数据瓶颈。端云协同架构成为主流：云端大模型预训练结合机器人端轻量化推理，降低部署门槛同时保留复杂任务能力。

世界模型训练数据端云协同具身智能

🎨 多模态 7 条

多模态 4月28日

阿里HappyHorse 1.0正式开启灰测，150B参数登榜视频生成第二

阿里HappyHorse 1.0于4月27日正式开启灰度测试，官网、阿里云百炼平台和千问App同步开放。150亿参数，单H100生成5秒1080P视频仅需38秒，比竞品Seedance 2.0快2-3倍。当前在图生视频（含音频）榜单位列第二，文生视频赛道被Seedance 2.0反超。API将于4月30日正式上线百炼平台。

HappyHorse阿里视频生成150B

多模态 4月28日

微软开源VibeVoice前沿语音AI项目

微软开源VibeVoice语音AI项目，今日GitHub Trending新增757颗星，总星数突破43000。VibeVoice支持高质量语音合成与理解，代表微软在开源语音AI领域的最新布局，与ElevenLabs、OpenAI TTS形成竞争，开发者可直接调用API构建语音应用。

VibeVoice微软语音AI开源

多模态 4月28日

阿里Happy Oyster：从文本/图像生成可交互3D场景与沉浸视频

阿里4月16日发布的世界模型产品Happy Oyster今日获更多技术解析，该模型可从文本和图像提示生成可交互3D场景，支持最长3分钟的沉浸式视频。HappyHorse和Happy Oyster构成阿里AI创新事业部双线多模态矩阵，另有一款多模态模型即将发布。

Happy Oyster世界模型3D场景多模态

多模态 4月28日

字节Seedance 2.0继续领跑：文生视频赛道反超HappyHorse

字节Seedance 2.0在文生视频赛道成功反超HappyHorse 1.0，保持文生视频第一位置。Seedance 2.0支持文字/图像/视频/音频四种输入，日Token消耗在字节漫剧场景突破7000万，生态壁垒已形成，头部客户迁移成本极高，短期内格局难以撼动。

Seedance 2.0字节视频生成文生视频

多模态 4月28日

三星Galaxy Glasses"Jinju"谍照曝光，预计479美元

三星首款智能眼镜代号Jinju的设计谍照流出，外观类似Meta雷朋智能眼镜（无显示屏设计），预计售价379至499美元。分析师预测将在下月Google I/O大会期间正式发布，将与Meta雷朋直接竞争，AI语音助手为核心卖点。

三星智能眼镜JinjuMeta雷朋

多模态 4月28日

AI驱动iPhone主屏幕应用Skye上线前获融资

Skye开发了一款AI感知的iPhone主屏幕应用，在正式上线前已成功获得天使投资，重塑手机静态界面的AI化演进。该应用根据用户习惯、时间、地点动态调整主屏幕布局和推荐应用，代表消费级AI个性化体验的新方向。

SkyeiPhoneAI主屏幕个性化

多模态 4月28日

AIGC视频商业化加速：HappyHorse定价1.6元/秒vs Seedance比价

阿里HappyHorse公布商业定价：1080P为1.6元/秒，720P为0.9元/秒，折扣后分别降至0.78元和0.44元。720P比Seedance 2.0每秒便宜约1毛钱，但并非价格屠夫策略，阿里定价底气来自更高生成效率（相同算力可服务更多请求），降低了单位服务成本。

视频定价HappyHorseSeedance商业化

💰 投融资 7 条

投融资 4月28日

Ineffable Intelligence：史上最大种子轮，前DeepMind研究员David Silver融资11亿美元

英国AI实验室Ineffable Intelligence从隐身状态宣布获得11亿美元种子融资，估值51亿美元，是史上最大种子轮融资记录。由AlphaGo之父、前DeepMind首席研究员David Silver创立，目标是构建不依赖人类生成数据进行自主学习的AI系统，投资方包括英伟达和Google。

Ineffable Intelligence$11亿种子轮David Silver

投融资 4月28日

谷歌豪掷400亿美元投资Anthropic，含TPU计算资源

谷歌与Anthropic签署史上最大AI投资协议，总额高达400亿美元，其中包含大量Google TPU计算资源，是自2019年微软首次投资OpenAI以来行业最大的单笔AI投资。协议同步要求Anthropic优先使用Google Cloud基础设施，进一步巩固Anthropic与谷歌的深度绑定。

谷歌Anthropic$400亿TPU

投融资 4月28日

2026 Q1全球AI融资创纪录：807起事件总额2748亿美元

最新统计报告显示2026年第一季度全球AI初创融资达2748亿美元，807起事件，单季创历史新高。超大轮融资（10亿美元以上）共6起，主导了总金额的约70%。自主智能体赛道吸引最多新增资本，医疗AI和企业智能体两大方向融资量同比增长均超150%。

2026 Q1融资$2748亿AI投资智能体

投融资 4月28日

福布斯AI 50榜单：OpenAI、Anthropic累计融资2426亿美元

2026福布斯AI 50榜单显示OpenAI、Anthropic两家公司累计融资2426亿美元，约占榜单企业总融资额的近半。除两巨头外，xAI、Mistral、Cohere等也进入榜单，国产AI公司MiniMax、智谱AI首次跻身榜单前列。

福布斯AI 50OpenAIAnthropic融资

投融资 4月28日

AI商业模式之困：炒作到利润之间缺失的"第二阶段"

MIT Technology Review深度分析指出当前AI行业面临关键商业化挑战：第一阶段（研发炒作）已完成，第三阶段（规模盈利）尚未到达，关键的"第二阶段"（可持续变现机制）仍不清晰。多家AI公司仍处于烧钱换增长模式，订阅和API收费尚未覆盖研发成本。

AI商业化盈利商业模式变现

投融资 4月28日

DeepSeek首次对外融资：100亿美元估值，至少3亿美元

DeepSeek首次接受外部融资，估值定在100亿美元，募资规模至少3亿美元，为此前多次拒绝一线机构后的首次例外。此轮融资被业内视为信号事件，标志着DeepSeek从纯技术驱动转向更主动的商业化布局，将加速国际市场开拓与基础设施建设。

DeepSeek融资100亿美元估值商业化

投融资 4月28日

Skye AI主屏幕应用上线前融资，重塑手机交互界面

AI感知iPhone主屏幕应用Skye在正式上线前已完成融资，是2026年消费级AI个性化领域的重要新玩家。投资者认为其有望成为手机AI化演进的新入口，与苹果Apple Intelligence形成互补或竞争关系，代表了消费侧AI应用的新方向。

SkyeAI应用消费级AI手机

🌐 行业 7 条

行业 4月28日

马斯克诉奥特曼世纪庭审开启：$1340亿索赔，或影响OpenAI IPO

马斯克与OpenAI的长期法律战在北加利福尼亚进入陪审团遴选阶段，马斯克索赔1340亿美元，指控奥特曼违背OpenAI成立时的非营利承诺。案件正值OpenAI IPO筹备阶段，若马斯克胜诉可能从根本上改变公司结构，法律结果将深刻影响AI行业治理格局。

马斯克OpenAI诉讼IPO

行业 4月28日

OpenAI与微软协议重构：AGI条款正式移除，关系走向独立

微软与OpenAI修订协议移除了此前管辖双方合作的"人工通用智能"（AGI）条款，双方关系被描述为更加灵活但保持距离。此举被解读为OpenAI IPO前的法律清场，也表明微软认为AGI短期内无法实现，不再通过合同条款锁定潜在利益。

AGI条款微软OpenAIIPO

行业 4月28日

企业AI应用指数：79%已落地，金融法律研发领跑

香港大学与德勤中国联合发布2026企业AI应用指数，79%受访企业已完成AI Agent至少一个场景落地，金融、法律、研发为进展最快的三大行业。主要障碍集中于数据合规（61%）、模型幻觉（54%）和集成复杂度（49%）三方面。

企业AI落地德勤应用指数

行业 4月28日

LLM行为漂移：生成式AI随机性打破传统单元测试方法

微软研究员在VentureBeat撰文指出生成式AI的随机性和不可预测性打破了传统的单元测试范式。LLM行为漂移问题在生产环境中普遍存在，提出需要构建"概率性测试"框架，通过多次采样和统计分析替代二元通过/失败判断。

LLM行为漂移测试生产可靠性微软

行业 4月28日

AI"静默失败"现象：企业部署最昂贵的失败不报错

VentureBeat报道企业AI部署中最昂贵的失败来自"静默失败"——系统正常运行但持续自信地给出错误结果，不产生报错信息。这一问题在医疗AI、法律AI和金融AI场景中危害最大，推动行业转向构建AI系统的"可信度仪表盘"和异常检测机制。

静默失败AI可靠性企业AI监控

行业 4月28日

2026 AI合成受众技术：72%准确率对行为建模，颠覆咨询行业

WPP高管在VentureBeat撰文称AI合成受众技术已能以72%准确率对特定人口统计群体的行为进行建模，将颠覆传统市场调研和咨询行业。该技术仅凭年龄、社区和性别等基本信息即可模拟消费者反应，大幅降低新产品测试成本。

AI合成受众市场调研行为建模咨询

行业 4月28日

AI模型幻觉问题报告：73%企业在生产中遭遇重大幻觉事件

行业调研显示73%企业在生产环境中经历过重大LLM幻觉事件，其中医疗和法律场景损失最大。推理型模型（o4-mini、QwQ-32B等）幻觉率显著低于通用对话模型，推动企业加速迁移至推理优先架构。

幻觉LLM可靠性推理模型企业AI