AI 日报 · 2026-05-06
AI DAILY · 2026-05-06 · 周三

AI 日报 / 2026 年 05 月 06 日

今日收录 61 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向

HackerNewsGitHub TrendingLatent.Space36Kr极客公园华尔街见闻TechCrunchVentureBeat
GPT-5.5 Instant
OpenAI 发布 GPT-5.5 Instant 作为 ChatGPT 新默认模型,幻觉减少 52.5%,延迟更低,同时推出记忆机制和 8000 人 Codex 赠送计划
$11.6亿
SAP 以约 11.6 亿美元收购仅成立 18 个月的德国 AI 实验室 Prior Labs,瞄准结构化数据基础模型
SubQ 1000x
迈阿密初创 Subquadratic 走出隐身模式,声称首个突破 O(n²) 注意力瓶颈的 LLM,1200 万 token 上下文窗口,效率提升 1000 倍
Gemma 4 3x加速
Google 开源 Gemma 4 MTP Drafter,基于多 Token 预测解码,推理速度最高提升 3 倍,HN 466 分
DeepSeek-TUI +2434星
Rust 构建的终端编码 Agent DeepSeek-TUI 单日斩获 +2434 stars 登顶 GitHub Trending,内存占用极低、启动极快,专为 DeepSeek 模型优化
Computer Use 45x
Reflex 基准测试显示 Computer Use 比 Structured API 贵 45 倍(53步/55万token vs 8次调用/1.2万token),HN 325 分
🧠 大模型 7 条
大模型 5月6日
Subquadratic 发布 SubQ:首个突破二次复杂度瓶颈的 LLM
迈阿密初创 Subquadratic 走出隐身模式,发布 SubQ 1M-Preview——首个基于完全亚二次架构的大语言模型。模型支持 1200 万 token 上下文窗口,声称在长序列任务上实现 1000 倍效率提升。同时推出 SubQ Code 编码代理和 SubQ Research 深度研究工具。研究人员要求独立验证。
SubQ亚二次复杂度注意力机制1200万token上下文
大模型 5月6日
GLM-5V-Turbo:智谱首个多模态 Coding 基座模型
智谱发布 GLM-5V-Turbo,面向视觉编程任务的原生多模态基座模型。能原生处理图片、视频、文本等多模态输入,擅长长程规划、复杂编程和动作执行,深度适配 Agent 工作流,可与工具和 API 无缝集成。论文已在 arXiv 发布,HN 获得 120 分。
GLM-5V智谱多模态CodingAgent
大模型 5月6日
百万上下文之后,拼什么?DeepSeek V4 长上下文能力再分析
36Kr 深度文章分析 DeepSeek V4 的核心竞争力。文章指出百万 token 上下文已不再是唯一竞争维度,模型在 Agent 能力、世界知识和推理性能上的全面提升才是关键。V4 在多项指标上直逼世界顶尖闭源模型。
DeepSeek V4长上下文百万tokenAgent开源
大模型 5月6日
谷歌 Gemma 4 深度评测:最强端侧模型
36Kr 发布 Gemma 4 深度评测,称其为目前最强端侧模型。评测指出其"不完美"但已适合手机部署,在多项端侧基准测试中领先。配合新发布的 MTP Drafter,推理效率进一步提升。
Gemma 4谷歌端侧模型评测开源
大模型 5月6日
豆包付费化:AI 到底会长成一门什么生意
36Kr 文章讨论字节跳动豆包大模型的商业化路径。国内 AI 终于走到不能只谈用户、得谈赚钱的阶段。豆包付费化标志着国产大模型从免费获客向商业化变现的关键转折。
豆包字节跳动商业化付费国产大模型
大模型 5月5日
Three Inverse Laws of AI
一篇探讨 AI"逆向定律"的文章引发广泛讨论,提出三条与传统机器人定律相对的 AI 行为准则。HN 获得 372 分、252 条评论,成为当日最热讨论之一。
AI定律机器人定律伦理HN讨论
⚙️ 训练推理 6 条
训练推理 5月6日
Reflex 基准测试:Computer Use 比 Structured API 贵 45 倍
Reflex 发布基准测试,对比 Computer Use 和自动生成的 API 端点在同一个管理面板上的表现。结果显示 Computer Use 需要 53 步和 55.1 万 token,而 Structured API 仅需 8 次调用和 1.2 万 token,成本差距达 45 倍。HN 325 分引发 AI Agent 经济学大讨论。
Computer UseStructured API成本Agent基准测试
训练推理 5月6日
IBM Think 2026:发布 AI 运营模型蓝图
IBM 在年度 Think 大会上发布企业 AI 运营模型蓝图,推出下一代 watsonx Orchestrate、IBM Bob、Confluent 集成和 Sovereign Core。IBM CEO 称 AI 分化正在加剧,企业需从实验阶段转向规模化部署。CRN 报道重点涵盖 Agentic AI 和主权云战略。
IBMThink 2026watsonx企业AIAgentic
训练推理 5月6日
local-deep-research:本地深度研究工具,SimpleQA 95% 准确率
LearningCircuit 开源 local-deep-research,支持 10+ 搜索引擎(arXiv、PubMed 等),在 SimpleQA 基准上达到约 95% 准确率。为本地化 AI 研究提供了可离线运行的开源方案,获 +197 GitHub stars。
local-deep-researchSimpleQA离线研究开源
训练推理 5月6日
TabPFN:表格数据基础模型单日 +57 stars
Prior Labs 的 TabPFN 模型在 GitHub 获得关注,作为专攻表格数据的 foundation model,在分类和回归任务上以极低推理成本超越传统 ML 方法。该项目已被 SAP 以 $11.6 亿收购,开源版本持续维护。
TabPFN表格数据foundation modelPrior Labs开源
训练推理 5月5日
自学习 AI 公司 Recursive 获 $5 亿融资,估值 $40 亿
36Kr 报道自学习 AI 公司 Recursive 获谷歌、英伟达 5 亿美元融资,估值达 40 亿美元。公司由 DeepMind、OpenAI 和 Salesforce 前研究员创立,目标构建能自动化整个 AI 开发流程的自改进系统。
Recursive$5亿$40亿GoogleNvidia自学习AI
🤖 Agent 7 条
Agent 5月6日
Ruflo 持续霸榜:Claude Agent 编排平台,单日 +2432 stars
Ruflo 以单日 +2432 stars 再次位居 GitHub Trending 前列。这是一个领先的多智能体编排平台,支持自主工作流、RAG 集成和 Claude Code/Codex 原生集成,累计已获 4.3 万 stars。
RufloClaude编排GitHub Trending多智能体
Agent 5月6日
andrej-karpathy-skills:单文件 CLAUDE.md 改善 Claude Code 行为
开发者基于 Andrej Karpathy 的 LLM 编码观察经验,创建单文件 CLAUDE.md 配置,显著改善 Claude Code 的编程行为。项目获得 +2409 stars 登顶 GitHub Trending,反映出社区对 coding agent 行为优化的强烈需求。
CLAUDE.mdClaude CodeKarpathyGitHub配置
Agent 5月6日
Anthropic 发布金融和保险行业 Agent 方案
Anthropic 官方发布金融服务业和保险业的 Agent 应用方案,详细介绍了 Claude 在金融场景中的最佳实践和部署指南。HN 207 分、157 条评论,标志 Anthropic 加速垂直行业渗透。
Anthropic金融Agent保险Claude垂直行业
Agent 5月6日
agency-agents:完整 AI Agency 工具集,单日 +1218 stars
msitarzewski 开源 agency-agents,涵盖前端、社区、内容等多类专业 Agent 的完整工具集。单日获 +1218 stars,累计 9.3 万 stars,反映 AI Agency 生态的持续爆发。
agency-agentsAI Agency工具集GitHub开源
Agent 5月6日
CopilotKit 完成 2700 万美元融资
CopilotKit 完成 2700 万美元融资,帮助开发者在应用中原生部署 AI 智能体。该平台提供嵌入式 AI 助手的完整解决方案,降低应用集成 AI Agent 的门槛。
CopilotKit$2700万融资AI Agent应用
Agent 5月6日
dexter:用于深度金融研究的自主 Agent,单日 +659 stars
virattt 开源 dexter,一个利用多智能体 LLM 系统进行深度金融研究的自主 Agent。项目单日获 +659 stars 登上 GitHub Trending,金融 Agent 赛道持续火热。
dexter金融多智能体GitHub研究
🔧 基础设施 5 条
基础设施 5月6日
Telus 用 AI 改变客服代表口音引发争议
加拿大电信巨头 Telus 使用 AI 技术改变呼叫中心客服人员的口音,HN 12 分但引发关于 AI 在职场伦理应用的讨论。这项技术可能用于消除语言障碍,但也引发了文化身份认同方面的担忧。
TelusAI口音客服职场伦理HN
基础设施 5月6日
context-mode:AI 编码 Agent 上下文窗口优化工具
mksglu 开源 context-mode,通过优化上下文窗口减少 98% 的工具输出,支持 14 个平台。该项目获 +276 stars,为解决编码 Agent 的上下文窗口瓶颈提供了实用方案。
context-mode上下文优化编码Agent工具
基础设施 5月6日
cocoindex:面向长周期 Agent 的增量计算引擎
cocoindex-io 开源 cocoindex,一个面向长周期 Agent 的增量计算引擎。项目获 +438 stars,解决 Agent 在长期运行中数据索引和计算的效率问题。
cocoindex增量计算Agent索引引擎
基础设施 5月6日
awesome-ai-apps:AI 应用案例合集单日 +211 stars
Arindam200 维护的 awesome-ai-apps 收录 RAG、Agent、工作流等各类 AI 应用案例,累计 1.1 万 stars。单日 +211 stars 反映开发者对 AI 应用参考合集的持续需求。
awesome-ai-appsRAGAgent案例GitHub
🦾 机器人 5 条
机器人 5月6日
哈工大团队造"夸父"人形机器人,冲刺 IPO
36Kr 报道,90 后哈工大团队打造的人形机器人"夸父"正在冲刺 IPO。该团队在具身智能领域深耕多年,"夸父"机器人在运动控制和场景适配方面表现突出。
夸父人形机器人哈工大IPO具身智能
机器人 5月5日
日本航空在羽田机场试用人形机器人
CNBC 报道,日本航空在东京羽田机场启动人形机器人地面服务试验,应对长期劳动力短缺和人口老龄化挑战。
日本航空羽田机场人形机器人劳动力日本
机器人 5月5日
Meta 收购 Assured Robot Intelligence 加强人形 AI 布局
TechCrunch 报道 Meta 收购机器人初创公司 Assured Robot Intelligence(ARI),以"加强其在人形 AI 领域的雄心"。ARI 专注为机器人打造 AI 模型,此次收购标志着 Meta 从元宇宙转向具身智能赛道。
MetaARI机器人收购具身智能
机器人 5月5日
Realbotix 更新 AI 人形机器人交付进展
Realbotix 公布 AI 人形机器人的最新交付计划更新,公司正在推进人形机器人在商业场景的部署。作为 TSX-V 上市公司,Realbotix 定位于人机交互和社交陪伴场景。
Realbotix人形机器人交付商业TSX
🎨 多模态 5 条
多模态 5月6日
Apple 计划让 iOS 27 支持用户自选 AI 模型
TechCrunch 报道 Apple 计划让 iOS 27 成为"Choose Your Own Adventure"式的 AI 平台,用户可自由选择不同 AI 模型。同时 iOS 27 钱包应用新增"Create a Pass"按钮,HN 383 分引发热议。
AppleiOS 27AI模型自选钱包
多模态 5月6日
生物计算:被忽视的技术前沿
一篇题为"I'm scared about biological computing"的文章在 HN 获得 152 分、134 条评论。文章讨论了生物计算领域的快速进展及其潜在的不可逆影响,引发了关于 DNA 存储、生物传感器和湿件计算的深入讨论。
生物计算DNA存储湿件HN前沿
多模态 5月5日
Z-Anime:基于 Z-Image Base 的动漫风格全微调模型
基于 Alibaba Z-Image Base 架构的全微调模型,专为动漫风格图像生成设计。采用 S3-DiT 架构,60 亿参数,强调丰富多样性和强可控性,支持完整负面提示。GitHub 热度持续攀升。
Z-Anime动漫Z-ImageS3-DiT图像生成
多模态 5月5日
SenseNova-U1:无 VAE、无 diffusion 的原生多模态
原生支持多模态生成与理解,无需 VAE 或 diffusion。通过直接处理语义内容,擅长生成信息图和标注图。支持带推理的图像编辑和交错文本-图像生成,8B 参数,Apache 2.0 许可证。
SenseNova-U1多模态无VAE8B开源
💰 投融资 5 条
投融资 5月6日
Altara 获得 700 万美元融资
Altara 获得 700 万美元融资,旨在弥合正在拖慢物理科学发展的数据缺口。TechCrunch 报道该公司专注于科学数据基础设施,帮助物理科学研究者更好地获取和处理实验数据。
Altara$700万物理科学数据融资
投融资 5月6日
CopilotKit 完成 2700 万美元融资
CopilotKit 完成新一轮融资,帮助开发者在应用中原生部署 AI 智能体。平台提供嵌入式 AI 助手的完整解决方案,降低应用集成 AI Agent 的门槛。
CopilotKit$2700万融资AI Agent开发
投融资 5月5日
Recursive Superintelligence 获 $5 亿融资,估值 $40 亿
成立仅 4-6 个月的伦敦 AI 实验室 Recursive Superintelligence 完成 5 亿美元融资,由 GV 和 Nvidia 领投,估值 40 亿美元。公司由 DeepMind、OpenAI 前研究员创立,目标是构建能完全自动化前沿 AI 开发流程的自改进系统。
Recursive$5亿$40亿GVNvidia自改进
投融资 5月6日
谷歌、英伟达押注 Recursive:自学习 AI 估值 40 亿美元
36Kr 报道 Recursive 获谷歌、英伟达战略投资,估值达 40 亿美元。公司核心愿景是让 AI 自动化科学研究全流程,从假说生成到实验设计再到论文撰写。
Recursive谷歌英伟达$40亿自学习
🌐 行业 7 条
行业 5月6日
Zuckerberg 被"亲自授权"Meta 版权侵权
Variety 报道,多家出版商提起诉讼指控 Meta CEO Zuckerberg"亲自授权和鼓励"公司版权侵权行为。HN 272 分、244 条评论,涉及 AI 训练数据版权这一核心争议。
ZuckerbergMeta版权诉讼AI训练
行业 5月6日
.de 域名因 DNSSEC 问题疑似全面离线
德国国家顶级域名 .de 出现 DNSSEC 相关故障,疑似导致全面离线。HN 545 分、62 条评论,成为当日热度最高的技术事件。事件影响德国所有 .de 域名网站的可访问性。
.de域名DNSSEC离线德国HN
行业 5月6日
计算机科学专业第三次大衰退?AI 冲击加剧
36Kr 文章讨论计算机科学专业遇冷现象,AI 冲击与竞争加剧是主因。文章分析了 CS 专业招生和就业市场的结构性变化,以及 AI 编程工具对传统 CS 教育的挑战。
CS专业AI冲击教育就业36Kr
行业 5月6日
AI 内容农场泛滥:靠生产垃圾信息赚百万
36Kr 报道 AI 内容农场现象,部分从业者利用生成式 AI 大规模生产低质内容获取流量收益,信息垃圾正在严重污染互联网内容生态。
AI内容农场垃圾信息互联网内容质量36Kr
行业 5月6日
local-deep-research:本地深度研究工具,SimpleQA 95% 准确率
LearningCircuit 开源 local-deep-research,支持 10+ 搜索引擎(arXiv、PubMed 等),在 SimpleQA 基准上达到约 95% 准确率。单日获 +197 stars,为本地化 AI 研究提供了开源方案。
local-deep-researchSimpleQA开源研究GitHub
行业 5月6日
iOS 27 新增"Create a Pass"按钮到 Apple Wallet
iOS 27 的 Apple Wallet 应用被发现新增"Create a Pass"按钮,允许用户更方便地创建数字通行证。HN 383 分、292 条评论,虽然不直接涉及 AI,但与 Apple 的 AI 战略和平台开放密切相关。
iOS 27Apple Wallet数字通行证AppleHN