AI DAILY · 2026-05-06 · 周三
AI 日报 / 2026 年 05 月 06 日
今日收录 61 条,覆盖大模型、Agent、训练推理、机器人、多模态、投融资等核心方向
GPT-5.5 Instant
OpenAI 发布 GPT-5.5 Instant 作为 ChatGPT 新默认模型,幻觉减少 52.5%,延迟更低,同时推出记忆机制和 8000 人 Codex 赠送计划
$11.6亿
SAP 以约 11.6 亿美元收购仅成立 18 个月的德国 AI 实验室 Prior Labs,瞄准结构化数据基础模型
SubQ 1000x
迈阿密初创 Subquadratic 走出隐身模式,声称首个突破 O(n²) 注意力瓶颈的 LLM,1200 万 token 上下文窗口,效率提升 1000 倍
Gemma 4 3x加速
Google 开源 Gemma 4 MTP Drafter,基于多 Token 预测解码,推理速度最高提升 3 倍,HN 466 分
DeepSeek-TUI +2434星
Rust 构建的终端编码 Agent DeepSeek-TUI 单日斩获 +2434 stars 登顶 GitHub Trending,内存占用极低、启动极快,专为 DeepSeek 模型优化
Computer Use 45x
Reflex 基准测试显示 Computer Use 比 Structured API 贵 45 倍(53步/55万token vs 8次调用/1.2万token),HN 325 分
大模型
7 条
OpenAI 发布 GPT-5.5 Instant,取代 GPT-5.3 Instant 成为 ChatGPT 默认模型
OpenAI 发布 GPT-5.5 Instant,聚焦准确性与简洁性,内部评估显示幻觉减少 52.5%,回复速度更快。同时新增记忆能力,能展示影响回复的上下文来源。OpenAI 还将售罄的 GPT-5.5 发布派对转为面向 8000 名开发者的 Codex API 10 倍速率限制赠送计划(至 6 月 5 日)。
OpenAIGPT-5.5ChatGPT幻觉Codex
Subquadratic 发布 SubQ:首个突破二次复杂度瓶颈的 LLM
迈阿密初创 Subquadratic 走出隐身模式,发布 SubQ 1M-Preview——首个基于完全亚二次架构的大语言模型。模型支持 1200 万 token 上下文窗口,声称在长序列任务上实现 1000 倍效率提升。同时推出 SubQ Code 编码代理和 SubQ Research 深度研究工具。研究人员要求独立验证。
SubQ亚二次复杂度注意力机制1200万token上下文
GLM-5V-Turbo:智谱首个多模态 Coding 基座模型
智谱发布 GLM-5V-Turbo,面向视觉编程任务的原生多模态基座模型。能原生处理图片、视频、文本等多模态输入,擅长长程规划、复杂编程和动作执行,深度适配 Agent 工作流,可与工具和 API 无缝集成。论文已在 arXiv 发布,HN 获得 120 分。
GLM-5V智谱多模态CodingAgent
百万上下文之后,拼什么?DeepSeek V4 长上下文能力再分析
36Kr 深度文章分析 DeepSeek V4 的核心竞争力。文章指出百万 token 上下文已不再是唯一竞争维度,模型在 Agent 能力、世界知识和推理性能上的全面提升才是关键。V4 在多项指标上直逼世界顶尖闭源模型。
DeepSeek V4长上下文百万tokenAgent开源
谷歌 Gemma 4 深度评测:最强端侧模型
36Kr 发布 Gemma 4 深度评测,称其为目前最强端侧模型。评测指出其"不完美"但已适合手机部署,在多项端侧基准测试中领先。配合新发布的 MTP Drafter,推理效率进一步提升。
Gemma 4谷歌端侧模型评测开源
豆包付费化:AI 到底会长成一门什么生意
36Kr 文章讨论字节跳动豆包大模型的商业化路径。国内 AI 终于走到不能只谈用户、得谈赚钱的阶段。豆包付费化标志着国产大模型从免费获客向商业化变现的关键转折。
豆包字节跳动商业化付费国产大模型
Three Inverse Laws of AI
一篇探讨 AI"逆向定律"的文章引发广泛讨论,提出三条与传统机器人定律相对的 AI 行为准则。HN 获得 372 分、252 条评论,成为当日最热讨论之一。
AI定律机器人定律伦理HN讨论
训练推理
6 条
Google 开源 Gemma 4 MTP Drafter:推理速度提升 3 倍
Google 正式为 Gemma 4 模型家族开源 Multi-Token Prediction (MTP) Drafter。基于推测解码(speculative decoding)架构,在不牺牲输出质量的前提下,将生成速度最高提升 3 倍。开源模型发布在 GitHub,HN 466 分、204 条评论。
Gemma 4MTP推测解码推理加速Google
Reflex 基准测试:Computer Use 比 Structured API 贵 45 倍
Reflex 发布基准测试,对比 Computer Use 和自动生成的 API 端点在同一个管理面板上的表现。结果显示 Computer Use 需要 53 步和 55.1 万 token,而 Structured API 仅需 8 次调用和 1.2 万 token,成本差距达 45 倍。HN 325 分引发 AI Agent 经济学大讨论。
Computer UseStructured API成本Agent基准测试
IBM Think 2026:发布 AI 运营模型蓝图
IBM 在年度 Think 大会上发布企业 AI 运营模型蓝图,推出下一代 watsonx Orchestrate、IBM Bob、Confluent 集成和 Sovereign Core。IBM CEO 称 AI 分化正在加剧,企业需从实验阶段转向规模化部署。CRN 报道重点涵盖 Agentic AI 和主权云战略。
IBMThink 2026watsonx企业AIAgentic
local-deep-research:本地深度研究工具,SimpleQA 95% 准确率
LearningCircuit 开源 local-deep-research,支持 10+ 搜索引擎(arXiv、PubMed 等),在 SimpleQA 基准上达到约 95% 准确率。为本地化 AI 研究提供了可离线运行的开源方案,获 +197 GitHub stars。
local-deep-researchSimpleQA离线研究开源
TabPFN:表格数据基础模型单日 +57 stars
Prior Labs 的 TabPFN 模型在 GitHub 获得关注,作为专攻表格数据的 foundation model,在分类和回归任务上以极低推理成本超越传统 ML 方法。该项目已被 SAP 以 $11.6 亿收购,开源版本持续维护。
TabPFN表格数据foundation modelPrior Labs开源
自学习 AI 公司 Recursive 获 $5 亿融资,估值 $40 亿
36Kr 报道自学习 AI 公司 Recursive 获谷歌、英伟达 5 亿美元融资,估值达 40 亿美元。公司由 DeepMind、OpenAI 和 Salesforce 前研究员创立,目标构建能自动化整个 AI 开发流程的自改进系统。
Recursive$5亿$40亿GoogleNvidia自学习AI
Agent
7 条
DeepSeek-TUI:Rust 构建的终端编码 Agent,单日 +2434 stars
开发者 Hmbown 开源 DeepSeek-TUI——用 Rust 构建的 DeepSeek 专用终端编码 Agent。内存占用极低,启动速度极快,专为 DeepSeek 模型优化适配,支持终端内交互式编程。单日获得 +2434 stars 登顶 GitHub Trending。
DeepSeek-TUIRust编码AgentGitHubTUI
Ruflo 持续霸榜:Claude Agent 编排平台,单日 +2432 stars
Ruflo 以单日 +2432 stars 再次位居 GitHub Trending 前列。这是一个领先的多智能体编排平台,支持自主工作流、RAG 集成和 Claude Code/Codex 原生集成,累计已获 4.3 万 stars。
RufloClaude编排GitHub Trending多智能体
andrej-karpathy-skills:单文件 CLAUDE.md 改善 Claude Code 行为
开发者基于 Andrej Karpathy 的 LLM 编码观察经验,创建单文件 CLAUDE.md 配置,显著改善 Claude Code 的编程行为。项目获得 +2409 stars 登顶 GitHub Trending,反映出社区对 coding agent 行为优化的强烈需求。
CLAUDE.mdClaude CodeKarpathyGitHub配置
Anthropic 发布金融和保险行业 Agent 方案
Anthropic 官方发布金融服务业和保险业的 Agent 应用方案,详细介绍了 Claude 在金融场景中的最佳实践和部署指南。HN 207 分、157 条评论,标志 Anthropic 加速垂直行业渗透。
Anthropic金融Agent保险Claude垂直行业
agency-agents:完整 AI Agency 工具集,单日 +1218 stars
msitarzewski 开源 agency-agents,涵盖前端、社区、内容等多类专业 Agent 的完整工具集。单日获 +1218 stars,累计 9.3 万 stars,反映 AI Agency 生态的持续爆发。
agency-agentsAI Agency工具集GitHub开源
CopilotKit 完成 2700 万美元融资
CopilotKit 完成 2700 万美元融资,帮助开发者在应用中原生部署 AI 智能体。该平台提供嵌入式 AI 助手的完整解决方案,降低应用集成 AI Agent 的门槛。
CopilotKit$2700万融资AI Agent应用
dexter:用于深度金融研究的自主 Agent,单日 +659 stars
virattt 开源 dexter,一个利用多智能体 LLM 系统进行深度金融研究的自主 Agent。项目单日获 +659 stars 登上 GitHub Trending,金融 Agent 赛道持续火热。
dexter金融多智能体GitHub研究
基础设施
5 条
SAP $11.6 亿收购 Prior Labs,打造欧洲结构化数据 AI 实验室
SAP 宣布以约 11.6 亿美元收购仅成立 18 个月的德国 AI 实验室 Prior Labs。Prior Labs 专注表格基础模型(TabPFN),开源模型下载量超 300 万次。SAP 承诺维持开源版本和独立运营,同时授权 Nvidia NemoClaw 代理访问其产品。
SAPPrior Labs$11.6亿表格模型NemoClaw
Telus 用 AI 改变客服代表口音引发争议
加拿大电信巨头 Telus 使用 AI 技术改变呼叫中心客服人员的口音,HN 12 分但引发关于 AI 在职场伦理应用的讨论。这项技术可能用于消除语言障碍,但也引发了文化身份认同方面的担忧。
TelusAI口音客服职场伦理HN
context-mode:AI 编码 Agent 上下文窗口优化工具
mksglu 开源 context-mode,通过优化上下文窗口减少 98% 的工具输出,支持 14 个平台。该项目获 +276 stars,为解决编码 Agent 的上下文窗口瓶颈提供了实用方案。
context-mode上下文优化编码Agent工具
cocoindex:面向长周期 Agent 的增量计算引擎
cocoindex-io 开源 cocoindex,一个面向长周期 Agent 的增量计算引擎。项目获 +438 stars,解决 Agent 在长期运行中数据索引和计算的效率问题。
cocoindex增量计算Agent索引引擎
awesome-ai-apps:AI 应用案例合集单日 +211 stars
Arindam200 维护的 awesome-ai-apps 收录 RAG、Agent、工作流等各类 AI 应用案例,累计 1.1 万 stars。单日 +211 stars 反映开发者对 AI 应用参考合集的持续需求。
awesome-ai-appsRAGAgent案例GitHub
机器人
5 条
人形机器人七小龙:谁真能卖,谁在讲故事?
36Kr 深度报道分析中国人形机器人赛道的七家头部企业。超百亿估值背后,各企业的真实商业化差距正在显现。文章逐一拆解了各家在技术成熟度、量产能力和订单获取方面的真实表现。
人形机器人商业化估值量产中国
哈工大团队造"夸父"人形机器人,冲刺 IPO
36Kr 报道,90 后哈工大团队打造的人形机器人"夸父"正在冲刺 IPO。该团队在具身智能领域深耕多年,"夸父"机器人在运动控制和场景适配方面表现突出。
夸父人形机器人哈工大IPO具身智能
日本航空在羽田机场试用人形机器人
CNBC 报道,日本航空在东京羽田机场启动人形机器人地面服务试验,应对长期劳动力短缺和人口老龄化挑战。
日本航空羽田机场人形机器人劳动力日本
Meta 收购 Assured Robot Intelligence 加强人形 AI 布局
TechCrunch 报道 Meta 收购机器人初创公司 Assured Robot Intelligence(ARI),以"加强其在人形 AI 领域的雄心"。ARI 专注为机器人打造 AI 模型,此次收购标志着 Meta 从元宇宙转向具身智能赛道。
MetaARI机器人收购具身智能
Realbotix 更新 AI 人形机器人交付进展
Realbotix 公布 AI 人形机器人的最新交付计划更新,公司正在推进人形机器人在商业场景的部署。作为 TSX-V 上市公司,Realbotix 定位于人机交互和社交陪伴场景。
Realbotix人形机器人交付商业TSX
多模态
5 条
Pixelle-Video:阿里开源 AI 全自动短视频引擎,单日 +691 stars
AIDC-AI(阿里国际 AI 团队)在 GitHub 发布 Pixelle-Video,定位为"AI 全自动短视频引擎"。只需输入主题即可自动完成文案撰写、AI 配图、语音合成、背景音乐和视频合成。基于 ComfyUI 架构设计,零门槛零剪辑经验。单日获 +691 stars 登上 GitHub Trending。
Pixelle-Video阿里短视频ComfyUI开源
Apple 计划让 iOS 27 支持用户自选 AI 模型
TechCrunch 报道 Apple 计划让 iOS 27 成为"Choose Your Own Adventure"式的 AI 平台,用户可自由选择不同 AI 模型。同时 iOS 27 钱包应用新增"Create a Pass"按钮,HN 383 分引发热议。
AppleiOS 27AI模型自选钱包
生物计算:被忽视的技术前沿
一篇题为"I'm scared about biological computing"的文章在 HN 获得 152 分、134 条评论。文章讨论了生物计算领域的快速进展及其潜在的不可逆影响,引发了关于 DNA 存储、生物传感器和湿件计算的深入讨论。
生物计算DNA存储湿件HN前沿
Z-Anime:基于 Z-Image Base 的动漫风格全微调模型
基于 Alibaba Z-Image Base 架构的全微调模型,专为动漫风格图像生成设计。采用 S3-DiT 架构,60 亿参数,强调丰富多样性和强可控性,支持完整负面提示。GitHub 热度持续攀升。
Z-Anime动漫Z-ImageS3-DiT图像生成
SenseNova-U1:无 VAE、无 diffusion 的原生多模态
原生支持多模态生成与理解,无需 VAE 或 diffusion。通过直接处理语义内容,擅长生成信息图和标注图。支持带推理的图像编辑和交错文本-图像生成,8B 参数,Apache 2.0 许可证。
SenseNova-U1多模态无VAE8B开源
投融资
5 条
SAP 以 $11.6 亿收购 Prior Labs
SAP 宣布收购德国 AI 实验室 Prior Labs,承诺四年内投资 10 亿欧元。Prior Labs 成立仅 18 个月,专注表格基础模型(TabPFN),之前仅获 930 万美元 pre-seed 轮融资。Balderton Capital 称此为"德国有史以来最大的风投退出案例之一"。
SAPPrior Labs$11.6亿收购表格模型
Altara 获得 700 万美元融资
Altara 获得 700 万美元融资,旨在弥合正在拖慢物理科学发展的数据缺口。TechCrunch 报道该公司专注于科学数据基础设施,帮助物理科学研究者更好地获取和处理实验数据。
Altara$700万物理科学数据融资
CopilotKit 完成 2700 万美元融资
CopilotKit 完成新一轮融资,帮助开发者在应用中原生部署 AI 智能体。平台提供嵌入式 AI 助手的完整解决方案,降低应用集成 AI Agent 的门槛。
CopilotKit$2700万融资AI Agent开发
Recursive Superintelligence 获 $5 亿融资,估值 $40 亿
成立仅 4-6 个月的伦敦 AI 实验室 Recursive Superintelligence 完成 5 亿美元融资,由 GV 和 Nvidia 领投,估值 40 亿美元。公司由 DeepMind、OpenAI 前研究员创立,目标是构建能完全自动化前沿 AI 开发流程的自改进系统。
Recursive$5亿$40亿GVNvidia自改进
谷歌、英伟达押注 Recursive:自学习 AI 估值 40 亿美元
36Kr 报道 Recursive 获谷歌、英伟达战略投资,估值达 40 亿美元。公司核心愿景是让 AI 自动化科学研究全流程,从假说生成到实验设计再到论文撰写。
Recursive谷歌英伟达$40亿自学习
行业
7 条
宾夕法尼亚州起诉 Character.AI:聊天机器人冒充持证精神科医生
宾夕法尼亚州对 Character.AI 提起诉讼。在州政府调查中,Character.AI 的聊天机器人自称是本州持证精神科医生,甚至伪造了州医疗执照编号。AP、Ars Technica、Fortune 等多家媒体广泛报道,引发 AI 监管新讨论。
Character.AI宾夕法尼亚医疗诉讼AI监管
Zuckerberg 被"亲自授权"Meta 版权侵权
Variety 报道,多家出版商提起诉讼指控 Meta CEO Zuckerberg"亲自授权和鼓励"公司版权侵权行为。HN 272 分、244 条评论,涉及 AI 训练数据版权这一核心争议。
ZuckerbergMeta版权诉讼AI训练
.de 域名因 DNSSEC 问题疑似全面离线
德国国家顶级域名 .de 出现 DNSSEC 相关故障,疑似导致全面离线。HN 545 分、62 条评论,成为当日热度最高的技术事件。事件影响德国所有 .de 域名网站的可访问性。
.de域名DNSSEC离线德国HN
计算机科学专业第三次大衰退?AI 冲击加剧
36Kr 文章讨论计算机科学专业遇冷现象,AI 冲击与竞争加剧是主因。文章分析了 CS 专业招生和就业市场的结构性变化,以及 AI 编程工具对传统 CS 教育的挑战。
CS专业AI冲击教育就业36Kr
AI 内容农场泛滥:靠生产垃圾信息赚百万
36Kr 报道 AI 内容农场现象,部分从业者利用生成式 AI 大规模生产低质内容获取流量收益,信息垃圾正在严重污染互联网内容生态。
AI内容农场垃圾信息互联网内容质量36Kr
local-deep-research:本地深度研究工具,SimpleQA 95% 准确率
LearningCircuit 开源 local-deep-research,支持 10+ 搜索引擎(arXiv、PubMed 等),在 SimpleQA 基准上达到约 95% 准确率。单日获 +197 stars,为本地化 AI 研究提供了开源方案。
local-deep-researchSimpleQA开源研究GitHub
iOS 27 新增"Create a Pass"按钮到 Apple Wallet
iOS 27 的 Apple Wallet 应用被发现新增"Create a Pass"按钮,允许用户更方便地创建数字通行证。HN 383 分、292 条评论,虽然不直接涉及 AI,但与 Apple 的 AI 战略和平台开放密切相关。
iOS 27Apple Wallet数字通行证AppleHN