当Token飙到天文数字，高通用「计算连续体」重搭智能体新基建

这几天，全球科技圈的目光投向了 COMPUTEX。

昨天是 COMPUTEX 正式开始的第一天，英伟达、高通的重磅主题演讲激起了行业的热烈讨论。

英伟达创始人黄仁勋又一次强调 AI Agent 是未来重点发力方向，专为智能体打造的 CPU 也正式发布；而高通 CEO 安蒙在《智能体之年》（Year of the Agents）的主题演讲中，释放出了一个清晰的信号：其正在为已经开启的智能体 AI 时代铺设底层硬件和系统基建。

作为 2026 上半年 AI 领域绕不开的关键词，智能体再次成为 COMPUTEX 上科技巨头叙事的中心。此次，这条主线进一步落到了 AI 硬件和基础设施层面。从 AI PC、机器人到数据中心，各家掀起了一场关于智能体算力、连接与终端部署的竞逐。

如今，智能体已经率先在手机、PC 端开始落地。相比之下，机器人、可穿戴、XR 设备、车载、边缘等其他硬件虽然想象空间同样很大，但受限于硬件成本、场景复杂度和生态成熟度，离真正大规模部署仍有很大的距离。

如何让智能体进入更多终端成为此次安蒙演讲的重点。

对于高通这样的硬件厂商，这已经不单单是把 AI 塞进更多设备的问题了，更多考验的是把芯片、连接、系统软件和生态能力组织起来，提供一套能支撑起智能体长时间运行、低功耗响应、跨终端协同的基建。

高通给出了自己的战略选择：用「计算连续体」（Compute Continuum）把包括可穿戴、手机、PC、汽车、机器人、边缘设备和数据中心在内不同层级的计算节点连接起来，让智能体根据任务需求运行在最合适的位置上。

按照这一逻辑，未来实时交互和隐私敏感任务更多地留在端侧，现场化、低延迟任务交给边缘设备，更复杂的大规模推理则由数据中心承担。

通过这场演讲，安蒙真正想讲清楚的是，智能体走向更广阔的现实世界所需要的新型基础设施：从个性化体验到大规模推理，从端侧能效到云端算力，高通希望借助「计算连续体」把所有必要的能力串起来。

为什么智能体 AI 时代需要「新基建」？

安蒙在演讲开始抛出了一个关键判断：今天的设备并不是为智能体体验设计的。手机、PC、操作系统和应用，长期以来都是围绕人类主动操作构建的。

不过，随着智能体成为大模型应用的主要形态，它会持续运行、保留上下文、主动规划、多步执行，还可能在后台调用多个服务。这就带来了一系列新的系统要求：

首先，设备需要常驻智能。

大家回忆一下以前是怎么用 AI 的：打开对话框，提问，等待回答，最后关掉。人是发起者，AI 是应答者，一切围绕单次交互进行。智能体的出现改变了这套逻辑，它们要在后台持续运行，理解日程、任务、环境、位置、设备状态等上下文，并针对实时指令进行反馈。这些对本地传感器、低功耗计算和隐私保护提出了更高要求。

其次，端云需要协同。

智能体执行任务时，不可能所有计算都放在云端，也不可能全部塞进终端设备。安蒙想要的不是简单的「端侧 AI」或「云端 AI」二选一，应该遵循分布式部署逻辑：任务根据时延、功耗、隐私、成本，在设备、边缘和云之间动态路由。

最后，设备需要更强的异构计算。

智能体并不是跑一次模型、给一个答案就结束了，它要持续理解用户意图，拆解任务，调用工具，处理上下文，还要判断哪些计算留在本地，哪些交给边缘或云端。任务越复杂，设备内部的计算分工也就越重要。

这正是安蒙特别强调 CPU、NPU 和 GPU 配合的原因。CPU 不仅负责通用计算，也要承担任务编排和系统调度；NPU 和 GPU 则负责在本地高效运行模型，处理语音、图像、感知和部分推理任务。

基于上述判断，安蒙认为，智能体走向下一阶段，关键在于能否真正进入设备，并在真实任务中稳定高效地跑起来。高通给出的答案是：计算连续体。对于未来的智能体，一套串起终端、边缘和云端的分布式部署体系成为必选项。

用计算连续体，拼出新基建版图

用一句话总结，计算连续体可以理解为「一套横跨个人终端、边缘设备和数据中心的 AI 计算体系」。更具体来讲，高通的能力已经覆盖从毫瓦级的个人音频设备，一路到到千瓦级的数据中心系统。

先来讲个人终端，这是智能体最贴近用户的地方。

安蒙反复强调的一点是，智能体正在取代传统的应用程序和操作系统，成为用户数字体验的新中心。换句话说，用户不一定总是主动打开某个应用，取而代之的是由智能体在不同设备之间理解场景、接手任务。

手机、PC、AI 眼镜、可穿戴设备将从单独的硬件入口变成智能体连接人的端点。高通在这些领域的布局早已经铺开了。

在手机侧，第五代骁龙 8 至尊版强化个性化端侧 AI，承担更多本地推理、上下文感知和即时交互任务；在 PC 侧，骁龙 X2 Elite 系列面向 Windows AI PC，承接更多长时间、多窗口、多工具的智能体任务；AI 眼镜和可穿戴设备将智能体推到更贴近人的位置，可穿戴平台骁龙 Wear Elite 支持最大 20 亿参数 AI 模型的端侧运行，为健康、运动、生活记录、语音交互和主动提醒等持续场景提供更佳体验。

接下来是边缘与物理世界。

智能体不只存在于手机、PC 等个人终端，汽车、机器人、工业设备同样是智能体进入物理世界的重要端点。比如在机器人侧，高通这次值得关注的是首次亮相的跃龙 IQ10 RRD 全栈机器人参考设计。

先来看一波参数，它基于跃龙 IQ10 处理器，最高可提供 700 TOPS AI 算力，配备 18 个 Oryon CPU 核心、多核 NPU 和 GPU，目标是在机器人本地完成感知、规划和推理。

不同于简单地给机器人厂商一颗芯片，高通是把高性能计算、多传感器接入、网络连接、实时控制和机器人软件栈放到了一套参考系统里，让厂商少做底层适配和系统拼接，把更多精力放在感知、导航、操作和任务执行本身。对于高通自身而言，这也是其把移动端 AI 积累迁移到物理世界的关键一步。

而数据中心补上了计算连续体的最后一块拼图。

安蒙官宣了全新数据中心业务品牌高通飞龙（Dragonfly），并表示公司已经在与超大规模云服务商和全球合作伙伴推进实际部署。更多路线图会在本月底的投资者日上公布。随着它的推出，高通的分布式部署版图也从端侧补齐到了云端，使「计算连续体」叙事更加完整。

最后还有被低估的协调层。

多数人讨论 AI 时只看算力，忽视连接。但智能体的本质是协作，多个智能体之间需要低延迟、高可靠的通信来保持协调。在这方面，高通正致力于推进 AI 原生的 6G。

在安蒙看来，6G 具有三根支柱：连接、分布式计算和感知。这个表述很关键，它意味着 6G 不再只是把数据从一个地方传到另一个地方，它成为了未来分布式 AI 系统的一部分。在智能体 AI 时代，网络角色发生了变化：它不仅负责连接设备，也帮助设备协同计算，甚至参与对物理世界的感知。

智能体越普及，越需要一套能把设备、边缘、云端和网络组织起来的基础设施。6G 在其中承担的，除了「连得更快」，也要「让计算被更合理地分配」。

以上构成了高通计算连续体的完整版图。智能体越往后发展，竞争越不会只停留在某一颗芯片、某一个终端，端、边、云、网的配合愈加重要。高通要讲清楚的正在于此：用一套横跨全场景的分布式部署体系，承接智能体 AI 时代不断增长的感知、推理和执行需求。

TCO（总拥有成本），成为新的胜负手

智能体带来的变化，不只是交互方式变了，背后的成本结构也在变。智能体的运行方式意味着它消耗 token 的速度明显加快。

安蒙提到，从单轮对话，到多轮推理，再到多步骤智能体任务，token 消耗呈数量级上升。一个复杂的智能体工作流，可能就得百万 token 。「到 2030 年，token 总消耗量将达到惊人的 4.0148×10^18。」

这背后对应的是一个非常现实的问题：如果所有任务交给云端完成，成本、延迟、隐私和能耗迅速变成压力。对个人用户来说，体验可能变慢；对企业来说，成本会变高；对机器人、汽车和工业设备来说，很多任务不能等云端来回响应。

所以，高通强调分布式部署是在回答一个实际的问题：什么任务留在设备本地，什么任务交给边缘节点，什么任务值得送到云端。

这正是计算连续体的商业价值所在：能在本地完成的就减少云端调用，需要低延迟的就靠近现场处理，真正复杂的大模型推理才交给数据中心。

安蒙在演讲中举了两个例子：在 Claude Code 的一次真实任务中，规划器把部分计算留在本地，只把必要内容交给云端处理，最后在结果不变的情况下少用了约 140 万 token，成本下降 60%。

在另一个网页生成 demo 里，任务同样在端侧和云端之间分配，token 用量减少 30%，成本降到原来的四分之一。

对于高通而言，过去在移动设备上长期解决的是同一个问题：如何在有限的电池、散热和体积里尽可能释放更多算力。到了智能体 AI 时代，每瓦特性能的提升将变成端边云协同的成本优势。

分布式部署，高通有哪些优势？

在 Computex 2026 舞台上，谈智能体的不只有高通。英伟达、联发科、英特尔也在围绕智能体做文章。问题在于，同样是押注智能体，为什么高通更强调计算连续体？它的优势在哪里？

我们可以总结为以下几点：

一是，覆盖海量终端的生态入口。

智能体最终要进入用户每天使用的手机、PC，也要进入汽车、工业设备和更多边缘场景。高通的优势很明显，智能手机是其传统主场，PC 是近几年明显加速的方向，汽车业务已经有比较深的积累，机器人和工业设备是它往外扩的新空间。

因此，高通并不是突然开始讲智能体。更准确地说，它是在把过去几年积累下来的移动计算、连接、汽车和边缘计算能力，重新放到智能体这个新框架中。

二是，CPU、GPU、NPU、传感器和连接能力的系统集成。

智能体落到真实设备里，不只看 CPU、GPU、NPU 强不强，还要看这些计算单元能不能与传感器、连接、系统软件配合起来。

这同样是高通过去长期积累的地方，它围绕 SoC、通信、传感器接口、软件栈和生态伙伴，构建起了一整套面向不同终端设备的平台能力。安蒙在演讲中反复提到端边云协同，本质上也是在强调这种系统级能力。

三是，多元化业务护城河，从个人计算到物理 AI。

智能体正在把设备之间的边界重新打开。对高通来说，这意味着 AI 的机会不再只围绕个人计算设备展开，会依托计算连续体延伸到更广阔的真实世界。

汽车是一个典型的例子。过去几年，高通在智能座舱、辅助驾驶、车载连接和边缘计算上持续投入。这些能力放到智能体 AI 时代，正好可以转化为车内交互、道路感知和本地决策的一部分。机器人和工业设备也是类似逻辑，它们都需要本地计算、传感器接入、稳定连接和长期运行能力，这些恰恰是高通一直在补的拼图。

本质上来说，高通在汽车、机器人和工业领域的布局，是在提前占据智能体进入物理世界的更多关键入口。

从卖芯片，到铺智能体底座

我们把前面的线索串起来会发现，高通在 Computex 2026 上不只是分别在 PC、机器人或数据中心方向寻找新增量。更深层次的变化在于：它在用「计算连续体」把这些看似分散的业务，重新组织到同一套叙事里。

过去外界理解高通，首先想到的是芯片和通信。它为手机、PC、汽车等硬件设备提供计算与连接平台，这是高通最熟悉的位置。如今，智能体 AI 的出现改变了这一传统分工，它们的能力释放与运行模式天然需要跨设备协同。

这时，单颗芯片的性能已经不是唯一问题。企业、开发者和设备厂商有了更关心的目标，比如智能体在不同设备间的稳定运行，智能体在端侧、边缘和云端之间的顺畅接力等。

在这种变化下，高通的价值也必须往上走。领先的芯片能力仍是底座，但需要和软件栈、参考设计、开发工具、连接能力以及端边云部署方案放在一起看。这样的系统化升级要求高通重新定义自己，计算连续体的意义正在于此。

在这个过程中，高通想要强调的优势变得更加清楚：低功耗计算、连接能力、终端生态，以及正在补齐的边缘和数据中心能力。高通想争取的不仅仅是更大的芯片市场份额，更要成为智能体 AI 落地进程中底层计算和连接体系的关键支撑者。

这对应了 AI 产业竞争重心的变化。未来的竞争不会只在模型参数上，也不会只围绕某一个入口展开。智能体全面进入日常生活、企业生产和更广阔的物理世界，必须运行在一张更复杂的计算网络里。设备、边缘、云、连接、软件和生态，每一层都决定着它们能否真正落地。

高通现在做的，就是把自己从这张网络里的芯片供应商，升级为「系统级 AI 基础设施提供者」。这不同于简单的业务边界扩张，是高通对自身在 AI 产业链中的位置进行了一次重塑。

当Token飙到天文数字，高通用「计算连续体」重搭智能体新基建

热门标签