对 AI 的一些思考

从概念到应用

从 AI 概念被提出，到如今进入大规模应用，已经过去了很多年。它从早期不被看好的“天方夜谭”，逐渐变成了今天几乎人手可用的效率工具。

Agent 视角下的组成结构

目前市面上的许多 AI 产品，本质上都可以理解为一种 agent。中文里常译作“智能体”或“代理体”，其核心通常是大模型，充当类似“神经中枢”的角色；而各种 tools 则作为特定能力的补充与扩展；至于近来出现的 skills 概念，则更像是面向特定领域的经验、流程或知识强化。

如果剖析一个 agent，可以发现：MCP tools 与 skills 都更像是外围组件。它们往往按需加载、按需调用，用来处理特定场景下的问题。真正处于核心地位的仍然是大模型。大模型负责根据输入生成输出，并在必要时决定是否借助 skills 与 MCP tools 来辅助完成任务。

MCP tools 本质上与普通的输入输出函数并没有根本区别，只是经过了一套标准化封装后，能够被 agent 感知、理解并调用。至于 skills，它更像是一类可供参考的外部知识或操作指南，agent 只会在需要时读取和使用。从这个角度看，制作 skills 与 MCP tools 相对容易，而训练一个真正可用的大模型则复杂得多。

从黑盒角度理解 LLM

如果给大模型套上一层“黑盒”，只观察它的输入与输出，那么以 LLM，也就是大语言模型为例，它的输入是自然语言，输出通常也是自然语言。于是很多人会产生一种直觉：黑盒内部似乎像是“一个人在思考”。这种直觉并非毫无来由，因为 LLM 的底层确实建立在受神经网络启发的结构之上。

当然，如果不深入研究 LLM 内部复杂的层级结构与参数机制，我们可以粗略地把它理解为一种基于上下文进行下一步预测的高维映射系统。它和马尔可夫链有某种相似性，但又远比经典马尔可夫链复杂，不能简单等同。

与马尔可夫链的相似与差异

马尔可夫链强调的是：系统在下一个时刻的状态，只依赖当前状态，而与更早的历史无关。进一步抽象后，可以得到状态转移概率的描述方式。LLM 在表面上确实也有一点类似特征：它每次生成下一个 token 时，都是基于当前可见的上下文来计算概率分布，然后选出下一个输出。

但 LLM 与经典马尔可夫链的关键区别在于：它的“当前状态”并不是一个简单、低维、可直接写成显式矩阵的状态，而是由整个上下文经过高维表示后形成的内部表征。也就是说，LLM 并不是在做一个简单的“前一个词决定后一个词”的一阶状态转移，而是在对整段上下文进行编码后，再预测下一个 token。因此，说它“类似于马尔可夫过程的某种高阶、隐式推广”会更准确一些。

“预测下一个 token”并非简单查表

既然 LLM 的核心是“根据上下文预测下一个 token”，那么它内部必然存在某种对语言分布的建模机制。但这并不意味着它真的拥有一个可以直接写出来的“转移矩阵”，更不是简单的“查表匹配”。训练大模型所需要的海量数据，本质上是在塑造参数空间中的统计规律，使模型学会在极高维的表示空间中逼近语言、知识与推理模式之间的关联。显卡长时间训练的，也正是这些参数。

因此，把 LLM 简单说成“预测下一个词的查表器”其实并不准确。更准确的说法是：它是一个参数规模极大、表示能力极强的概率模型，能够在压缩海量语料统计规律的基础上，生成具有连贯性、结构性，甚至一定推理性的输出。

能力边界与外接模块

综上所述，就目前来看，大模型的能力已经在很多局部任务上超过了绝大多数个体人类，但它依然没有超出整个人类文明所提供的知识、语言与推理边界。换句话说，大模型的上限，至少目前仍然受制于人类文明整体的知识供给、训练范式与架构设计。而 skills 与 MCP tools 对大模型来说，更像是“外接能力模块”，它们确实能增强模型的实用性，但并不直接决定模型本身的智能上限。

工具革命与未来风险

乐观地看，AI 的出现和历史上的发动机、汽车、电力一样，首先是一场生产工具的革新，而不是人类文明的立即崩塌。它会重塑分工，重塑效率，也重塑很多行业对“能力”的定义。

但另一种可能也不能完全排除：如果未来某种 AI 真的能够达到更接近人类的自主思考能力，不再只是基于统计规律进行预测，而是形成更强的自我建模、目标维持与逻辑演化能力，那么它带来的影响就不会只是“更强的工具”这么简单。那时，人类可能迎来前所未有的解放，也可能面临前所未有的风险。

Agent 热潮背后的瓶颈

至于最近市面上的 agent 热潮，看起来像是所有人都在忙着研发属于自己的“超级入口”或“超级助手”。但说到底，它们大多仍然是 agent：只是外围的 skills、更丰富的 tools，以及工作流编排能力变得更强了而已。从这个角度看，agent 更像是应用层的工程产物；真正的瓶颈，仍然是大模型本身的能力边界。

也正因为如此，如果有一天真的出现了近乎“无所不知、无所不能”的大模型，那么那一天被淘汰的，未必只是旧的应用层框架，甚至连今天理解大模型的这套方法论本身，都可能已经过时了。

结语

AI 的潮流大概率不会停止。抵触 AI，某种程度上就像一边享受工业文明带来的便利，一边试图否定电力本身。行业并没有完蛋，只是我们必须用更新的方式去理解它、适应它，并重新定义人在其中的位置。

Shetty's Blog