ChatGPT时代：AI的未来应用生态

2025-7-1

AI 的应用生态可以大致划分为三个主要领域，尽管这是一种简化的描述：

大型语言模型
这类模型如 GPT-4 或 Chinchilla，能够处理网络或其他文本来源的内容，转化为多功能的工具，例如生成法律文件摘要、进行网络搜索或作为智能聊天助手。
图像生成
包括 Midjourney、DALL-E 和 Stable Diffusion 等模型，以及一些现代化的视频制作工具和 NeRF 3D 模型。用户可以通过输入提示生成图像，赋予创作更多灵活性。
其他领域
这一类别涵盖广泛的技术应用，例如机器人技术、自动驾驶汽车及蛋白质折叠等。尽管不同应用间存在明显差异，但因篇幅有限，本文将其简单归为一类。

在谈论“生成式人工智能”时，常常会将这些领域混淆，但实际上，每个市场都有独特的 AI 模型架构、计算和扩展需求、质量标准以及应用场景。因此，理解这些差异有助于我们预测未来的发展方向。

图像生成的影响

图像生成有潜力改变多个领域，主要包括：

当然，高性能视频和语音技术也能够开辟更多应用领域。

尽管图像生成的社会变革潜力巨大，但相比于文本和语言应用，它的短期影响仍较小。目前，B2B 应用主要集中在语言（文本和少量语音）上，而消费市场则多元化（如社交媒体和电子商务平台）。

虽然图像生成领域机会颇多，但如果对相关公司的市值与收入进行分析，便会发现其潜在市场规模与语言生成相比显得微不足道。语言是所有 B2B 交互、社交产品及商业活动的核心，因此，在短期内，LLM 的重要性可能要超过图像生成，尽管图像生成同样不可忽视。

通常，已经取得成功的图像生成模型所需的资金和计算资源相对较低。例如，最新版的 Stable Diffusion 训练可能最多只需几十万到几百万美元的 GPU 时间。

这些领域中，哪些需要大型语言模型，哪些需要较小规模的特定语言模型，仍然是一个悬而未决的问题。目前，LLM 在某些领域表现优于小众模型，而其它领域则未必如此。

大型语言模型的市场结构及潜在的终端市场路径也存在多种可能性。这一市场结构十分关键，因为它决定了生态系统中的经济赢家和人才赢家（即谁能够收割收入、人才、利润、市值与创新）。

THE END