ChatGPT时代:AI的未来应用生态
AI 的应用生态可以大致划分为三个主要领域,尽管这是一种简化的描述:
-
大型语言模型
这类模型如 GPT-4 或 Chinchilla,能够处理网络或其他文本来源的内容,转化为多功能的工具,例如生成法律文件摘要、进行网络搜索或作为智能聊天助手。 -
图像生成
包括 Midjourney、DALL-E 和 Stable Diffusion 等模型,以及一些现代化的视频制作工具和 NeRF 3D 模型。用户可以通过输入提示生成图像,赋予创作更多灵活性。 -
其他领域
这一类别涵盖广泛的技术应用,例如机器人技术、自动驾驶汽车及蛋白质折叠等。尽管不同应用间存在明显差异,但因篇幅有限,本文将其简单归为一类。
在谈论“生成式人工智能”时,常常会将这些领域混淆,但实际上,每个市场都有独特的 AI 模型架构、计算和扩展需求、质量标准以及应用场景。因此,理解这些差异有助于我们预测未来的发展方向。
图像生成的影响
图像生成有潜力改变多个领域,主要包括:
- 社交产品及图像(例如 Lensa 的未来版本,或其与核心社交平台的整合)
- 图形与可视化设计
- 电影、漫画、动漫
- 视频游戏
- CAD 制图
- 建筑设计
- 电子商务
当然,高性能视频和语音技术也能够开辟更多应用领域。
尽管图像生成的社会变革潜力巨大,但相比于文本和语言应用,它的短期影响仍较小。目前,B2B 应用主要集中在语言(文本和少量语音)上,而消费市场则多元化(如社交媒体和电子商务平台)。
虽然图像生成领域机会颇多,但如果对相关公司的市值与收入进行分析,便会发现其潜在市场规模与语言生成相比显得微不足道。语言是所有 B2B 交互、社交产品及商业活动的核心,因此,在短期内,LLM 的重要性可能要超过图像生成,尽管图像生成同样不可忽视。
图像生成的建模成本
通常,已经取得成功的图像生成模型所需的资金和计算资源相对较低。例如,最新版的 Stable Diffusion 训练可能最多只需几十万到几百万美元的 GPU 时间。
LLM 与基础模型的应用
- 搜索
- 大多数 B2B 交互(销售、ERP、文档管理、电子邮件等)
- 代码生成(包括 SQL 和 Excel)
- 金融
- 社交与消费产品
- 聊天、短信及其他应用
- 职场支持(法律、会计、医学等领域)
这些领域中,哪些需要大型语言模型,哪些需要较小规模的特定语言模型,仍然是一个悬而未决的问题。目前,LLM 在某些领域表现优于小众模型,而其它领域则未必如此。
大型语言模型的市场结构及潜在的终端市场路径也存在多种可能性。这一市场结构十分关键,因为它决定了生态系统中的经济赢家和人才赢家(即谁能够收割收入、人才、利润、市值与创新)。