ChatGPT时代:AI的未来应用生态

AI 的应用生态可以大致划分为三个主要领域,尽管这是一种简化的描述:

  1. 大型语言模型
    这类模型如 GPT-4 或 Chinchilla,能够处理网络或其他文本来源的内容,转化为多功能的工具,例如生成法律文件摘要、进行网络搜索或作为智能聊天助手。

  2. 图像生成
    包括 Midjourney、DALL-E 和 Stable Diffusion 等模型,以及一些现代化的视频制作工具和 NeRF 3D 模型。用户可以通过输入提示生成图像,赋予创作更多灵活性。

  3. 其他领域
    这一类别涵盖广泛的技术应用,例如机器人技术、自动驾驶汽车及蛋白质折叠等。尽管不同应用间存在明显差异,但因篇幅有限,本文将其简单归为一类。

在谈论“生成式人工智能”时,常常会将这些领域混淆,但实际上,每个市场都有独特的 AI 模型架构、计算和扩展需求、质量标准以及应用场景。因此,理解这些差异有助于我们预测未来的发展方向。

图像生成的影响

图像生成有潜力改变多个领域,主要包括:

  • 社交产品及图像(例如 Lensa 的未来版本,或其与核心社交平台的整合)
  • 图形与可视化设计
  • 电影、漫画、动漫
  • 视频游戏
  • CAD 制图
  • 建筑设计
  • 电子商务

当然,高性能视频和语音技术也能够开辟更多应用领域。

尽管图像生成的社会变革潜力巨大,但相比于文本和语言应用,它的短期影响仍较小。目前,B2B 应用主要集中在语言(文本和少量语音)上,而消费市场则多元化(如社交媒体和电子商务平台)。

虽然图像生成领域机会颇多,但如果对相关公司的市值与收入进行分析,便会发现其潜在市场规模与语言生成相比显得微不足道。语言是所有 B2B 交互、社交产品及商业活动的核心,因此,在短期内,LLM 的重要性可能要超过图像生成,尽管图像生成同样不可忽视。

图像生成的建模成本

通常,已经取得成功的图像生成模型所需的资金和计算资源相对较低。例如,最新版的 Stable Diffusion 训练可能最多只需几十万到几百万美元的 GPU 时间。

LLM 与基础模型的应用

  • 搜索
  • 大多数 B2B 交互(销售、ERP、文档管理、电子邮件等)
  • 代码生成(包括 SQL 和 Excel)
  • 金融
  • 社交与消费产品
  • 聊天、短信及其他应用
  • 职场支持(法律、会计、医学等领域)

这些领域中,哪些需要大型语言模型,哪些需要较小规模的特定语言模型,仍然是一个悬而未决的问题。目前,LLM 在某些领域表现优于小众模型,而其它领域则未必如此。

大型语言模型的市场结构及潜在的终端市场路径也存在多种可能性。这一市场结构十分关键,因为它决定了生态系统中的经济赢家和人才赢家(即谁能够收割收入、人才、利润、市值与创新)。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

THE END