AIGC:Web3 时代的内容创作利器
AIGC(AI-Generated Content,人工智能生成内容)代表着一种新的范式转变的开端。 近年来,硅谷的顶级风险投资公司纷纷将投资目光投向 AI 初创企业,尤其是生成式 AI 艺术领域。今年,已有两家独角兽企业 Stability 和 Jasper 获得超过一亿美元的融资,估值均超过十亿美元。AIGC 的蓬勃发展不仅得益于技术的快速进步、广泛的商业应用和不断增长的需求,更在于该领域仍然处于发展早期。尽管大型科技公司占据了大部分市场份额,初创公司依然有潜力实现突破。
AIGC 将成为 Web3 时代的生产力工具。 随着我们迈入 Web3.0 时代,人工智能、关联数据和语义网络的构建将形成人与网络之间的新联结,内容消费需求迅速上升。传统的 UGC\PGC 生成方式越来越难以满足这种扩张的需求,而 AIGC 将成为元宇宙内容生成的新解决方案。利用人工智能学习知识图谱,AIGC 能够自动生成内容,既可以辅助人类创作,也可以完全由 AI 独立生成。这不仅提升了内容生成的效率,也增加了内容的多样性。随着自然语言处理(NLP)技术和扩散模型的发展,AI 不再仅仅是内容创作的辅助工具,完全自主的内容生成成为可能。未来,文字生成、图像绘制、视频编辑和游戏内容创作都将可能被 AI 所替代。
AIGC 技术主要涵盖两个核心方面:自然语言处理(NLP)和 AIGC 生成算法。 自然语言处理技术实现人与计算机之间的自然语言交互。而 AIGC 的生成算法包括生成对抗网络(GAN)和扩散模型。扩散模型已经展现出成为下一代图像生成模型的潜力,具备更高的精度、可扩展性和并行性,大幅提升了质量和效率,成为 AIGC 增长的重要推动力。同时,机器学习过程中的大量训练需求,预计将使对底层算力的需求呈现爆发式增长。
AIGC 在文字、图像、音频、游戏及代码生成等领域的商业模型逐渐显现。 我们近期对国内外数十家 AIGC 相关企业进行了研究,发现其在高重复性任务和对精度要求不高的领域中应用逐步成熟,并逐渐探索商业模式。目前,图像生成和文字生成服务尤为常见,大部分 AIGC 服务通过提供 SaaS 模式来实现盈利。
AIGC 未来发展的核心要素
-
大模型、大数据与大算力。
结合自然语言的大模型与数据集已成为 AIGC 发展的基础。例如,OpenAI 的 Clip 模型基于4亿组高质量的英文图文数据进行训练;而在 AIGC 数字时代,算力的重要性将愈加突出,Stable Diffusion 当前依赖于4000个 NVIDIA A100 GPU 集群,运营成本超5000万美元。为了增强应用的精准性,未来还会更多地基于特定语种进行垂直应用开发,以便针对特定功能进行更有针对性的训练。 -
投资框架:软硬件与数据集。
生成算法、NLP 和算力是 AIGC 成功运行的关键,而高质量的数据集则直接影响 AIGC 产品的质量与商业模式。 -
软件层面主要包括自然语言处理技术的提供者:谷歌、微软、科大讯飞、拓尔思;
- AIGC 生成算法模型及数据集的主要企业有:英伟达、Meta、百度、蓝色光标、视觉中国、昆仑万维;
- 算力层主要涵盖:澜起科技、中兴通讯、新易盛、天孚通信、宝信软件、中际旭创等。
风险提示: AIGC 的技术创新或许不及预期,底层硬件如超级计算机或算力的进展也可能遭遇挑战。此外,政策监管风险仍待观察,目前 AIGC 仍处于相对早期的阶段,未来是否会出台有关 AIGC 作品的知识产权或其他法律监管条款尚不明确。
2022:AIGC 的崛起之年
近期,硅谷的许多风险投资公司开始关注 AI 初创企业,尤其是生成式 AI 艺术领域。2022年9月23日,红杉资本发布了一篇名为《生成式 AI:一个创造性的新世界》的文章,指出 AIGC(人工智能生成内容)将标志着一轮新的范式转移。
2022年10月,英国开源人工智能公司 Stability AI 宣布获得1.01亿美元融资,估值高达10亿美元,成功跻身独角兽行列,参与投资的公司包括 Coatue、Lightspeed Venture Partners 和 O’Shaughnessy Ventures LLC。Stability AI 今年发布的 Stable Diffusion 模型,能够根据用户输入的文字描述自动生成图像,其问世使得 AI 绘画领域愈发火爆。最近,巴比特宣布全面拥抱 AIGC,开始大规模采用 AI 配图,涵盖头条图片和各类自媒体平台。
除了绘画以外,文字、音频、视频均可通过 AI 来生成。
以 Jasper 为例,该平台以 AI 文字生成为核心功能,为用户生成 Instagram 标题、TikTok 视频脚本、广告文案、电子邮件内容等。截止2021年,Jasper 已拥有超过70000位客户,创造了4000万美元的收入。
在音频创作方面,Podcast.ai 是一个由 AI 生成的博客,每周讨论一个话题。在第一期节目中,借助乔布斯的传记及其网络录音,Play.ht 的语言模型得以进行大量训练,最终生成了假乔·罗根采访乔布斯的播客内容。
视频方面,现有 AI 技术不仅能够生成图片,还能够创建序列帧,例如《幻觉东京》。该项目花费160小时完成30000多张独立插画,并进行人工微调。尽管当前的技术仍基于原始脚本和视频,通过 AI 逐帧生成图像,但已显示出 AIGC 在视频创作中的巨大潜力。同时,在诸多垂直领域应用中,文字可以直接生成相应的短视频,结合虚拟人技术可实现自动播报,从而使内容呈现更加逼真自然。
随着 NLP 技术和扩散模型的发展,AI 生成内容的可能性正在拓展。此前内容生成主要依赖 GAN(生成对抗网络),而 GAN 因其特性无法像扩散模型那样依赖超大规模语言模型。因此,AI 的内容理解及创造能力在当前技术下更为有限。然而,随着扩散模型的成熟,生成方式开始趋近人脑的联想方式,AIGC 成功实现了内容创作辅助工具到主要创作者的转变。