深度对比:Claude 3与ChatGPT Plus,究竟谁更强?

Claude 3在今日凌晨正式发布。这个由OpenAI分裂而出的兄弟公司Anthropic,悄然间发布了Claude 3,并未召开如其他科技公司般的发布会,仅是在X平台上发布了相关信息。

Claude3发布
看起来对Claude 3相当有自信。

Anthropic此次一共推出了三个模型,分别命名为:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

  • Opus:意味着史诗级乐章;
  • Sonnet:指的是十四行诗;
  • Haiku:是日本的三行短诗。

简单来说,三个模型的区别可以类比为:Opus(超大杯)、Sonnet(大杯)、Haiku(中杯)。

下图直观展示了三者之间的差别:

Claude3性能测试

Claude的免费版本只能使用Sonnet,若想使用Opus则需充值20美元,这与OpenAI的策略如出一辙。ChatGPT 3.5可免费使用,ChatGPT Plus则需要付费订阅。

两者的订阅价格几乎相同,体现出双方之间的直接竞争态势。

训练时间

Claude训练时间

目前,Claude的最新训练时间为2023年8月,而ChatGPT Plus的数据更新至2023年4月,Claude在这一点上略胜一筹。

推理能力

根据官方文档,这次Claude 3最大的进步在于推理与逻辑能力。以下是一些实际测试的例子:

示例题目1

解释补集法的概念,并用补集法计算这道概率题:

“一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?”

在明确补集法的前提下,GPT-4的错误率依然高达50%。而Claude 3 Opus在多次测试中准确率达到90%。

Claude3推理测试

示例题目2

张三是一名推销员,她在绿房子卖掉了三分之一的吸尘器,在红房子多卖了2台,在橙房子卖掉了剩下吸尘器的一半。如果张三还剩下5台吸尘器,她一开始有多少台吸尘器?

Claude3推理测试

该功能展现了Claude 3在学习辅助方面的巨大潜力,成为家长的有力帮手。

多模态功能

Claude 3同样支持多模态功能,能够处理图像相关的任务。除了在科学示意图方面表现稍强外,整体差距不大。

Claude3性能评测

相较于之前的版本,Claude 3在处理长文本能力方面也得到了显著提升。

200K长文本优化

Claude3的长文本能力

Claude 3能够准确回答超长文本相关的问题,展现出其优越的语义理解能力。

总结

Claude 3的更新赋予了它独特的推理能力、完善的多模态功能以及对200K长文本的优化,整体表现令人惊艳。

而若想尝试Claude 3的强大功能,建议使用 野卡 | 一分钟注册,轻松订阅海外线上服务 进行体验。

尽管Claude 3表现出色,但OpenAI依旧在技术实力上占据领先地位,尤其是未来推出的Sora与GPT-5,预计将对其他AI工具造成冲击。

在选择使用哪一款模型时,工具的可用性和使用便捷性也是不可忽视的因素。无论是网页浏览能力、代码解释器还是API接入能力,整个生态的丰富程度都会影响用户体验。

THE END