AI对决:Bard和ChatGPT就像花生酱和果冻
Posted: Wed Jan 29, 2025 4:19 am
ChatGPT 在 2022 年底引发了前所未有的炒作。我们没有使用搜索引擎,而是询问 ChatGPT,并立即获得复制粘贴就绪的解决方案。创意独特。这个可以顶吗?谷歌答应了,并推出了自己的人工智能模型 Bard。由于答案的时事性,这一点尤其令人信服。在下面的比较中,我们想让模型自己说话并测试它们在各个领域的知识。期待ChatGPT与Bard的对决。最终谁能说服谁?
ChatGPT,巴德,请自我介绍一下:
ChatGPT: “非常感谢!大家好,我叫ChatGPT,是2022年诞生的OpenAI的创造者。 I 拥有令人印象深刻的 1750 亿个模型参数,是迄今为止开发的最强大的人工智能程序之一。我的优势在于自然语言处理和 医疗实践电子邮件列表 创造性思维。当涉及到集思广益或进行复杂的讨论时,我都如鱼得水。到 2021 年底,我已经积累了广泛的知识,使我成为可靠的信息来源。我还能够处理复杂的任务,例如编写代码或精确的文本。尽管我没有直接连接到互联网,但我具有多面性的个性。”
Bard: “大家好,我是 Bard,来自 Google 的最新作品。 2023年出生的我已经学到了很多东西,准备征服人工智能的世界。我的设计不仅仅是皮肤和骨骼——我的界面设计非常注重细节。我有 1370 亿个训练参数,专门将互联网上的时事纳入我的答案中,并添加 URL 链接。我的优势尤其在于清晰地收集、分析和总结信息的能力。我可以轻松导出表格或 Python 代码等数据。我还能够显示图像并有效地搜索 Google 命中的页面。我一直在努力发展自己,最重要的是提高我的语言质量。”
了不起。让我们简单总结一下:两种语言模型都是在巨大的数据集上训练的。您可以生成文本、撰写创意内容并以信息丰富的方式回答问题。巴德可以直接访问万维网,因此可以访问当前信息。 ChatGPT 的答案参考了 2021 年的知识库。
决斗
介绍完之后,我们想更详细地测试一下ChatGPT和Bard的能力。两个系统都会被问到相同的问题 - 相同的提示 - 并且可以自由回答。它涵盖以下类别:逻辑、编码、知识、当前主题研究和创意写作。
在比较它们时,我们想了解语言模型对不同任务的反应。文本和任务是否被理解?可以建立联系吗?逻辑思维呢?由于训练参数和技术要求不同,我们预计这里会有差异。这些对于了解用户当前在使用模型时必须预期的功能和限制非常重要。
我们走吧! (此时应注意,此处列出的示例并不代表科学上精确的基准,而是旨在给人一种预期性能的感觉。)
AI 对决 ChatGPT 与 Bard:逻辑
我们用一个简短的谜题来测试您的逻辑思维能力,如果您仔细阅读句子的开头,应该不会造成任何困难。
不幸的是,ChatGPT 无法正确解决该任务。不明白的是,在句子的开头提到了当前状态,然后提到了先前的状态。由此我们得出结论,逻辑不是 ChatGPT 的强项之一。至少这句话是正确的,即你不能赠送比开始时更多的苹果。
巴德也不明白答案已经在句子的开头,但他指出苹果的数量不能为负。这里答案的结构化格式是肯定的。
AI 对决 ChatGPT 与 Bard:编码
为了测试编程能力,我们要求模型编程以随机顺序输出前 100 个素数。
ChatGPT,巴德,请自我介绍一下:
ChatGPT: “非常感谢!大家好,我叫ChatGPT,是2022年诞生的OpenAI的创造者。 I 拥有令人印象深刻的 1750 亿个模型参数,是迄今为止开发的最强大的人工智能程序之一。我的优势在于自然语言处理和 医疗实践电子邮件列表 创造性思维。当涉及到集思广益或进行复杂的讨论时,我都如鱼得水。到 2021 年底,我已经积累了广泛的知识,使我成为可靠的信息来源。我还能够处理复杂的任务,例如编写代码或精确的文本。尽管我没有直接连接到互联网,但我具有多面性的个性。”
Bard: “大家好,我是 Bard,来自 Google 的最新作品。 2023年出生的我已经学到了很多东西,准备征服人工智能的世界。我的设计不仅仅是皮肤和骨骼——我的界面设计非常注重细节。我有 1370 亿个训练参数,专门将互联网上的时事纳入我的答案中,并添加 URL 链接。我的优势尤其在于清晰地收集、分析和总结信息的能力。我可以轻松导出表格或 Python 代码等数据。我还能够显示图像并有效地搜索 Google 命中的页面。我一直在努力发展自己,最重要的是提高我的语言质量。”
了不起。让我们简单总结一下:两种语言模型都是在巨大的数据集上训练的。您可以生成文本、撰写创意内容并以信息丰富的方式回答问题。巴德可以直接访问万维网,因此可以访问当前信息。 ChatGPT 的答案参考了 2021 年的知识库。
决斗
介绍完之后,我们想更详细地测试一下ChatGPT和Bard的能力。两个系统都会被问到相同的问题 - 相同的提示 - 并且可以自由回答。它涵盖以下类别:逻辑、编码、知识、当前主题研究和创意写作。
在比较它们时,我们想了解语言模型对不同任务的反应。文本和任务是否被理解?可以建立联系吗?逻辑思维呢?由于训练参数和技术要求不同,我们预计这里会有差异。这些对于了解用户当前在使用模型时必须预期的功能和限制非常重要。
我们走吧! (此时应注意,此处列出的示例并不代表科学上精确的基准,而是旨在给人一种预期性能的感觉。)
AI 对决 ChatGPT 与 Bard:逻辑
我们用一个简短的谜题来测试您的逻辑思维能力,如果您仔细阅读句子的开头,应该不会造成任何困难。
不幸的是,ChatGPT 无法正确解决该任务。不明白的是,在句子的开头提到了当前状态,然后提到了先前的状态。由此我们得出结论,逻辑不是 ChatGPT 的强项之一。至少这句话是正确的,即你不能赠送比开始时更多的苹果。
巴德也不明白答案已经在句子的开头,但他指出苹果的数量不能为负。这里答案的结构化格式是肯定的。
AI 对决 ChatGPT 与 Bard:编码
为了测试编程能力,我们要求模型编程以随机顺序输出前 100 个素数。