GPT-4o 对决 Gemini 1.5 Pro：新一代AI模型大比拼

huangzuomin (74)in #cn • last month

OpenAI 和谷歌分别发布了最新AI模型 GPT-4o 和 Gemini 1.5 Pro，这两款生成式AI领域的“可口可乐”和“百事可乐”究竟孰强孰弱？

功能相似，各有千秋

GPT-4o 和 Gemini 1.5 Pro 都是先进的语言模型，都能理解用户输入的文本提示并生成流畅自然的文本回复。但就像可口可乐和百事可乐一样，它们在配方和口味上有所不同，具体表现也各有千秋。

1. 上下文窗口：Gemini 优势明显

上下文窗口是指语言模型在生成回复时能够考虑的文本范围，类似于模型的记忆力。
Gemini 1.5 Pro 的上下文窗口高达100万个词元，并承诺在今年晚些时候翻倍至200万个。
GPT-4o 和之前的 GPT-4 的上下文窗口仅为12.8万个词元。

2. 参数数量：难以比较

参数决定了模型处理词元和生成文本的准确性，类似于人脑中的神经元。
谷歌没有公开 Gemini 模型的参数数量，估计在1.6万亿到175万亿之间。
OpenAI 也没有透露 GPT-4o 的参数数量，但 GPT-4 的参数数量据称为1.8万亿。

3. 信息获取：GPT-4o 后来居上

语言模型的知识库截止日期是其训练数据的时效性指标。
GPT-4o 的知识库截止日期为2023年10月，而 Gemini 的截止日期为“2023年初”。
然而，OpenAI 与 Reddit 和新闻集团等内容平台达成合作，可以获取更多最新信息，弥补了时效性上的不足。

4. 语言支持：GPT-4o 略胜一筹

GPT-4o 支持50种语言，而 Gemini 1.5 Pro 支持35种语言。
但谷歌拥有多年的机器翻译经验，其多语言训练数据可能更为丰富。

5. 用户界面：趋于相似

两款模型都推出了更具对话性的功能。
ChatGPT-4o 的新界面支持语音交互和实时视频分享，还能识别用户情绪。
谷歌推出了 Gemini Live，同样支持语音交互和打断功能。

结语

GPT-4o 和 Gemini 1.5 Pro 都是功能强大的AI模型，各有优劣。最终选择哪一款，取决于用户的具体需求和偏好。这场生成式AI的军备竞赛才刚刚开始，让我们拭目以待未来的发展吧！

原文：https://www.cnet.com/tech/services-and-software/gpt-4o-and-gemini-1-5-pro-how-the-new-ai-models-compare/

last month in #cn by huangzuomin (74)

Sort:

fuli (7) last month

You've got a free upvote from witness fuli.
Peace & Love!

$0.00

jswit (66) last month

Upvoted! Thank you for supporting witness @jswit.

To turn off auto-reply, write a reply to this comment with "@jswit reply-off"
Delegate SP to jsup & receive daily upvote
Preserve your digital art with STEEM.NFT

$0.00

STEEM 0.20

TRX 0.13

JST 0.029

BTC 62843.32

ETH 3475.97

USDT 1.00

SBD 2.53