全新 Gemini 1.5 FLASH 型号:绝对的 Google 游戏规则改变者
- Rifx.Online
- Programming , Machine Learning , Generative AI
- 08 Nov, 2024
他们的新 Gemini 1.5 Flash 模型远远超过了 GPT-4o,其能力令人难以置信。
闪电般快速。
比 GPT-4o 便宜 33 倍,但上下文容量大 700% — 100 万个令牌。
在现实世界中,100 万个令牌是什么概念?大约:
- 超过 1 小时的视频
- 超过 30,000 行代码
- 超过 700,000 个单词
❌GPT-4o 成本:
- 输入:每百万个令牌 $2.50
- 输出:每百万个令牌 $10
- 缓存输入:每百万个令牌 $1.25
✅ Gemini 1.5 Flash 成本:
- 输入:每百万个令牌 $0.075
- 输出:每百万个令牌 $0.30
- 缓存输入:每百万个令牌 $0.01875
还有用于成本效益任务的 mini Flash-8B 版本 — 比 GPT-4o 便宜 66 倍:
最棒的是其多模态性 — 它可以以复杂的集成方式对文本、文件、图像和音频进行推理。
而 1.5 Flash 几乎具备 Pro 的所有能力,但速度更快。作为开发者,你现在就可以开始使用它们。
Gemini 1.5 Pro 在一部 44 分钟的无声电影中进行了测试,令人惊讶的是,它轻松将电影分析成各种情节和事件,甚至指出大多数人在第一次观看时会错过的小细节。
与此同时,GPT-4o API 仅允许你处理文本和图像。
你可以在谷歌的 AI Studio 中轻松创建、测试和完善提示 — 完全免费。
这不会像在 OpenAI playground 中那样计入你的账单。
看看谷歌 AI Studio 的强大功能 — 根据图像创建食谱:
我上传了这张来自 gettyimages 的美味面包:
现在:
如果我想要响应以我的 API 或其他内容的特定格式呢?
那么你可以打开 JSON 模式并指定响应模式:
OpenAI playground 也有这个,但使用起来不如它直观。
Gemini 相较于 OpenAI 的另一个升级是它的创造力。
在 Gemini 中,你可以将 temperature
从 0 增加到 200% 来控制响应的随机性和创造性:
而在 OpenAI 中,如果你尝试超过 100%,你很可能会得到一堆完全无意义的内容。
而且最棒的是 — 当你完成创建提示后,你可以直接使用 获取代码 — 轻松复制并粘贴模板 API 代码,快速进入开发。
支持包括 Kotlin、Swift 和 Dart 在内的多种语言 — 在移动开发中实现高效的 AI 工作流程。
在 OpenAI playground 中,你可以获得 Python 和 JavaScript 的代码。
最后的思考
Gemini 1.5 Flash 是一款颠覆性的产品,以极低的成本提供无与伦比的能力。
凭借其先进的多模态易用性、慷慨的免费定价和创造潜力,它为人工智能设定了新的标准,让 GPT-4o 相形见绌。