Type something to search...

Models

Gemini 2.0 Flash Lite 提供了显著更快的首次令牌时间 (TTFT),与 Gemini Flash 1.5 相比,同时在质量上与更大模型如 Gemini Pro 1.5 相当,所有这些都以极具经济性的令牌价格进行。 ...

Google: Gemini 2.0 Flash Lite
Google
1M context $0.075/M input tokens $0.3/M output tokens

Qwen2.5-VL 擅长识别常见物体,如花、鸟、鱼和昆虫。它还非常擅长分析文本、图表、图标、图形和图像中的布局。 ...

Qwen: Qwen2.5 VL 72B Instruct
Qwen
128K context $0.7/M input tokens $0.7/M output tokens

Meta最新发布的模型系列(Llama 3)推出了多种尺寸和版本。这是基础的70B预训练版本。 与领先的闭源模型在人工评估中相比,它展示了强大的性能。 要了解更多关于模型发布的信息,点击这里。该模型的使用受[Meta可接受使用政策](https://llama.meta.com/llama3/use-poli ...

Meta: Llama 3 70B (Base)
Meta Llama
8K context $0.59/M input tokens $0.79/M output tokens

Meta 最新发布的模型系列 (Llama 3) 提供了多种尺寸和版本。这是基础的 8B 预训练版本。 与领先的闭源模型相比,它在人工评估中表现出色。 要了解更多关于模型发布的信息,点击这里。该模型的使用受 [Meta 的可接受使用政策](https://llama.meta.com/llama3/use-p ...

Meta: Llama 3 8B (Base)
Meta Llama
8K context $0.05/M input tokens $0.08/M output tokens

Claude 3.7 Sonnet 是一个先进的大型语言模型,具有更强的推理、编码和问题解决能力。它引入了一种混合推理方法,允许用户在快速响应和针对复杂任务的扩展逐步处理之间进行选择。该模型在编码方面表现出显著的改进,特别是在前端开发和全栈更新方面,并在自主工作流程中表现出色,能够自主导航多步骤的过程。 Claude 3.7 Sonnet 在标准模式下与其前身保持性能平衡,同时提供扩展推理模式 ...

Anthropic: Claude 3.7 Sonnet
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

R1 1776 是 DeepSeek-R1 的一个版本,经过后期训练以去除与中国政府限制主题相关的审查约束。该模型保留了其原有的推理能力,同时对更广泛的查询提供直接响应。R1 1776 是一个离线聊天模型,不使用困惑度搜索子系统。 该模型在一个包含超过 1,000 个示例的多语言数据集上进行了测试,涵盖敏感主题,以测量其拒绝或过度过滤响应的可能性。 [评估结果](https://cdn-upl ...

Perplexity: R1 1776
Perplexity
125K context $2/M input tokens $8/M output tokens
20% OFF

OpenAI o3-mini-high 是与 o3-mini 相同的模型,但推理努力设置为高。 o3-mini 是一种具有成本效益的语言模型,针对 STEM 推理任务进行了优化,特别是在科学、数学和编码方面表现出色。该模型具有三个可调的推理努力级别,并支持关键开发者功能,包括函数调用、结构化输出和流式传输,但不包括视觉处理能力。 该模型在其前身的基础上显 ...

OpenAI: o3 Mini High
OpenAI
195.31K context $1.1/M input tokens $4.4/M output tokens
20% OFF

DeepSeek-R1 1. 介绍 我们介绍我们的第一代推理模型,DeepSeek-R1-Zero 和 DeepSeek-R1。 DeepSeek-R1-Zero 是通过大规模强化学习(RL)训练的模型,没有经过监督微调(SFT)作为初步步骤,表现出卓越的推理能力。 通过 RL,DeepSeek-R1-Zero 自然展现出许多强大且有趣的推理行为。 然而,DeepSeek-R ...

DeepSeek: R1
DeepSeek
160K context $3/M input tokens $8/M output tokens

Gemini Flash 2.0 提供了显著更快的首次令牌时间(TTFT),相比于 Gemini Flash 1.5,同时保持与更大模型如 Gemini Pro 1.5 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体 ...

Google: Gemini Flash 2.0
Google
976.56K context $0.1/M input tokens $0.4/M output tokens

DeepSeek R1 Distill Llama 70B 是一个基于 Llama-3.3-70B-Instruct 的蒸馏大型语言模型,使用了 DeepSeek R1 的输出。该模型结合了先进的蒸馏技术,以在多个基准测试中实现高性能,包括:AIME 2024 p...

DeepSeek: DeepSeek R1 Distill Llama 70B
DeepSeek
128K context $0.23/M input tokens $0.69/M output tokens

Lunaris 8B 是一个基于 Llama 3 的多功能通用和角色扮演模型。它是多个模型的战略合并,旨在平衡创造力与改进的逻辑和一般知识。 由 Sao10k 创建,该模型旨在提供比 Stheno v3.2 更好的体验,具有增强的创造力和逻辑推理能力。 为了获得最佳效果,请使用 Llama 3 Instruct 上下文模板,温 ...

Sao10K: Llama 3 8B Lunaris
Rifx.Online
8K context $0.03/M input tokens $0.06/M output tokens

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并,使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型,结合了许多其他模型的最佳部分,成为许多用例的通用解决方案。 旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成:Hero (RP, trop...

Inflatebot: Mag Mell R1 12B
Rifx.Online
15.63K context $0.9/M input tokens $0.9/M output tokens

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型,参数为 70B(文本输入/文本输出)。Llama 3.3 指令调优的文本模型专为多语言对话用例优化,并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。 支持的语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta: Llama 3.3 70B Instruct
Meta Llama
128K context $0.13/M input tokens $0.4/M output tokens

text-embedding-3-small 是 OpenAI 推出的经济型文本嵌入模型,它是 text-embedding-3 系列中的轻量级版本。这个模型在保持较好性能的同时,提供了更经济的价格选择。 主要特性性价比高: 价格是 text-embedding-3-large 的约1/6 多语言支持: 同样支持100多种语言的文本嵌入 *上下文长度...

text-embedding-3-small
OpenAI
$0.02/M input tokens $0 output tokens

Amazon Nova Lite 1.0 是亚马逊推出的一款非常低成本的多模态模型,专注于快速处理图像、视频和文本输入以生成文本输出。Amazon Nova Lite 可以高精度地处理实时客户交互、文档分析和视觉问答任务。 在 300K tokens 的输入上下文下,它可以在单个输入中分析多个图像或长达 30 分钟的视频。 ...

Amazon: Nova Lite 1.0
Amazon
292.97K context $0.06/M input tokens $0.24/M output tokens
Tags
Type something to search...