Type something to search...

Models

Claude 3.5 Sonnet 提供了超越 Opus 的能力,以比 Sonnet 更快的速度,且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色:编码:自主编写、编辑和运行代码,具备推理和故障排除能力 数据科学:增强人类的数据科学专业知识;在使用多种工具获取洞察的同时,能够处理非结构化数据 视觉处理:擅长解读图表、图形和图像,准确转录文本,以获取超越文本本身的...

Anthropic: Claude 3.5 Sonnet (2024-06-20)
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Llama 3.2 1B 是一个拥有 10 亿参数的语言模型,专注于高效执行自然语言任务,如摘要、对话和多语言文本分析。其较小的体积使其能够在低资源环境中高效运行,同时保持强大的任务性能。 支持八种核心语言,并可进行微调以支持更多,Llama 1.3B 非常适合寻求轻量级但强大的 AI 解决方案的企业或开发者,这些解决方案能够在多样的多语言环境中运行,而不需要大型模型的高计算需求。 点击这里 ...

Meta: Llama 3.2 1B Instruct
Meta Llama
128K context $0.01/M input tokens $0.02/M output tokens

介绍 QwQ-32B-Preview 是由 Qwen 团队开发的实验研究模型,旨在提升 AI 推理能力。作为预览版本,它展示了有前景的分析能力,但也存在几个重要的局限性:语言混合和代码切换:该模型可能会意外混合语言或在语言之间切换,从而影响响应的清晰度。 递归推理循环:该模型可能会进入循环推理模式,导致响应冗长而没有结论性答案。 **安全和伦...

Qwen: QwQ 32B Preview
Qwen
32K context $0.15/M input tokens $0.6/M output tokens

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT),同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google: Gemini 2.0 Flash Experimental
Google
976.56K context $0.2/M input tokens $0.6/M output tokens
FREE

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT),同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google: Gemini 2.0 Flash Experimental (free)
Google
976.56K context $0 input tokens $0 output tokens
FREE

DeepSeek R1 已经发布:性能与 OpenAI o1 相当,但为开源且具有完全开放的推理令牌。它的参数量为 671B,在推理过程中活跃的参数为 37B。 完全开源模型 & 技术报告。 MIT 许可证:自由提炼和商业化! ...

DeepSeek: R1 (free)
DeepSeek
160K context $0 input tokens $0 output tokens
FREE

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型,参数为 70B(文本输入/文本输出)。Llama 3.3 指令调优的文本模型专为多语言对话用例优化,并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。 支持的语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta: Llama 3.3 70B Instruct (free)
Meta Llama
128K context $0 input tokens $0 output tokens
FREE

NVIDIA的Llama 3.1 Nemotron 70B是一个旨在生成精确和有用响应的语言模型。利用Llama 3.1 70B架构和基于人类反馈的强化学习(RLHF),它在自动对齐基准测试中表现出色。该模型专为需要高准确性的有用性和响应生成的应用而设计,适合处理多个领域的多样化用户查询。 使用此模型须遵 ...

NVIDIA: Llama 3.1 Nemotron 70B Instruct (free)
NVIDIA
128K context $0 input tokens $0 output tokens
FREE

Qwen2.5-VL 擅长识别常见物体,如花、鸟、鱼和昆虫。它还非常擅长分析文本、图表、图标、图形和图像中的布局。 ...

Qwen: Qwen2.5 VL 72B Instruct (free)
Qwen
128K context $0 input tokens $0 output tokens
FREE

Gemini 2.0 Flash Thinking Mode 是一个实验性模型,旨在生成模型在响应过程中经历的“思维过程”。因此,Thinking Mode 在响应中的推理能力比 基础 Gemini 2.0 Flash 模型 更强。 ...

Google: Gemini 2.0 Flash Thinking Experimental (free)
Google
39.06K context $0 input tokens $0 output tokens
FREE

Rogue Rose 在角色扮演和故事讲述应用中展现出强大的能力,可能在 103-120B 参数范围内超越其他模型。虽然它偶尔表现出与场景逻辑的不一致,但整体互动质量代表了自然语言处理在创意应用方面的进步。 它是一个 120 层的 frankenmerge 模型,结合了来自 2023 年 11 月的两个定制 70B 架构,源自 [xwin-stellarbright-erp-70b-v2](h ...

Rogue Rose 103B v0.2 (free)
Sophosympatheia
4K context $0 input tokens $0 output tokens
FREE

Gemini 2.0 Pro Experimental 是 Gemini 2.0 Pro 模型的前沿版本。由于它目前处于实验阶段,它将受到 Google 的 严格限流。 使用 Gemini 需遵循 Google 的 Gemini 使用条款。 #multimodal ...

Google: Gemini Pro 2.0 Experimental (free)
Google
1.91M context $0 input tokens $0 output tokens
FREE

Gemini Flash Lite 2.0 提供了显著更快的首次令牌时间 (TTFT),相比于 Gemini Flash 1.5,同时保持与更大模型如 Gemini Pro 1.5 相当的质量。由于目前处于预览阶段,它将会受到 Google 的 严格限流。该模型将在 2 月 24 日的 ...

Google: Gemini Flash Lite 2.0 Preview (free)
Google
976.56K context $0 input tokens $0 output tokens
FREE

DeepSeek R1 Distill Llama 70B 是一个基于 Llama-3.3-70B-Instruct 的蒸馏大型语言模型,使用了 DeepSeek R1 的输出。该模型结合了先进的蒸馏技术,以在多个基准测试中实现高性能,包括:AIME 2024 p...

DeepSeek: R1 Distill Llama 70B (free)
DeepSeek
128K context $0 input tokens $0 output tokens
FREE

Qwen 的增强型大型视觉语言模型。显著升级了详细识别能力和文本识别能力,支持高达数百万像素的超高像素分辨率和极端宽高比的图像输入。它在广泛的视觉任务中提供了显著的性能。 ...

Qwen: Qwen VL Plus (free)
Qwen
7.32K context $0 input tokens $0 output tokens
Tags
Type something to search...