Models

Anthropic: Claude 3.5 Sonnet (2024-06-20)

Claude 3.5 Sonnet 提供了超越 Opus 的能力，以比 Sonnet 更快的速度，且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色：编码：自主编写、编辑和运行代码，具备推理和故障排除能力数据科学：增强人类的数据科学专业知识；在使用多种工具获取洞察的同时，能够处理非结构化数据视觉处理：擅长解读图表、图形和图像，准确转录文本，以获取超越文本本身的...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Meta: Llama 3.2 1B Instruct

Text 2 text

Llama 3.2 1B 是一个拥有 10 亿参数的语言模型，专注于高效执行自然语言任务，如摘要、对话和多语言文本分析。其较小的体积使其能够在低资源环境中高效运行，同时保持强大的任务性能。支持八种核心语言，并可进行微调以支持更多，Llama 1.3B 非常适合寻求轻量级但强大的 AI 解决方案的企业或开发者，这些解决方案能够在多样的多语言环境中运行，而不需要大型模型的高计算需求。点击这里 ...

Meta Llama 128K context $0.01/M input tokens $0.02/M output tokens

Qwen: QwQ 32B Preview

Text 2 text

介绍 QwQ-32B-Preview 是由 Qwen 团队开发的实验研究模型，旨在提升 AI 推理能力。作为预览版本，它展示了有前景的分析能力，但也存在几个重要的局限性：语言混合和代码切换：该模型可能会意外混合语言或在语言之间切换，从而影响响应的清晰度。递归推理循环：该模型可能会进入循环推理模式，导致响应冗长而没有结论性答案。 **安全和伦...

Qwen 32K context $0.15/M input tokens $0.6/M output tokens

Google: Gemini 2.0 Flash Experimental

Text 2 text

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT)，同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google 976.56K context $0.2/M input tokens $0.6/M output tokens

FREE

Google: Gemini 2.0 Flash Experimental (free)

Text 2 text

# Free

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT)，同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google 976.56K context $0 input tokens $0 output tokens

FREE

DeepSeek: R1 (free)

Text 2 text

# Free

DeepSeek R1 已经发布：性能与 OpenAI o1 相当，但为开源且具有完全开放的推理令牌。它的参数量为 671B，在推理过程中活跃的参数为 37B。完全开源模型 & 技术报告。 MIT 许可证：自由提炼和商业化！ ...

DeepSeek 160K context $0 input tokens $0 output tokens

FREE

Meta: Llama 3.3 70B Instruct (free)

Text 2 text

# Free

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型，参数为 70B（文本输入/文本输出）。Llama 3.3 指令调优的文本模型专为多语言对话用例优化，并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。支持的语言：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta Llama 128K context $0 input tokens $0 output tokens

FREE

NVIDIA: Llama 3.1 Nemotron 70B Instruct (free)

Text 2 text

# Free

NVIDIA的Llama 3.1 Nemotron 70B是一个旨在生成精确和有用响应的语言模型。利用Llama 3.1 70B架构和基于人类反馈的强化学习（RLHF），它在自动对齐基准测试中表现出色。该模型专为需要高准确性的有用性和响应生成的应用而设计，适合处理多个领域的多样化用户查询。使用此模型须遵 ...

NVIDIA 128K context $0 input tokens $0 output tokens

FREE

Qwen: Qwen2.5 VL 72B Instruct (free)

Text image 2 text

# Free

Qwen2.5-VL 擅长识别常见物体，如花、鸟、鱼和昆虫。它还非常擅长分析文本、图表、图标、图形和图像中的布局。 ...

Qwen 128K context $0 input tokens $0 output tokens

FREE

Google: Gemini 2.0 Flash Thinking Experimental (free)

Text image 2 text

# Free

Gemini 2.0 Flash Thinking Mode 是一个实验性模型，旨在生成模型在响应过程中经历的“思维过程”。因此，Thinking Mode 在响应中的推理能力比基础 Gemini 2.0 Flash 模型更强。 ...

Google 39.06K context $0 input tokens $0 output tokens

FREE

Rogue Rose 103B v0.2 (free)

Text 2 text

# Free

Rogue Rose 在角色扮演和故事讲述应用中展现出强大的能力，可能在 103-120B 参数范围内超越其他模型。虽然它偶尔表现出与场景逻辑的不一致，但整体互动质量代表了自然语言处理在创意应用方面的进步。它是一个 120 层的 frankenmerge 模型，结合了来自 2023 年 11 月的两个定制 70B 架构，源自 [xwin-stellarbright-erp-70b-v2](h ...