Models

Perplexity: R1 1776

R1 1776 是 DeepSeek-R1 的一个版本，经过后期训练以去除与中国政府限制主题相关的审查约束。该模型保留了其原有的推理能力，同时对更广泛的查询提供直接响应。R1 1776 是一个离线聊天模型，不使用困惑度搜索子系统。该模型在一个包含超过 1,000 个示例的多语言数据集上进行了测试，涵盖敏感主题，以测量其拒绝或过度过滤响应的可能性。 [评估结果](https://cdn-upl ...

Perplexity 125K context $2/M input tokens $8/M output tokens

20% OFF

OpenAI: o3 Mini High

Text 2 text

# Discount

OpenAI o3-mini-high 是与 o3-mini 相同的模型，但推理努力设置为高。 o3-mini 是一种具有成本效益的语言模型，针对 STEM 推理任务进行了优化，特别是在科学、数学和编码方面表现出色。该模型具有三个可调的推理努力级别，并支持关键开发者功能，包括函数调用、结构化输出和流式传输，但不包括视觉处理能力。该模型在其前身的基础上显 ...

OpenAI 195.31K context $1.1/M input tokens $4.4/M output tokens

20% OFF

DeepSeek: R1

Text 2 text

# Hot # Discount

DeepSeek-R1 1. 介绍我们介绍我们的第一代推理模型，DeepSeek-R1-Zero 和 DeepSeek-R1。 DeepSeek-R1-Zero 是通过大规模强化学习（RL）训练的模型，没有经过监督微调（SFT）作为初步步骤，表现出卓越的推理能力。通过 RL，DeepSeek-R1-Zero 自然展现出许多强大且有趣的推理行为。然而，DeepSeek-R ...

DeepSeek 160K context $3/M input tokens $8/M output tokens

Google: Gemini Flash 2.0

Text image 2 text

Gemini Flash 2.0 提供了显著更快的首次令牌时间（TTFT），相比于 Gemini Flash 1.5，同时保持与更大模型如 Gemini Pro 1.5 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体 ...

Google 976.56K context $0.1/M input tokens $0.4/M output tokens

DeepSeek: DeepSeek R1 Distill Llama 70B

Text 2 text

DeepSeek R1 Distill Llama 70B 是一个基于 Llama-3.3-70B-Instruct 的蒸馏大型语言模型，使用了 DeepSeek R1 的输出。该模型结合了先进的蒸馏技术，以在多个基准测试中实现高性能，包括：AIME 2024 p...

DeepSeek 128K context $0.23/M input tokens $0.69/M output tokens

Sao10K: Llama 3 8B Lunaris

Text 2 text

Lunaris 8B 是一个基于 Llama 3 的多功能通用和角色扮演模型。它是多个模型的战略合并，旨在平衡创造力与改进的逻辑和一般知识。由 Sao10k 创建，该模型旨在提供比 Stheno v3.2 更好的体验，具有增强的创造力和逻辑推理能力。为了获得最佳效果，请使用 Llama 3 Instruct 上下文模板，温 ...

Rifx.Online 8K context $0.03/M input tokens $0.06/M output tokens

Inflatebot: Mag Mell R1 12B

Text 2 text

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并，使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型，结合了许多其他模型的最佳部分，成为许多用例的通用解决方案。旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成：Hero (RP, trop...

Rifx.Online 15.63K context $0.9/M input tokens $0.9/M output tokens

Meta: Llama 3.3 70B Instruct

Text 2 text

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型，参数为 70B（文本输入/文本输出）。Llama 3.3 指令调优的文本模型专为多语言对话用例优化，并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。支持的语言：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta Llama 128K context $0.13/M input tokens $0.4/M output tokens

text-embedding-3-small

Embedding

text-embedding-3-small 是 OpenAI 推出的经济型文本嵌入模型，它是 text-embedding-3 系列中的轻量级版本。这个模型在保持较好性能的同时，提供了更经济的价格选择。主要特性性价比高: 价格是 text-embedding-3-large 的约1/6 多语言支持: 同样支持100多种语言的文本嵌入 *上下文长度...

OpenAI $0.02/M input tokens $0 output tokens

Amazon: Nova Lite 1.0

Text image 2 text

Amazon Nova Lite 1.0 是亚马逊推出的一款非常低成本的多模态模型，专注于快速处理图像、视频和文本输入以生成文本输出。Amazon Nova Lite 可以高精度地处理实时客户交互、文档分析和视觉问答任务。在 300K tokens 的输入上下文下，它可以在单个输入中分析多个图像或长达 30 分钟的视频。 ...

Amazon 292.97K context $0.06/M input tokens $0.24/M output tokens

Toppy M 7B

Text 2 text

一个野生的 7B 参数模型，使用来自 mergekit 的新任务算术合并方法合并了多个模型。合并模型列表： NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonilia/AshhLimaRP-Mistral-7B...

Undi95 4K context $0.07/M input tokens $0.07/M output tokens

ReMM SLERP 13B

Text 2 text

对原始 MythoMax-L2-B13 的一次重现试验，但使用了更新的模型。 #merge ...

Undi95 4K context $1.125/M input tokens $1.125/M output tokens

Mistral: Pixtral 12B

Text image 2 text

Mistral AI 的第一个图像到文本模型。根据他们的传统，其权重通过 torrent 发布： https://x.com/mistralai/status/1833758285167722836 ...

MistralAI 4K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Phi-3.5 Mini 128K Instruct

Text 2 text

Phi-3.5 模型是轻量级的、最先进的开放模型。这些模型使用 Phi-3 数据集进行训练，该数据集包括合成数据和经过筛选的公开可用网站数据，重点关注高质量和推理密集特性。Phi-3.5 Mini 使用 3.8B 参数，是一个密集的仅解码器变换器模型，使用与 Phi-3 Mini 相同的分词器。这些模型经过严格的增 ...

Microsoft Azure 125K context $0.1/M input tokens $0.1/M output tokens

OpenAI: ChatGPT-4o

Text image 2 text

动态模型持续更新至 ChatGPT 中的当前版本 GPT-4o。旨在用于研究和评估。注意：该模型目前处于实验阶段，不适合生产使用场景，可能会受到严格的速率限制。 ...

OpenAI 125K context $5/M input tokens $15/M output tokens $0.007/M image tokens

Models

Perplexity: R1 1776

OpenAI: o3 Mini High

DeepSeek: R1

Google: Gemini Flash 2.0

DeepSeek: DeepSeek R1 Distill Llama 70B

Sao10K: Llama 3 8B Lunaris

Inflatebot: Mag Mell R1 12B

Meta: Llama 3.3 70B Instruct

text-embedding-3-small

Amazon: Nova Lite 1.0

Toppy M 7B

ReMM SLERP 13B

Mistral: Pixtral 12B

Phi-3.5 Mini 128K Instruct

OpenAI: ChatGPT-4o

Categories

Tags