Type something to search...

Models

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的提升。 Hermes 3 70B 是一个具有竞争力的微调版本,甚至可以说优于 [Llama-3.1 70B 基础模型](/meta-llama/l ...

Nous: Hermes 3 70B Instruct
NousreSearch
128K context $0.4/M input tokens $0.4/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的改进。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调,专注于将 LLM 与用户对齐,赋予最终用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 的能力基础上进行了构建和扩 ...

Nous: Hermes 3 405B Instruct
NousreSearch
128K context $1.79/M input tokens $2.49/M output tokens
FREE

Llama 3.2 11B Vision 是一个具有 110 亿参数的多模态模型,旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,弥合了语言生成与视觉推理之间的差距。该模型在一个庞大的图像-文本对数据集上进行了预训练,能够在复杂的高精度图像分析中表现良好。 它将视觉理解与语言处理相结合的能力,使其成为需要全面视觉-语言 AI 应用的行业的理想解决方案,例如内容创作、A ...

Meta: Llama 3.2 11B Vision Instruct (free)
Meta Llama
128K context $0 input tokens $0 output tokens $0.079/K image tokens

Llama 3.2 11B Vision 是一个具有 110 亿参数的多模态模型,旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,弥合了语言生成与视觉推理之间的差距。该模型在一个庞大的图像-文本对数据集上进行了预训练,能够在复杂的高精度图像分析中表现良好。 它将视觉理解与语言处理相结合的能力,使其成为需要全面视觉-语言 AI 应用的行业的理想解决方案,例如内容创作、A ...

Meta: Llama 3.2 11B Vision Instruct
Meta Llama
128K context $0.055/M input tokens $0.055/M output tokens $0.079/K image tokens

Lumimaid v0.2 8B 是对 Llama 3.1 8B 的微调,与 Lumimaid v0.1 相比,在数据集方面有了“巨大的提升”。不规范的聊天输出已被清除。 使用此模型需遵循 Meta 的可接受使用政策。 ...

Lumimaid v0.2 8B
Meta Llama
128K context $0.188/M input tokens $1.125/M output tokens

GPT-4o(“o”代表“全能”)是OpenAI最新的AI模型,支持文本和图像输入,并输出文本。它保持了GPT-4 Turbo的智能水平,同时速度是其两倍,成本效益提高了50%。GPT-4o在处理非英语语言和增强视觉能力方面也提供了更好的性能。 为了与其他模型进行基准测试,它曾被暂时称为["im-also-a-good-gpt2-chatbot"] ...

GPT-4o
OpenAI
125K context $2.5/M input tokens $10/M output tokens $0.004/M image tokens

GPT-4o(“o”代表“全能”)是OpenAI最新的AI模型,支持文本和图像输入,并输出文本。它保持了GPT-4 Turbo的智能水平,同时速度是其两倍,成本效益提高了50%。GPT-4o在处理非英语语言和增强视觉能力方面也提供了更好的性能。 为了与其他模型进行基准测试,它曾被暂时称为["im-also-a-good-gpt2-chatbot"] ...

OpenAI: GPT-4o
OpenAI
125K context $2.5/M input tokens $10/M output tokens $0.004/M image tokens

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型,支持文本和图像输入,并提供文本输出。 作为他们最先进的小型模型,它的价格比其他最近的前沿模型便宜了许多,且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能,同时在成本效益上显著更高。 GPT-4 ...

OpenAI: GPT-4o-mini
OpenAI
125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

Gemini 1.5 Flash-8B 针对速度和效率进行了优化,在聊天、转录和翻译等小提示任务中提供了增强的性能。由于延迟降低,它在实时和大规模操作中非常有效。该模型专注于具有成本效益的解决方案,同时保持高质量的结果。 [点击这里了解更多关于该模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-gener ...

Google: Gemini 1.5 Flash-8B
Google
976.56K context $0.037/M input tokens $0.15/M output tokens

Inflection 3 的生产力经过优化,以便更好地遵循指令。它更适合需要 JSON 输出或严格遵循提供的指南的任务。 有关类似于 Pi 的情感智能,请参见 Inflect 3 Pi。 有关更多详细信息,请参见 Inflection 的公告。 ...

Inflection: Inflection 3 Productivity
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Inflection 3 Pi 功能强大的 Inflection 的 Pi 聊天机器人,包括背景故事、情感智能、生产力和安全性。它在客户支持、角色扮演和情感智能等场景中表现出色。 ...

Inflection: Inflection 3 Pi
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Qwen2.5 7B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学方面的能力大幅提升,这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出(尤其是 JSON)方面有显著改进。对系统提示的多样性更具韧性,增强了角色扮演的实...

Qwen2.5 7B Instruct
Qwen
128K context $0.27/M input tokens $0.27/M output tokens

Rocinante 12B 旨在提供引人入胜的叙事和丰富的散文。 早期测试者报告称:词汇量扩大,独特而富有表现力的用词选择 创造力增强,能够创作生动的叙述 冒险满满且引人入胜的故事...

Rocinante 12B
Thedrummer
32K context $0.25/M input tokens $0.5/M output tokens

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型,优化用于高级自然语言处理任务,如对话生成、推理和摘要。该模型采用最新的 transformer 架构,支持包括英语、西班牙语和印地语在内的八种语言,并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练,擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语言环境中进行文本生成时的准确 ...

Meta: Llama 3.2 3B Instruct
Meta Llama
128K context $0.03/M input tokens $0.05/M output tokens
FREE

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型,优化用于高级自然语言处理任务,如对话生成、推理和摘要。该模型采用最新的 transformer 架构,支持包括英语、西班牙语和印地语在内的八种语言,并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练,擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语言环境中进行文本生成时的准确 ...

Meta: Llama 3.2 3B Instruct (free)
Meta Llama
128K context $0 input tokens $0 output tokens
Tags