Chatbots

Google: Gemini 2.0 Flash Experimental

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT)，同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google 976.56K context $0.2/M input tokens $0.6/M output tokens

我对 2025 年人工智能的五大预测

我对 2025 年人工智能的五大预测

Rifx.Online
Autonomous Systems , Chatbots , Predictive Analytics
26 Dec, 2024

以及一些非预测正确预测未来是具有挑战性的。问一下——以一个广为人知的流行文化偶像为例——汉娜和巴贝拉，杰森一家（The Jetsons）的创作者，他们想象了一个有飞行汽车和机器人女佣的未来，但没有想到互联网或智能手机会出现在我们的未来。特别是在AI领域，许多失败的过于乐观的预测也导致了失望，最终出现了所谓的“AI寒冬”，即AI资金枯竭的时期。整个领域从公众视野中退回到不为人知的研

Inflatebot: Mag Mell R1 12B

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并，使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型，结合了许多其他模型的最佳部分，成为许多用例的通用解决方案。旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成：Hero (RP, trop...

Rifx.Online 15.63K context $0.9/M input tokens $0.9/M output tokens

FREE

Google: Gemini 2.0 Flash Thinking Experimental (free)

Text image 2 text

Gemini 2.0 Flash Thinking Mode 是一个实验性模型，旨在生成模型在响应过程中所经历的“思维过程”。因此，Thinking Mode 在其响应中具备比基础 Gemini 2.0 Flash 模型更强的推理能力。 ...

Google 39.06K context $0 input tokens $0 output tokens

50% OFF

EVA Llama 3.33 70b

EVA Llama 3.33 70b 是一个角色扮演和故事创作的专业模型。它是对 Llama-3.3-70B-Instruct 在合成数据和自然数据混合上的全参数微调。它使用了 Celeste 70B 0.1 数据混合，极大地扩展了数据，以提高模型的多样性、创造力和“风味”。 ...

Eva unit 01 16K context $4/M input tokens $6/M output tokens

Sao10K: Llama 3.3 Euryale 70B

Euryale L3.3 70B 是一个专注于创意角色扮演的模型，来自 Sao10k。它是 Euryale L3 70B v2.2 的继任者。 ...

Rifx.Online 7.81K context $1.5/M input tokens $1.5/M output tokens

什么是人工智能代理？从虚拟助理到智能决策者

什么是人工智能代理？从虚拟助理到智能决策者

Rifx.Online
Chatbots , Autonomous Systems , Machine Learning
15 Dec, 2024

从零开始理解AI代理的指南最近，从基于LLM的聊天机器人转向该领域现在定义为代理系统或代理AI的变化可以用一句老话来总结：“少说多做。” 跟上技术进步可能令人畏惧，尤其是当你已经有一个现有的业务时。更不用说技术进步的速度和复杂性可能会让你感觉像是开学的第一天。本文提供了基于其组件和特征的AI代理概述。引言部分涵盖了构成“AI代理”一词的组件，以创建一个直观的定义。在建立

70% OFF

nova-micro

Amazon Nova Micro 1.0 是一个仅支持文本的模型，能够以非常低的成本在 Amazon Nova 系列模型中提供最低延迟的响应。它的上下文长度为 128K tokens，并针对速度和成本进行了优化，Amazon Nova Micro 在文本摘要、翻译、内容分类、互动聊天和头脑风暴等任务中表现出色。它具有简单的数学推理和编码能力。 ...

Amazon 125K context $0.03/M input tokens $0.14/M output tokens $0.053/K image tokens

gemini-exp-1206

Text image 2 text

实验性版本（2024年12月6日）发布的 Gemini。 ...

Google 8K context $4/M input tokens $16/M output tokens

Meta: Llama 3.3 70B Instruct

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型，参数为 70B（文本输入/文本输出）。Llama 3.3 指令调优的文本模型专为多语言对话用例优化，并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。支持的语言：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta Llama 128K context $0.13/M input tokens $0.4/M output tokens

Magnum v4 72B

这是一个系列模型，旨在复制Claude 3模型的散文质量，特别是Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet)和Opus(https://openrouter.ai/anthropic/claude-3-opus)。该模型是在[Qwen2.5 72B](https://openrouter.ai/qwen/qwen-2.5- ...

Anthracite org 32K context $1.875/M input tokens $2.25/M output tokens

baichuan3-turbo

Baichuan3-Turbo 是一款先进的人工智能语言模型，旨在为用户提供高效、智能的自然语言处理解决方案。该模型结合了最新的深度学习技术，具有强大的文本生成和理解能力，可以广泛应用于对话系统、内容创作、信息检索等领域。主要特点：高效性：Baichuan3-Turbo 采用优化算法，使得处理速度显著提升，能够快速响应用户请求。多样性：该模型支持多...

Baichuan 31.25K context $1.7/M input tokens $1.7/M output tokens

baichuan4

Baichuan4 模型介绍 Baichuan4 是一款先进的人工智能语言模型，旨在增强自然语言理解和生成能力。该模型基于前沿的深度学习技术，适用于从对话AI和内容创作到数据分析和客户支持等多种应用场景。主要特点：性能提升：Baichuan4 采用先进算法优化处理效率，实现更快的响应时间和更高质量的互动体验。多语言支持：该模型能够理解和...

Baichuan 31.25K context $14.3/M input tokens $14.3/M output tokens

moonshot-v1-8k

Moonshot-v1-8k 模型介绍 Moonshot-v1-8k 是一款由 Moonshot AI 开发的大型语言模型，具备卓越的自然语言处理能力。该模型采用了先进的深度学习技术，通过大量文本数据的训练，能够理解和生成自然语言，为用户提供高效、智能的交互体验。主要特点：强大的语义理解：Moonshot-v1-8k 在语义理解方面表现出色，能够准确解析...

Moonshot 7.81K context $1.9/M input tokens $1.9/M output tokens

Amazon: Nova Micro 1.0

Amazon Nova Micro 1.0 是一个仅支持文本的模型，能够以非常低的成本在 Amazon Nova 系列模型中提供最低延迟的响应。它的上下文长度为 128K tokens，并针对速度和成本进行了优化，Amazon Nova Micro 在文本摘要、翻译、内容分类、互动聊天和头脑风暴等任务中表现出色。它具有简单的数学推理和编码能力。 ...

Amazon 125K context $0.035/M input tokens $0.14/M output tokens $0.053/K image tokens

40% OFF

Claude-3-Haiku-20240307

Text image 2 text

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型，提供近乎即时的响应能力。快速且准确的针对性表现。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $0.5/M input tokens $2.5/M output tokens $0.4/K image tokens

探索类比数据配色方案的人工智能生成建议

探索类比数据配色方案的人工智能生成建议

Rifx.Online
Generative AI , Color Vision , Data Science
05 Dec, 2024

类比色彩和谐是指在色轮上相邻的至少三种颜色。这种色彩方案可以创造出令人愉悦的色彩组合，但在应用于数据可视化时，可能会面临色盲测试不合格的风险。生成式AI能否通过提供通过色彩缺陷测试的类比建议来帮助数据色彩方案设计？在这里，我将探讨这个问题。让我们首先更详细地回顾一下类比色彩和谐、色彩缺陷以及生成式AI系统的概念。类比色彩和谐：色彩和谐是选择在色轮上能很好地配合在一起的颜色

GPT-4o mini

Text image 2 text

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

40% OFF

GPT-4o mini

Text image 2 text

# Discount # 40%Off # Discount

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

40% OFF

Claude 3.5 Sonnet-20240620

Text image 2 text

# Discount # 40%Off # Discount

Claude 3.5 Sonnet 提供了超越 Opus 的能力，以比 Sonnet 更快的速度，且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色：编码：自主编写、编辑和运行代码，具备推理和故障排除能力数据科学：增强人类的数据科学专业知识；在使用多种工具获取洞察的同时，能够处理非结构化数据视觉处理：擅长解读图表、图形和图像，准确转录文本，以获取超越文本本身...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

MythoMax 13B (extended)

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $1.125/M input tokens $1.125/M output tokens

FREE

MythoMax 13B (free)

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $0 input tokens $0 output tokens

Google: PaLM 2 Code Chat 32k

PaLM 2 针对帮助解决代码相关问题的聊天机器人对话进行了微调。 ...

Google 31.99K context $1/M input tokens $2/M output tokens

01.AI: Yi Large

Yi Large 模型由 01.AI 设计，考虑了以下用例：知识搜索、数据分类、人类聊天机器人和客户服务。它以其多语言能力而脱颖而出，特别是在西班牙语、中文、日语、德语和法语方面。查看发布公告以了解更多信息。 ...

01 ai 32K context $3/M input tokens $3/M output tokens

Mistral Large 2411

这是 Mistral AI 的旗舰模型，Mistral Large 2（版本 mistral-large-2407）。它是一个专有的可用权重模型，擅长推理、代码、JSON、聊天等。请在这里阅读发布公告。它支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在 ...

MistralAI 125K context $2/M input tokens $6/M output tokens

Mistral Large 2407

这是 Mistral AI 的旗舰模型，Mistral Large 2（版本 mistral-large-2407）。它是一个专有的可用权重模型，擅长推理、代码、JSON、聊天等。请在这里阅读发布公告。它支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在 ...

MistralAI 125K context $2/M input tokens $6/M output tokens

Perplexity: Llama 3.1 Sonar 70B

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。这是一个正常的离线 LLM，但该模型的在线版本具有互联网访问功能。 ...

Perplexity 128K context $1/M input tokens $1/M output tokens

Perplexity: Llama 3.1 Sonar 8B

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。这是一个普通的离线 LLM，但该模型的在线版本具有互联网访问权限。 ...

Perplexity 128K context $0.2/M input tokens $0.2/M output tokens

OpenAI: GPT-3.5 Turbo 16k (older v1106)

一个较旧的 GPT-3.5 Turbo 模型，具备改进的指令跟随能力、JSON 模式、可重复的输出、并行函数调用等功能。训练数据：截至 2021 年 9 月。 ...

OpenAI 16K context $1/M input tokens $2/M output tokens

Meta: LlamaGuard 2 8B

该安全模型具有8B参数，并基于Llama 3系列。与其前身LlamaGuard 1一样，它可以进行提示和响应分类。 LlamaGuard 2的功能类似于普通的LLM，生成文本以指示给定的输入/输出是否安全。如果被认为不安全，它还会分享违反的内容类别。为了获得最佳效果，请使用原始提示输入或` ...

Meta Llama 8K context $0.18/M input tokens $0.18/M output tokens

Mistral Small

成本效益高、快速且可靠的选项，适用于翻译、摘要和情感分析等用例。 ...

MistralAI 31.25K context $0.2/M input tokens $0.6/M output tokens

Mistral Tiny

该模型目前由 Mistral-7B-v0.2 提供支持，并结合了比 Mistral 7B 更“优秀”的微调，灵感来自社区的工作。它最适合用于大批量处理任务，在这些任务中，成本是一个重要因素，但推理能力并不是关键。 ...

MistralAI 31.25K context $0.25/M input tokens $0.25/M output tokens

Google: Gemini Pro 1.0

Google 的旗舰文本生成模型。旨在处理自然语言任务、多轮文本和代码聊天，以及代码生成。请参阅来自 Deepmind 的基准测试和提示指南。使用 Gemini 需遵循 Google 的 Gemini 使用条款。 ...

Google 31.99K context $0.5/M input tokens $1.5/M output tokens $0.003/M image tokens

Goliath 120B

一个大型 LLM 通过将两个微调的 Llama 70B 模型合并成一个 120B 模型而创建。结合了 Xwin 和 Euryale。致谢@chargoddard 开发了用于合并模型的框架 - mergekit。 [@Undi95](h...

Alpindale 6K context $9.375/M input tokens $9.375/M output tokens

Nous: Hermes 3 405B Instruct (free)

Hermes 3 是一个通用语言模型，相较于 Hermes 2 有许多改进，包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的改进。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调，专注于将 LLM 与用户对齐，赋予最终用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 的能力基础上进行了构建和 ...

NousreSearch 128K context $0 input tokens $0 output tokens

WizardLM-2 7B

WizardLM-2 7B 是微软 AI 最新 Wizard 模型的较小变体。它是最快的，并且在性能上与现有的 10 倍大开源领先模型相当。它是对 Mistral 7B Instruct 的微调，使用与 WizardLM-2 8x22B 相同的技术。要了解更多 ...

Microsoft Azure 31.25K context $0.055/M input tokens $0.055/M output tokens

AI21: Jamba Instruct

The Jamba-Instruct model, introduced by AI21 Labs, is an instruction-tuned variant of their hybrid SSM-Transformer Jamba model, specifically optimized for enterprise applications.256K Context Win...

Ai21 250K context $0.5/M input tokens $0.7/M output tokens

Llama 3 Euryale 70B v2.1

Euryale 70B v2.1 是一个专注于创意角色扮演的模型，来自 Sao10k。更好的提示遵循性。更好的解剖学/空间意识。更好地适应独特和自定义的格式/回复格式。非常有创意，很多独特的风格。在角色扮演过程中没有限制。...

Rifx.Online 8K context $0.35/M input tokens $0.4/M output tokens

Cohere: Command

Command 是一个遵循指令的对话模型，能够以更高的质量、更可靠地执行语言任务，并且比我们的基础生成模型具有更长的上下文。使用此模型须遵循 Cohere 的 Acceptable Use Policy. ...

Cohere 4K context $0.95/M input tokens $1.9/M output tokens

Cohere: Command R

Command-R 是一个 35B 参数模型，能够以更高的质量、更可靠的方式以及更长的上下文执行对话语言任务。它可以用于复杂的工作流程，如代码生成、检索增强生成（RAG）、工具使用和代理。阅读发布帖子 here。使用此模型须遵循 Cohere 的 [Acceptable Use Policy](https://do ...

Cohere 125K context $0.475/M input tokens $1.425/M output tokens

Google: Gemma 2 27B

Gemma 2 27B by Google 是一个开放模型，基于创建 Gemini models 所使用的相同研究和技术构建。 Gemma 模型非常适合各种文本生成任务，包括问答、摘要和推理。有关更多详细信息，请参阅 [launch announcement](https://blog.google/technology/developers/goo ...

Google 8K context $0.27/M input tokens $0.27/M output tokens

OpenAI: ChatGPT-4o

Text image 2 text

动态模型持续更新至 ChatGPT 中的当前版本 GPT-4o。旨在用于研究和评估。注意：该模型目前处于实验阶段，不适合生产使用场景，可能会受到严格的速率限制。 ...

OpenAI 125K context $5/M input tokens $15/M output tokens $0.007/M image tokens

Anthropic: Claude 3.5 Sonnet (2024-06-20)

Text image 2 text

Claude 3.5 Sonnet 提供了超越 Opus 的能力，以比 Sonnet 更快的速度，且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色：编码：自主编写、编辑和运行代码，具备推理和故障排除能力数据科学：增强人类的数据科学专业知识；在使用多种工具获取洞察的同时，能够处理非结构化数据视觉处理：擅长解读图表、图形和图像，准确转录文本，以获取超越文本本身的...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Anthropic: Claude 3.5 Haiku (2024-10-22)

Claude 3.5 Haiku 在所有技能领域（包括编码、工具使用和推理）中都有所增强。作为 Anthropic 系列中速度最快的模型，它提供快速的响应时间，适用于需要高交互性和低延迟的应用，如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色，使其成为广泛行业的多功能工具。它不支持图像输入。查看发布公告和基准测试结果 [here](https://ww ...

Anthropic 195.31K context $1/M input tokens $5/M output tokens

Anthropic: Claude 3 Opus

Text image 2 text

Claude 3 Opus 是 Anthropic 针对高度复杂任务推出的最强大模型。它具有顶级的性能、智能、流畅性和理解能力。查看发布公告和基准测试结果这里 #multimodal ...

Anthropic 195.31K context $15/M input tokens $75/M output tokens $0.024/M image tokens

Anthropic: Claude 3 Haiku

Text image 2 text

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型，提供近乎即时的响应能力。快速且准确的针对性表现。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $0.25/M input tokens $1.25/M output tokens $0.4/K image tokens

Anthropic: Claude 3.5 Haiku

Claude 3.5 Haiku 在所有技能领域（包括编码、工具使用和推理）中都有所增强。作为 Anthropic 系列中速度最快的模型，它提供快速的响应时间，适用于需要高交互性和低延迟的应用，如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色，使其成为广泛行业的多功能工具。它不支持图像输入。查看发布公告和基准测试结果 [here](https://ww ...

Anthropic 195.31K context $1/M input tokens $5/M output tokens

Anthropic: Claude 3.5 Sonnet

Text image 2 text

Claude 3.5 Sonnet 提供了超越 Opus 的能力，以比 Sonnet 更快的速度，且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色：编码：自主编写、编辑和运行代码，具备推理和故障排除能力数据科学：增强人类的数据科学专业知识；在使用多种工具获取洞察的同时，能够处理非结构化数据视觉处理：擅长解读图表、图形和图像，准确转录文本，以获取超越文本本身的...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

AI21: Jamba 1.5 Large

Jamba 1.5 Large 是 AI21 新一代开放模型家族的一部分，提供卓越的速度、效率和质量。它具有 256K 的有效上下文窗口，是开放模型中最长的，能够在文档摘要和分析等任务上提升性能。基于新颖的 SSM-Transformer 架构，它在基准测试中超越了更大的模型，如 Llama 3.1 70B，同时保持资源效率。阅读他们的 [announcement](https:// ...

Ai21 250K context $2/M input tokens $8/M output tokens

Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 是一个专注于创意角色扮演的模型，来自 Sao10k。它是 Euryale L3 70B v2.1 的继任者。 ...

Rifx.Online 8K context $0.35/M input tokens $0.4/M output tokens

Nous: Hermes 3 70B Instruct

Hermes 3 是一个通用语言模型，相较于 Hermes 2 有许多改进，包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的提升。 Hermes 3 70B 是一个具有竞争力的微调版本，甚至可以说优于 [Llama-3.1 70B 基础模型](/meta-llama/l ...

NousreSearch 128K context $0.4/M input tokens $0.4/M output tokens

Nous: Hermes 3 405B Instruct

Hermes 3 是一个通用语言模型，相较于 Hermes 2 有许多改进，包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的改进。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调，专注于将 LLM 与用户对齐，赋予最终用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 的能力基础上进行了构建和扩 ...

NousreSearch 128K context $1.79/M input tokens $2.49/M output tokens

OpenAI: GPT-4o-mini

Text image 2 text

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

Google: Gemini 1.5 Flash-8B

Text image 2 text

Gemini 1.5 Flash-8B 针对速度和效率进行了优化，在聊天、转录和翻译等小提示任务中提供了增强的性能。由于延迟降低，它在实时和大规模操作中非常有效。该模型专注于具有成本效益的解决方案，同时保持高质量的结果。 [点击这里了解更多关于该模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-gener ...

Google 976.56K context $0.037/M input tokens $0.15/M output tokens

Inflection: Inflection 3 Productivity

Inflection 3 的生产力经过优化，以便更好地遵循指令。它更适合需要 JSON 输出或严格遵循提供的指南的任务。有关类似于 Pi 的情感智能，请参见 Inflect 3 Pi。有关更多详细信息，请参见 Inflection 的公告。 ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Inflection: Inflection 3 Pi

Inflection 3 Pi 功能强大的 Inflection 的 Pi 聊天机器人，包括背景故事、情感智能、生产力和安全性。它在客户支持、角色扮演和情感智能等场景中表现出色。 ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Qwen2.5 7B Instruct

Qwen2.5 7B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学方面的能力大幅提升，这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出（尤其是 JSON）方面有显著改进。对系统提示的多样性更具韧性，增强了角色扮演的实...

Qwen 128K context $0.27/M input tokens $0.27/M output tokens

Rocinante 12B

Rocinante 12B 旨在提供引人入胜的叙事和丰富的散文。早期测试者报告称：词汇量扩大，独特而富有表现力的用词选择创造力增强，能够创作生动的叙述冒险满满且引人入胜的故事...

Thedrummer 32K context $0.25/M input tokens $0.5/M output tokens

Qwen2.5 72B Instruct

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学方面大幅提升了能力，这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出（特别是 JSON）方面有显著改进。对系统提示的多样性更具韧性，增强了角色扮演的...

Qwen 128K context $0.35/M input tokens $0.4/M output tokens

LangGraph：高级多代理工作流的未来

LangGraph：高级多代理工作流的未来

Rifx.Online
Programming , Machine Learning , Chatbots
25 Nov, 2024

人工智能的世界正在迅速发展，像 LangChain 和 LangGraph 这样的工具处于使开发者高效构建智能系统的前沿。如果你听说过 LangGraph，但不确定它是什么或如何充分利用它的潜力，这个指南适合你。在这篇全面的文章中，我们将涵盖你需要了解的关于 LangGraph 的所有内容——从其核心概念到实际应用。无论你是初学者还是高级开发者，这个指南将帮助你理解为什么 LangGra

Google: Gemini Experimental 1121 (free)

Text image 2 text

实验性版本（2024年11月21日）的 Gemini。 ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Google: LearnLM 1.5 Pro Experimental (free)

Text image 2 text

谷歌的 Gemini 1.5 Pro 实验版本。 ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Mistral Large 2411

Mistral Large 2 2411 是 Mistral Large 2 的更新版本，与 Pixtral Large 2411 一起发布。它流利地支持英语、法语、西班牙语、德语和意大利语，具有高语法准确性，并且其长上下文窗口允许从大型文档中精 ...

Rifx.Online 125K context $2/M input tokens $6/M output tokens

ERNIE-Bot-4.0

ERNIE Bot 概述关键能力和使用案例：进行互动对话，回答问题，并协助创意任务。促进高效的信息检索和知识生成。重要特性和改进：知识增强：利用海量数据和大规模知识提高理解能力。检索增强：提升有效检索相关信息的能力。对话增强：先进的对话能力，使用户能够进行有意义的互动。**技术 ...

Ernie bot 4.0 8K context $16.44/M input tokens $16.44/M output tokens

ERNIE-Lite-8K:free

关键能力和使用案例：设计用于资源受限的环境，如移动设备和边缘设备。适用于智能助手、语音识别以及智能家居中的本地处理。重要特性和改进：轻量级设计：优化结构，减少参数以降低计算和存储需求。知识蒸馏：将大模型的知识转移，以增强小参数模型的性能。多任务学习：支持多种自然语言处理任务，包括文本分类、...

Ernie 8K context $0 input tokens $0 output tokens

ERNIE-Bot-turbo

开发者/公司：百度概述： ERNIE Bot Turbo 是 ERNIE Bot 的增强版本，提供扩展的功能，支持 7K 输入 + 1K 输出。它包括系统设置和新的推理参数。 ERNIE Bot 特性：文学创作：总结核心内容并为文学作品建议续写角度；回答有关衍生品的事实问题。商业文案：创建富有创意和吸引力...

Ernie 8K context $1.65/M input tokens $1.65/M output tokens

ERNIE-4.0-8K

开发者/公司: 百度研究关键能力与应用案例: ERNIE-4.0-8K 在自然语言处理 (NLP) 中具有重要价值，适用于搜索引擎、智能客服、内容推荐和情感分析。特点与改进:多任务学习: 支持文本分类、情感分析和命名实体识别等任务。知识增强: 融入知识图谱以提升特定领域的表现。跨语言能力: 有效...

Ernie 8K context $5.48/M input tokens $16.44/M output tokens

ERNIE-Tiny-8K

开发者/公司: 百度团队概述: ERNIE-Tiny-8K 是一个轻量级的预训练语言模型，专为中文自然语言处理任务设计，结合了小巧的体积和快速的推理能力，同时具备高性能。特点与优势:轻量级设计: 减少参数和层数，实现更小的体积和更快的推理，同时保持性能。知识增强: 继承了 ERNIE 系列的知识整合，提升...

Ernie 8K context $0 input tokens $0 output tokens

ChatGPT 的未来解析：未来 5 年一切都将改变

ChatGPT 的未来解析：未来 5 年一切都将改变

Rifx.Online
Chatbots , Artificial General Intelligence , Reasoners
16 Nov, 2024

这可能会让人工智能走得更远…… OpenAI已经制定了一个清晰的愿景，来指导ChatGPT的演变，最近公布了一个五步路线图，以实现他们所称的人工通用智能（AGI）。 AGI代表一种理论上的人工智能系统，能够学习、理解和执行任何智力任务，其能力达到人类水平，且完全自主和适应性强。这是一个开创性的愿景，但实现这一雄心勃勃的目标需要经历

GLM-4 AirX

基本信息 “GLM-4-AIRX”是一种先进的大型语言模型，由人工智能领域的专家研发。它以其强大的自然语言处理能力著称，能够有效地理解和生成自然语言文本。此模型依赖于深度学习技术，特别是广泛应用于NLP（自然语言处理）领域的Transformer架构。技术特点 1. 基于Transformer架构该模型利用了Transformer架构， ...

ChatGLM 7.81K context $1.4/M input tokens $1.4/M output tokens

glm-4-flash

GLM-4-Flash 模型介绍关键能力和主要使用案例处理多轮对话、网络搜索和工具调用。支持长文本推理，上下文长度可达 128K，输出长度可达 4K。支持 26 种语言的多语言功能，包括中文、英语、日语、韩语和德语。最重要的特性和改进通过自适应权重量化、并行处理、批处理和推测采样优化速度。提供微调功能，以适应...

ChatGLM 125K context $0.01/M input tokens $0.01/M output tokens

glm-4-plus

GLM-4-Plus 模型介绍关键能力和主要使用案例语言理解：在语言理解、指令执行和长文本处理方面具有先进能力。多模态支持：包括文本到图像生成模型（CogView-3-Plus）、图像/视频理解模型（GLM-4V-Plus）和视频生成模型（CogVideoX）。跨模态交互：支持文本、音频和视频模态，如在青眼...

ChatGLM 125K context $7/M input tokens $7/M output tokens

Sorcererlm 8x22b

SorcererLM 是一个先进的 RP 和故事讲述模型，作为一个低秩 16 位 LoRA 在 WizardLM-2-8x22B 上进行微调。先进的推理和情感智能，实现引人入胜和沉浸式的互动生动的写作能力，增强了空间和上下文意识增强的叙事深度，促进创造性和动态的故事讲述...

Raifle 15.63K context $4.5/M input tokens $4.5/M output tokens

Eva Qwen2.5 32B

一个角色扮演/故事创作专用模型，针对合成数据和自然数据的混合进行全参数微调的Qwen2.5-32B。它使用Celeste 70B 0.1数据混合，极大地扩展了数据，提高了模型的多样性、创造力和“风味”。 ...

Eva unit 01 31.25K context $0.5/M input tokens $0.5/M output tokens

Unslopnemo 12b

UnslopNemo v4.1 是来自 Rocinante 创作者的最新作品，旨在用于冒险写作和角色扮演场景。 ...

Thedrummer 31.25K context $0.5/M input tokens $0.5/M output tokens

Anthropic: Claude 3.5 Haiku (2024-10-22)

Claude 3.5 Haiku 在所有技能领域中都进行了增强，包括编码、工具使用和推理。作为 Anthropic 系列中速度最快的模型，它提供快速的响应时间，适用于需要高交互性和低延迟的应用，如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色，使其成为广泛行业的多功能工具。它不支持图像输入。查看发布公告和基准测试结果 [he ...

Rifx.Online 195.31K context $1/M input tokens $5/M output tokens

Anthropic: Claude 3.5 Haiku

Claude 3.5 Haiku 特性提供了更高的速度、编码准确性和工具使用能力。旨在在实时应用中表现出色，它提供了快速的响应时间，这对于动态任务（如聊天互动和即时编码建议）至关重要。这使其非常适合需要速度和精度的环境，例如软件开发、客户服务机器人和数据管理系统。此模型当前指向 [Claude 3.5 Haiku (2024-10-22)](/anthropi ...

Anthropic 195.31K context $1/M input tokens $5/M output tokens

Google 发布 Gemma — 轻量级开源模型

Google 发布 Gemma — 轻量级开源模型

Rifx.Online
Natural Language Processing , Programming , Chatbots
29 Oct, 2024

在短短一周内，世界见证了两家科技巨头带来的最具突破性的AI进展。OpenAI推出了令人惊叹的AI视频生成器Sora，而谷歌则揭晓了其[Gemini 1.5模型](https://generativeai.pub/google-releases-gemini-1-5-with-1m-context-window-

Magnum v4 72B

这是一个系列模型，旨在复制Claude 3模型的散文质量，特别是Sonnet和Opus。该模型是在[Qwen2.5 72B]s的基础上进行微调的。 ...

Anthracite org 32K context $1.875/M input tokens $2.25/M output tokens

xAI: Grok Beta

Grok Beta 是 xAI 的实验性语言模型，具有最先进的推理能力，最适合复杂和多步骤的用例。它是 Grok 2 的继任者，具有增强的上下文长度。 ...

X ai 128K context $5/M input tokens $15/M output tokens

Qwen2.5 7B Instruct

Qwen2.5 7B 是 Qwen 大语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学方面的能力大幅提升，这得益于我们在这些领域的专业模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出，特别是 JSON 方面有显著改进。对系统提示的多样性更具韧...

Qwen 128K context $0.27/M input tokens $0.27/M output tokens

Inflection: Inflection 3 Pi

Inflection 3 Pi 的 Pi 聊天机器人，包含背景故事、情感智能、生产力和安全性。它在客户支持、角色扮演和情感智能等场景中表现出色。 ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Inflection: Inflection 3 Productivity

Inflection 3 的生产力经过优化，以便更好地遵循指令。它更适合需要 JSON 输出或精确遵循提供的指导方针的任务。有关类似于 Pi 的情感智能，请参见 Inflect 3 Pi。有关更多详细信息，请参见 [Inflection 的公告](https://inflection.ai/blog ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Google: Gemini 1.5 Flash-8B

Text image 2 text

Gemini 1.5 Flash-8B 针对速度和效率进行了优化，在聊天、转录和翻译等小提示任务中提供了增强的性能。通过减少延迟，它在实时和大规模操作中非常有效。该模型专注于成本效益解决方案，同时保持高质量的结果。 [点击此处了解更多关于此模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-i ...

Google 976.56K context $0.037/M input tokens $0.15/M output tokens

EVA Qwen2.5 14B

一个专注于角色扮演和创意写作的模型，该模型基于 Qwen2.5-14B，经过合成数据和自然数据的混合微调。它在 1.5M 令牌的角色扮演数据上进行训练，并在 1.5M 令牌的合成数据上进行微调。 ...

Eva unit 01 32K context $0.25/M input tokens $0.5/M output tokens

Rocinante 12B

Rocinante 12B 旨在提供引人入胜的叙事和丰富的散文。早期测试者报告：词汇量扩展，独特且富有表现力的用词选择创造力增强，能够生动叙述充满冒险和引人入胜的故事...

Thedrummer 32K context $0.25/M input tokens $0.5/M output tokens

Meta: Llama 3.2 3B Instruct

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型，针对对话生成、推理和摘要等高级自然语言处理任务进行了优化。它采用最新的 transformer 架构，支持包括英语、西班牙语和印地语在内的八种语言，并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练，擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语 ...

Meta llama 128K context $0.03/M input tokens $0.05/M output tokens

Meta: Llama 3.2 3B Instruct (free)

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型，针对对话生成、推理和摘要等高级自然语言处理任务进行了优化。该模型采用最新的 Transformer 架构，支持包括英语、西班牙语和印地语在内的八种语言，并可适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练，擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语 ...

Rifx.Online 4K context $0 input tokens $0 output tokens

Qwen2.5 72B Instruct

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学能力上有了很大提升，这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出（特别是 JSON）方面有显著改进。对系统提示的多样...

Qwen 128K context $0.35/M input tokens $0.4/M output tokens

Lumimaid v0.2 8B

Lumimaid v0.2 8B 是对 Llama 3.1 8B 的微调，相较于 Lumimaid v0.1，数据集有了“巨大的提升”。不当的聊天输出已被清除。使用此模型须遵循 [Meta 的可接受使用政策](https://llama.meta.com/llama3/use-policy/ ...

Neversleep 128K context $0.188/M input tokens $1.125/M output tokens

Google: Gemini Flash 8B 1.5 Experimental

Text image 2 text

Gemini 1.5 Flash 8B Experimental 是 Gemini 1.5 Flash 模型的实验性 8B 参数版本。使用 Gemini 需遵循 Google 的 Gemini 使用条款。 #multimodal 注意：该模型目 ...

Google 976.56K context $0 input tokens $0 output tokens

Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 是一个专注于创意角色扮演的模型，来自 Sao10k。它是 Euryale L3 70B v2.1 的继任者。 ...

Sao10k 8K context $0.35/M input tokens $0.4/M output tokens

Nous: Hermes 3 70B Instruct

Hermes 3 是一个通用语言模型，相较于 Hermes 2 有许多改进，包括先进的代理能力，更好的角色扮演，推理，多轮对话，长上下文连贯性，以及各方面的改进。 Hermes 3 70B 是一个具有竞争力的微调版本，甚至可以说是 [Llama-3.1 70B 基础模型](/ ...

Nousresearch 128K context $0.4/M input tokens $0.4/M output tokens

Nous: Hermes 3 405B Instruct

Hermes 3 是一个通用语言模型，相较于 Hermes 2 有许多改进，包括先进的代理能力、显著更好的角色扮演、推理、多轮对话、长上下文一致性以及各方面的提升。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调，专注于将 LLM 与用户对齐，赋予终端用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 ...

Nousresearch 128K context $1.79/M input tokens $2.49/M output tokens

OpenAI: ChatGPT-4o

Text image 2 text

动态模型持续更新到 ChatGPT 中的当前版本 GPT-4o。旨在用于研究和评估。注意：此模型目前处于实验阶段，不适合生产使用，并可能受到严格的速率限制。 ...

Openai 125K context $5/M input tokens $15/M output tokens $0.007/M image tokens

Perplexity: Llama 3.1 Sonar 405B Online

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。该模型基于 Llama 3.1 405B，并具有互联网访问功能。 ...

Perplexity 124.09K context $5/M input tokens $5/M output tokens $0.005/M request tokens

Llama 3 8B Lunaris

Lunaris 8B 是一个多功能的通用和角色扮演模型，基于 Llama 3。它是多个模型的战略合并，旨在平衡创造力与改进的逻辑和一般知识。由 Sao10k 创建，该模型旨在提供比 Stheno v3.2 更好的体验，具有增强的创造力和逻辑推理能力。为了获得最佳效果，请使用 Llama 3 In ...

Sao10k 8K context $2/M input tokens $2/M output tokens

Mistral Nemo 12B Starcannon

Starcannon 12B 是一个创意角色扮演和故事写作模型，基于 nothingiisreal/mn-celeste-12b 并使用 [intervitens/mini-magnum-12b-v1.1](https://huggingface.co/int ...

Aetherwiing 11.72K context $2/M input tokens $2/M output tokens

Perplexity: Llama 3.1 Sonar 70B Online

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能方面超越了他们早期的 Sonar 模型。这是离线聊天模型的在线版本。它专注于提供有帮助、最新和真实的响应。 #online ...

Perplexity 124.09K context $1/M input tokens $1/M output tokens $0.005/M request tokens

Perplexity: Llama 3.1 Sonar 8B Online

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效率、速度和性能上超越了他们早期的 Sonar 模型。这是离线聊天模型的在线版本。它专注于提供有用、最新和真实的响应。 #online ...

Perplexity 124.09K context $0.2/M input tokens $0.2/M output tokens $0.005/M request tokens

Meta: Llama 3.1 70B Instruct

Meta最新发布的模型类别（Llama 3.1）推出了多种尺寸和版本。这个70B的指令调优版本针对高质量对话用例进行了优化。在人工评估中，它与领先的闭源模型相比表现出色。使用该模型需遵循Meta的可接受使用政策。 ...

Meta llama 128K context $0.3/M input tokens $0.3/M output tokens

Meta: Llama 3.1 70B Instruct (free)

Meta最新发布的模型系列（Llama 3.1）推出了多种规模和版本。这个70B的指令调优版本针对高质量对话用例进行了优化。与领先的闭源模型相比，它在人工评估中表现出色。使用该模型须遵循Meta的可接受使用政策。 _这些是[Llama 3.1 70B Instruct]( ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Google: Gemma 2 27B

Gemma 2 27B 由 Google 开发，是一个开放模型，基于创建 Gemini 模型所使用的相同研究和技术。 Gemma 模型非常适合多种文本生成任务，包括问答、摘要和推理。有关更多详细信息，请参阅 [发布公告](https://blog.google/technology/developers/google-g ...

Google 8K context $0.27/M input tokens $0.27/M output tokens

Anthropic: Claude 3.5 Sonnet (2024-06-20)

Text image 2 text

Claude 3.5 Sonnet 提供了超越 Opus 的能力，以比 Sonnet 更快的速度，且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色：编程：自主编写、编辑和运行代码，并进行推理和故障排除数据科学：增强人类的数据科学专业知识；在使用多种工具获取见解的同时，处理非结构化数据视觉处理：擅长解读图表、图形和图像，准确转录文本...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Dolphin 2.9.2 Mixtral 8x22B 🐬

Dolphin 2.9 旨在进行指令跟随、对话和编码。该模型是 Mixtral 8x22B Instruct 的微调版本。它具有 64k 的上下文长度，并使用 ChatML 模板进行了 16k 序列长度的微调。该模型是 [Dolphin Mixtral 8x7B](/cognitivecom ...

Cognitivecomputations 64K context $0.9/M input tokens $0.9/M output tokens

Mistral: Mistral 7B Instruct

一个高性能、行业标准的7.3B参数模型，针对速度和上下文长度进行了优化。 Mistral 7B Instruct有多个版本变体，本文旨在介绍最新版本。 ...

Mistralai 32K context $0.055/M input tokens $0.055/M output tokens

Mistral: Mistral 7B Instruct (free)

一个高性能、行业标准的 7.3B 参数模型，针对速度和上下文长度进行了优化。 Mistral 7B Instruct 有多个版本变体，这里是最新版本。 _这些是 Mistral 7B Instruct 的免费限速端点。输出可能会被缓存。有关速率限制的信息，请阅读 [这里](/docs/limi ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Phi-3 Mini 128K Instruct (free)

Phi-3 Mini 是一个强大的 3.8B 参数模型，旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化，它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。在发布时，Phi-3 Medium 在轻量级模型中展示了最先进的性能。该模型是静态的，训练于一个截至 2023 年 10 月的离线数据集。 _这些是免费的、速率限制的端点，适用于 [ ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Phi-3 Medium 128K Instruct (free)

Phi-3 128K Medium 是一个强大的 140 亿参数模型，旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化，它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。在发布时，Phi-3 Medium 在轻量级模型中展示了最先进的性能。在 MMLU-Pro 评估中，该模型甚至接近 Llama3 70B 的性能水平。对于 4k 上下 ...

Rifx.Online 8K context $0 input tokens $0 output tokens

DeepSeek V2.5

DeepSeek-V2.5 是一个升级版本，结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。新模型整合了前两个版本的通用能力和编码能力。 DeepSeek-V2 Chat 是 DeepSeek-V2 的对话微调版本，属于混合专家（MoE）语言模型。它总共包含 236B 个参数，其中每个 token 激活 21B。 ...

Deepseek 125K context $0.14/M input tokens $0.28/M output tokens

Google: Gemini Flash 1.5

Text image 2 text

Gemini 1.5 Flash 是一个基础模型，在视觉理解、分类、摘要以及从图像、音频和视频创建内容等多种多模态任务中表现出色。它擅长处理视觉和文本输入，例如照片、文档、信息图和截图。 Gemini 1.5 Flash 旨在处理高容量、高频率的任务，其中成本和延迟至关重要。在大多数常见任务中，Flash 的质量与其他 Gemini Pro 模型相当，但成本显著降低 ...

Google 976.56K context $0.075/M input tokens $0.3/M output tokens $0.04/K image tokens

WizardLM-2 7B

WizardLM-2 7B 是微软 AI 最新 Wizard 模型的较小版本。它是最快的，并且在性能上与现有的 10 倍更大的开源领先模型相当。它是对 Mistral 7B Instruct 的微调，使用与 [WizardLM-2 8x22B](/microsoft/wizardlm-2-8x22 ...

Microsoft 31.25K context $0.055/M input tokens $0.055/M output tokens

WizardLM-2 8x22B

WizardLM-2 8x22B 是微软 AI 最先进的 Wizard 模型。与领先的专有模型相比，它展示了高度竞争的性能，并且始终优于所有现有的最先进的开源模型。它是 Mixtral 8x22B 的指令微调版本。要了解有关模型发布的更多信息，[请点击这里](https://wizardlm.github ...

Microsoft 64K context $0.5/M input tokens $0.5/M output tokens

Google: Gemini Pro 1.5

Text image 2 text

谷歌最新的多模态模型，支持在文本或聊天提示中使用图像和视频。针对以下语言任务进行了优化：代码生成文本生成文本编辑问题解决推荐信息提取数据提取或生成 AI代理Gemini的使用受限于谷歌的Gemini使用条款。 #multimodal ...

Google 1.91M context $1.25/M input tokens $5/M output tokens $0.003/M image tokens

Anthropic: Claude 3 Haiku

Text image 2 text

Claude 3 Haiku 是 Anthropic 反应速度最快、体积最小的模型，能够实现近乎即时的响应。快速且准确的定向性能。查看发布公告和基准测试结果这里 #multimodal ...

Anthropic 195.31K context $0.25/M input tokens $1.25/M output tokens $0.4/K image tokens

Anthropic: Claude 3 Opus

Text image 2 text

Claude 3 Opus 是 Anthropic 针对高度复杂任务的最强大模型。它拥有顶级的性能、智能、流畅性和理解能力。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $15/M input tokens $75/M output tokens $0.024/M image tokens

Anthropic: Claude 3 Sonnet

Text image 2 text

None ...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Mistral Tiny

该模型目前由 Mistral-7B-v0.2 驱动，并结合了比 Mistral 7B 更“优越”的微调，灵感来自社区的工作。它最适合用于大批量处理任务，在这些任务中，成本是一个重要因素，但推理能力并不是关键。 ...

Mistralai 31.25K context $0.25/M input tokens $0.25/M output tokens

Dolphin 2.6 Mixtral 8x7B 🐬

这是对 Mixtral-8x7b 的 16k 上下文微调。由于大量使用编码数据进行训练，它在编码任务中表现出色，并以其服从性而闻名，尽管缺乏 DPO 调优。该模型未经过审查，并且去除了对齐和偏见。它需要一个外部对齐层以确保伦理使用。用户被提醒要负责任地使用这个高度合规的模型，具体细节可参见关于未审查模型的博客文 ...

Cognitivecomputations 32K context $0.5/M input tokens $0.5/M output tokens

lzlv 70B

A Mythomax/MLewd_13B风格的选定70B模型合并。一个多模型合并，结合了多个LLaMA2 70B微调模型，用于角色扮演和创意工作。目标是创建一个将创造力与智能相结合的模型，以提升体验。 #merge #uncensored ...

Lizpreciatior 4K context $0.35/M input tokens $0.4/M output tokens

Toppy M 7B

一个野生的7B参数模型，通过mergekit中的新task_arithmetic合并方法合并了多个模型。合并模型列表：NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonilia/AshhLimaRP-...

Undi95 4K context $0.07/M input tokens $0.07/M output tokens

Google: PaLM 2 Chat 32k

PaLM 2 是谷歌推出的一种语言模型，具备更强的多语言、推理和编码能力。 ...

Google 31.99K context $1/M input tokens $2/M output tokens

Google: PaLM 2 Code Chat 32k

PaLM 2 针对帮助解决代码相关问题的聊天机器人对话进行了微调。 ...

Google 31.99K context $1/M input tokens $2/M output tokens

OpenAI: GPT-3.5 Turbo Instruct

该模型是GPT-3.5 Turbo的一个变体，针对教学提示进行了调整，并省略了与聊天相关的优化。训练数据：截至2021年9月。 ...

Openai 4K context $1.5/M input tokens $2/M output tokens

ReMM SLERP 13B

原始 MythoMax-L2-B13 的重创版本，但采用了更新的模型。 #merge ...

Undi95 4K context $1.125/M input tokens $1.125/M output tokens

ReMM SLERP 13B (extended)

原始 MythoMax-L2-B13 的重现试验，但使用了更新的模型。 #merge 这些是 ReMM SLERP 13B 的扩展上下文端点。它们可能具有更高的价格。 ...

Undi95 6K context $1.125/M input tokens $1.125/M output tokens