Type something to search...

Chatbots

Gemini 2.0 Flash 提供了比 Gemini 1.5 Flash 更快的首次令牌时间 (TTFT),同时保持与更大模型如 Gemini 1.5 Pro 相当的质量。它在多模态理解、编码能力、复杂指令执行和函数调用方面引入了显著的增强。这些进步共同提供了更无缝和强大的代理体验。 ...

Google: Gemini 2.0 Flash Experimental
Google
976.56K context $0.2/M input tokens $0.6/M output tokens
我对 2025 年人工智能的五大预测

我对 2025 年人工智能的五大预测

以及一些非预测 正确预测未来是具有挑战性的。 问一下——以一个广为人知的流行文化偶像为例——汉娜和巴贝拉,杰森一家(The Jetsons)的创作者,他们想象了一个有飞行汽车和机器人女佣的未来,但没有想到互联网或智能手机会出现在我们的未来。 特别是在AI领域,许多失败的过于乐观的预测也导致了失望,最终出现了所谓的“AI寒冬”,即AI资金枯竭的时期。整个领域从公众视野中退回到不为人知的研

阅读更多

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并,使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型,结合了许多其他模型的最佳部分,成为许多用例的通用解决方案。 旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成:Hero (RP, trop...

Inflatebot: Mag Mell R1 12B
Rifx.Online
15.63K context $0.9/M input tokens $0.9/M output tokens
FREE

Gemini 2.0 Flash Thinking Mode 是一个实验性模型,旨在生成模型在响应过程中所经历的“思维过程”。因此,Thinking Mode 在其响应中具备比 基础 Gemini 2.0 Flash 模型 更强的推理能力。 ...

Google: Gemini 2.0 Flash Thinking Experimental (free)
Google
39.06K context $0 input tokens $0 output tokens
50% OFF

EVA Llama 3.33 70b 是一个角色扮演和故事创作的专业模型。它是对 Llama-3.3-70B-Instruct 在合成数据和自然数据混合上的全参数微调。 它使用了 Celeste 70B 0.1 数据混合,极大地扩展了数据,以提高模型的多样性、创造力和“风味”。 ...

EVA Llama 3.33 70b
Eva unit 01
16K context $4/M input tokens $6/M output tokens

Euryale L3.3 70B 是一个专注于创意角色扮演的模型,来自 Sao10k。它是 Euryale L3 70B v2.2 的继任者。 ...

Sao10K: Llama 3.3 Euryale 70B
Rifx.Online
7.81K context $1.5/M input tokens $1.5/M output tokens
什么是人工智能代理?从虚拟助理到智能决策者

什么是人工智能代理?从虚拟助理到智能决策者

从零开始理解AI代理的指南 最近,从基于LLM的聊天机器人转向该领域现在定义为代理系统或代理AI的变化可以用一句老话来总结:“少说多做。” 跟上技术进步可能令人畏惧,尤其是当你已经有一个现有的业务时。更不用说技术进步的速度和复杂性可能会让你感觉像是开学的第一天。 本文提供了基于其组件和特征的AI代理概述。引言部分涵盖了构成“AI代理”一词的组件,以创建一个直观的定义。在建立

阅读更多
70% OFF

Amazon Nova Micro 1.0 是一个仅支持文本的模型,能够以非常低的成本在 Amazon Nova 系列模型中提供最低延迟的响应。它的上下文长度为 128K tokens,并针对速度和成本进行了优化,Amazon Nova Micro 在文本摘要、翻译、内容分类、互动聊天和头脑风暴等任务中表现出色。它具有简单的数学推理和编码能力。 ...

nova-micro
Amazon
125K context $0.03/M input tokens $0.14/M output tokens $0.053/K image tokens

实验性版本(2024年12月6日)发布的 Gemini。 ...

gemini-exp-1206
Google
8K context $4/M input tokens $16/M output tokens

The Meta Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调优的生成模型,参数为 70B(文本输入/文本输出)。Llama 3.3 指令调优的文本模型专为多语言对话用例优化,并在常见行业基准测试中超越了许多可用的开源和封闭聊天模型。 支持的语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。 [模型卡片](https://github.com ...

Meta: Llama 3.3 70B Instruct
Meta Llama
128K context $0.13/M input tokens $0.4/M output tokens

这是一个系列模型,旨在复制Claude 3模型的散文质量,特别是Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet)和Opus(https://openrouter.ai/anthropic/claude-3-opus)。 该模型是在[Qwen2.5 72B](https://openrouter.ai/qwen/qwen-2.5- ...

Magnum v4 72B
Anthracite org
32K context $1.875/M input tokens $2.25/M output tokens

Baichuan3-Turbo 是一款先进的人工智能语言模型,旨在为用户提供高效、智能的自然语言处理解决方案。该模型结合了最新的深度学习技术,具有强大的文本生成和理解能力,可以广泛应用于对话系统、内容创作、信息检索等领域。 主要特点:高效性:Baichuan3-Turbo 采用优化算法,使得处理速度显著提升,能够快速响应用户请求。多样性:该模型支持多...

baichuan3-turbo
Baichuan
31.25K context $1.7/M input tokens $1.7/M output tokens

Baichuan4 模型介绍 Baichuan4 是一款先进的人工智能语言模型,旨在增强自然语言理解和生成能力。该模型基于前沿的深度学习技术,适用于从对话AI和内容创作到数据分析和客户支持等多种应用场景。 主要特点:性能提升:Baichuan4 采用先进算法优化处理效率,实现更快的响应时间和更高质量的互动体验。多语言支持:该模型能够理解和...

baichuan4
Baichuan
31.25K context $14.3/M input tokens $14.3/M output tokens

Moonshot-v1-8k 模型介绍 Moonshot-v1-8k 是一款由 Moonshot AI 开发的大型语言模型,具备卓越的自然语言处理能力。该模型采用了先进的深度学习技术,通过大量文本数据的训练,能够理解和生成自然语言,为用户提供高效、智能的交互体验。 主要特点:强大的语义理解:Moonshot-v1-8k 在语义理解方面表现出色,能够准确解析...

moonshot-v1-8k
Moonshot
7.81K context $1.9/M input tokens $1.9/M output tokens

Amazon Nova Micro 1.0 是一个仅支持文本的模型,能够以非常低的成本在 Amazon Nova 系列模型中提供最低延迟的响应。它的上下文长度为 128K tokens,并针对速度和成本进行了优化,Amazon Nova Micro 在文本摘要、翻译、内容分类、互动聊天和头脑风暴等任务中表现出色。它具有简单的数学推理和编码能力。 ...

Amazon: Nova Micro 1.0
Amazon
125K context $0.035/M input tokens $0.14/M output tokens $0.053/K image tokens
40% OFF

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型,提供近乎即时的响应能力。快速且准确的针对性表现。 查看发布公告和基准测试结果 here #multimodal ...

Claude-3-Haiku-20240307
Anthropic
195.31K context $0.5/M input tokens $2.5/M output tokens $0.4/K image tokens
探索类比数据配色方案的人工智能生成建议

探索类比数据配色方案的人工智能生成建议

类比色彩和谐是指在色轮上相邻的至少三种颜色。这种色彩方案可以创造出令人愉悦的色彩组合,但在应用于数据可视化时,可能会面临色盲测试不合格的风险。生成式AI能否通过提供通过色彩缺陷测试的类比建议来帮助数据色彩方案设计?在这里,我将探讨这个问题。让我们首先更详细地回顾一下类比色彩和谐、色彩缺陷以及生成式AI系统的概念。 类比色彩和谐: 色彩和谐是选择在色轮上能很好地配合在一起的颜色

阅读更多

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型,支持文本和图像输入,并提供文本输出。 作为他们最先进的小型模型,它的价格比其他最近的前沿模型便宜了许多,且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能,同时在成本效益上显著更高。 GPT-4 ...

GPT-4o mini
OpenAI
125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens
40% OFF

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型,支持文本和图像输入,并提供文本输出。 作为他们最先进的小型模型,它的价格比其他最近的前沿模型便宜了许多,且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能,同时在成本效益上显著更高。 GPT-4 ...

GPT-4o mini
OpenAI
125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens
40% OFF

Claude 3.5 Sonnet 提供了超越 Opus 的能力,以比 Sonnet 更快的速度,且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色:编码:自主编写、编辑和运行代码,具备推理和故障排除能力 数据科学:增强人类的数据科学专业知识;在使用多种工具获取洞察的同时,能够处理非结构化数据 视觉处理:擅长解读图表、图形和图像,准确转录文本,以获取超越文本本身...

Claude 3.5 Sonnet-20240620
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

MythoMax 13B (extended)
Gryphe
8K context $1.125/M input tokens $1.125/M output tokens
FREE

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

MythoMax 13B (free)
Gryphe
8K context $0 input tokens $0 output tokens

PaLM 2 针对帮助解决代码相关问题的聊天机器人对话进行了微调。 ...

Google: PaLM 2 Code Chat 32k
Google
31.99K context $1/M input tokens $2/M output tokens

Yi Large 模型由 01.AI 设计,考虑了以下用例:知识搜索、数据分类、人类聊天机器人和客户服务。 它以其多语言能力而脱颖而出,特别是在西班牙语、中文、日语、德语和法语方面。 查看 发布公告 以了解更多信息。 ...

01.AI: Yi Large
01 ai
32K context $3/M input tokens $3/M output tokens

这是 Mistral AI 的旗舰模型,Mistral Large 2(版本 mistral-large-2407)。它是一个专有的可用权重模型,擅长推理、代码、JSON、聊天等。请在 这里 阅读发布公告。 它支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在 ...

Mistral Large 2411
MistralAI
125K context $2/M input tokens $6/M output tokens

这是 Mistral AI 的旗舰模型,Mistral Large 2(版本 mistral-large-2407)。它是一个专有的可用权重模型,擅长推理、代码、JSON、聊天等。请在 这里 阅读发布公告。 它支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在 ...

Mistral Large 2407
MistralAI
125K context $2/M input tokens $6/M output tokens

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。 这是一个正常的离线 LLM,但该模型的 在线版本 具有互联网访问功能。 ...

Perplexity: Llama 3.1 Sonar 70B
Perplexity
128K context $1/M input tokens $1/M output tokens

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。 这是一个普通的离线 LLM,但该模型的 在线版本 具有互联网访问权限。 ...

Perplexity: Llama 3.1 Sonar 8B
Perplexity
128K context $0.2/M input tokens $0.2/M output tokens

一个较旧的 GPT-3.5 Turbo 模型,具备改进的指令跟随能力、JSON 模式、可重复的输出、并行函数调用等功能。训练数据:截至 2021 年 9 月。 ...

OpenAI: GPT-3.5 Turbo 16k (older v1106)
OpenAI
16K context $1/M input tokens $2/M output tokens

该安全模型具有8B参数,并基于Llama 3系列。与其前身LlamaGuard 1一样,它可以进行提示和响应分类。 LlamaGuard 2的功能类似于普通的LLM,生成文本以指示给定的输入/输出是否安全。如果被认为不安全,它还会分享违反的内容类别。 为了获得最佳效果,请使用原始提示输入或` ...

Meta: LlamaGuard 2 8B
Meta Llama
8K context $0.18/M input tokens $0.18/M output tokens

成本效益高、快速且可靠的选项,适用于翻译、摘要和情感分析等用例。 ...

Mistral Small
MistralAI
31.25K context $0.2/M input tokens $0.6/M output tokens

该模型目前由 Mistral-7B-v0.2 提供支持,并结合了比 Mistral 7B 更“优秀”的微调,灵感来自社区的工作。它最适合用于大批量处理任务,在这些任务中,成本是一个重要因素,但推理能力并不是关键。 ...

Mistral Tiny
MistralAI
31.25K context $0.25/M input tokens $0.25/M output tokens

Google 的旗舰文本生成模型。旨在处理自然语言任务、多轮文本和代码聊天,以及代码生成。 请参阅来自 Deepmind 的基准测试和提示指南。 使用 Gemini 需遵循 Google 的 Gemini 使用条款。 ...

Google: Gemini Pro 1.0
Google
31.99K context $0.5/M input tokens $1.5/M output tokens $0.003/M image tokens

一个大型 LLM 通过将两个微调的 Llama 70B 模型合并成一个 120B 模型而创建。结合了 Xwin 和 Euryale。 致谢@chargoddard 开发了用于合并模型的框架 - mergekit。 [@Undi95](h...

Goliath 120B
Alpindale
6K context $9.375/M input tokens $9.375/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的改进。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调,专注于将 LLM 与用户对齐,赋予最终用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 的能力基础上进行了构建和 ...

Nous: Hermes 3 405B Instruct (free)
NousreSearch
128K context $0 input tokens $0 output tokens

WizardLM-2 7B 是微软 AI 最新 Wizard 模型的较小变体。它是最快的,并且在性能上与现有的 10 倍大开源领先模型相当。 它是对 Mistral 7B Instruct 的微调,使用与 WizardLM-2 8x22B 相同的技术。 要了解更多 ...

WizardLM-2 7B
Microsoft Azure
31.25K context $0.055/M input tokens $0.055/M output tokens

The Jamba-Instruct model, introduced by AI21 Labs, is an instruction-tuned variant of their hybrid SSM-Transformer Jamba model, specifically optimized for enterprise applications.256K Context Win...

AI21: Jamba Instruct
Ai21
250K context $0.5/M input tokens $0.7/M output tokens

Euryale 70B v2.1 是一个专注于创意角色扮演的模型,来自 Sao10k。更好的提示遵循性。 更好的解剖学/空间意识。 更好地适应独特和自定义的格式/回复格式。 非常有创意,很多独特的风格。 在角色扮演过程中没有限制。...

Llama 3 Euryale 70B v2.1
Rifx.Online
8K context $0.35/M input tokens $0.4/M output tokens

Command 是一个遵循指令的对话模型,能够以更高的质量、更可靠地执行语言任务,并且比我们的基础生成模型具有更长的上下文。 使用此模型须遵循 Cohere 的 Acceptable Use Policy. ...

Cohere: Command
Cohere
4K context $0.95/M input tokens $1.9/M output tokens

Command-R 是一个 35B 参数模型,能够以更高的质量、更可靠的方式以及更长的上下文执行对话语言任务。它可以用于复杂的工作流程,如代码生成、检索增强生成(RAG)、工具使用和代理。 阅读发布帖子 here。 使用此模型须遵循 Cohere 的 [Acceptable Use Policy](https://do ...

Cohere: Command R
Cohere
125K context $0.475/M input tokens $1.425/M output tokens

Gemma 2 27B by Google 是一个开放模型,基于创建 Gemini models 所使用的相同研究和技术构建。 Gemma 模型非常适合各种文本生成任务,包括问答、摘要和推理。 有关更多详细信息,请参阅 [launch announcement](https://blog.google/technology/developers/goo ...

Google: Gemma 2 27B
Google
8K context $0.27/M input tokens $0.27/M output tokens

动态模型持续更新至 ChatGPT 中的当前版本 GPT-4o。旨在用于研究和评估。 注意:该模型目前处于实验阶段,不适合生产使用场景,可能会受到严格的速率限制。 ...

OpenAI: ChatGPT-4o
OpenAI
125K context $5/M input tokens $15/M output tokens $0.007/M image tokens

Claude 3.5 Sonnet 提供了超越 Opus 的能力,以比 Sonnet 更快的速度,且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色:编码:自主编写、编辑和运行代码,具备推理和故障排除能力 数据科学:增强人类的数据科学专业知识;在使用多种工具获取洞察的同时,能够处理非结构化数据 视觉处理:擅长解读图表、图形和图像,准确转录文本,以获取超越文本本身的...

Anthropic: Claude 3.5 Sonnet (2024-06-20)
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Claude 3.5 Haiku 在所有技能领域(包括编码、工具使用和推理)中都有所增强。作为 Anthropic 系列中速度最快的模型,它提供快速的响应时间,适用于需要高交互性和低延迟的应用,如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色,使其成为广泛行业的多功能工具。 它不支持图像输入。 查看发布公告和基准测试结果 [here](https://ww ...

Anthropic: Claude 3.5 Haiku (2024-10-22)
Anthropic
195.31K context $1/M input tokens $5/M output tokens

Claude 3 Opus 是 Anthropic 针对高度复杂任务推出的最强大模型。它具有顶级的性能、智能、流畅性和理解能力。 查看发布公告和基准测试结果 这里 #multimodal ...

Anthropic: Claude 3 Opus
Anthropic
195.31K context $15/M input tokens $75/M output tokens $0.024/M image tokens

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型,提供近乎即时的响应能力。快速且准确的针对性表现。 查看发布公告和基准测试结果 here #multimodal ...

Anthropic: Claude 3 Haiku
Anthropic
195.31K context $0.25/M input tokens $1.25/M output tokens $0.4/K image tokens

Claude 3.5 Haiku 在所有技能领域(包括编码、工具使用和推理)中都有所增强。作为 Anthropic 系列中速度最快的模型,它提供快速的响应时间,适用于需要高交互性和低延迟的应用,如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色,使其成为广泛行业的多功能工具。 它不支持图像输入。 查看发布公告和基准测试结果 [here](https://ww ...

Anthropic: Claude 3.5 Haiku
Anthropic
195.31K context $1/M input tokens $5/M output tokens

Claude 3.5 Sonnet 提供了超越 Opus 的能力,以比 Sonnet 更快的速度,且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色:编码:自主编写、编辑和运行代码,具备推理和故障排除能力 数据科学:增强人类的数据科学专业知识;在使用多种工具获取洞察的同时,能够处理非结构化数据 视觉处理:擅长解读图表、图形和图像,准确转录文本,以获取超越文本本身的...

Anthropic: Claude 3.5 Sonnet
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Jamba 1.5 Large 是 AI21 新一代开放模型家族的一部分,提供卓越的速度、效率和质量。 它具有 256K 的有效上下文窗口,是开放模型中最长的,能够在文档摘要和分析等任务上提升性能。 基于新颖的 SSM-Transformer 架构,它在基准测试中超越了更大的模型,如 Llama 3.1 70B,同时保持资源效率。 阅读他们的 [announcement](https:// ...

AI21: Jamba 1.5 Large
Ai21
250K context $2/M input tokens $8/M output tokens

Euryale L3.1 70B v2.2 是一个专注于创意角色扮演的模型,来自 Sao10k。它是 Euryale L3 70B v2.1 的继任者。 ...

Llama 3.1 Euryale 70B v2.2
Rifx.Online
8K context $0.35/M input tokens $0.4/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的提升。 Hermes 3 70B 是一个具有竞争力的微调版本,甚至可以说优于 [Llama-3.1 70B 基础模型](/meta-llama/l ...

Nous: Hermes 3 70B Instruct
NousreSearch
128K context $0.4/M input tokens $0.4/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、更加出色的角色扮演、推理、多轮对话、长上下文连贯性以及各方面的改进。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调,专注于将 LLM 与用户对齐,赋予最终用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 的能力基础上进行了构建和扩 ...

Nous: Hermes 3 405B Instruct
NousreSearch
128K context $1.79/M input tokens $2.49/M output tokens

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型,支持文本和图像输入,并提供文本输出。 作为他们最先进的小型模型,它的价格比其他最近的前沿模型便宜了许多,且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能,同时在成本效益上显著更高。 GPT-4 ...

OpenAI: GPT-4o-mini
OpenAI
125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

Gemini 1.5 Flash-8B 针对速度和效率进行了优化,在聊天、转录和翻译等小提示任务中提供了增强的性能。由于延迟降低,它在实时和大规模操作中非常有效。该模型专注于具有成本效益的解决方案,同时保持高质量的结果。 [点击这里了解更多关于该模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-gener ...

Google: Gemini 1.5 Flash-8B
Google
976.56K context $0.037/M input tokens $0.15/M output tokens

Inflection 3 的生产力经过优化,以便更好地遵循指令。它更适合需要 JSON 输出或严格遵循提供的指南的任务。 有关类似于 Pi 的情感智能,请参见 Inflect 3 Pi。 有关更多详细信息,请参见 Inflection 的公告。 ...

Inflection: Inflection 3 Productivity
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Inflection 3 Pi 功能强大的 Inflection 的 Pi 聊天机器人,包括背景故事、情感智能、生产力和安全性。它在客户支持、角色扮演和情感智能等场景中表现出色。 ...

Inflection: Inflection 3 Pi
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Qwen2.5 7B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学方面的能力大幅提升,这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出(尤其是 JSON)方面有显著改进。对系统提示的多样性更具韧性,增强了角色扮演的实...

Qwen2.5 7B Instruct
Qwen
128K context $0.27/M input tokens $0.27/M output tokens

Rocinante 12B 旨在提供引人入胜的叙事和丰富的散文。 早期测试者报告称:词汇量扩大,独特而富有表现力的用词选择 创造力增强,能够创作生动的叙述 冒险满满且引人入胜的故事...

Rocinante 12B
Thedrummer
32K context $0.25/M input tokens $0.5/M output tokens

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学方面大幅提升了能力,这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出(特别是 JSON)方面有显著改进。对系统提示的多样性更具韧性,增强了角色扮演的...

Qwen2.5 72B Instruct
Qwen
128K context $0.35/M input tokens $0.4/M output tokens
LangGraph:高级多代理工作流的未来

LangGraph:高级多代理工作流的未来

人工智能的世界正在迅速发展,像 LangChain 和 LangGraph 这样的工具处于使开发者高效构建智能系统的前沿。如果你听说过 LangGraph,但不确定它是什么或如何充分利用它的潜力,这个指南适合你。 在这篇全面的文章中,我们将涵盖你需要了解的关于 LangGraph 的所有内容——从其核心概念到实际应用。无论你是初学者还是高级开发者,这个指南将帮助你理解为什么 LangGra

阅读更多

实验性版本(2024年11月21日) 的 Gemini。 ...

Google: Gemini Experimental 1121 (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

谷歌的 Gemini 1.5 Pro 实验版本。 ...

Google: LearnLM 1.5 Pro Experimental (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

Mistral Large 2 2411 是 Mistral Large 2 的更新版本,与 Pixtral Large 2411 一起发布。 它流利地支持英语、法语、西班牙语、德语和意大利语,具有高语法准确性,并且其长上下文窗口允许从大型文档中精 ...

Mistral Large 2411
Rifx.Online
125K context $2/M input tokens $6/M output tokens

ERNIE Bot 概述 关键能力和使用案例:进行互动对话,回答问题,并协助创意任务。 促进高效的信息检索和知识生成。重要特性和改进:知识增强: 利用海量数据和大规模知识提高理解能力。 检索增强: 提升有效检索相关信息的能力。 对话增强: 先进的对话能力,使用户能够进行有意义的互动。**技术 ...

ERNIE-Bot-4.0
Ernie bot 4.0
8K context $16.44/M input tokens $16.44/M output tokens

关键能力和使用案例:设计用于资源受限的环境,如移动设备和边缘设备。 适用于智能助手、语音识别以及智能家居中的本地处理。重要特性和改进:轻量级设计: 优化结构,减少参数以降低计算和存储需求。 知识蒸馏: 将大模型的知识转移,以增强小参数模型的性能。 多任务学习: 支持多种自然语言处理任务,包括文本分类、...

ERNIE-Lite-8K:free
Ernie
8K context $0 input tokens $0 output tokens

开发者/公司: 百度 概述: ERNIE Bot Turbo 是 ERNIE Bot 的增强版本,提供扩展的功能,支持 7K 输入 + 1K 输出。它包括系统设置和新的推理参数。 ERNIE Bot 特性:文学创作: 总结核心内容并为文学作品建议续写角度;回答有关衍生品的事实问题。 商业文案: 创建富有创意和吸引力...

ERNIE-Bot-turbo
Ernie
8K context $1.65/M input tokens $1.65/M output tokens

开发者/公司: 百度研究 关键能力与应用案例: ERNIE-4.0-8K 在自然语言处理 (NLP) 中具有重要价值,适用于搜索引擎、智能客服、内容推荐和情感分析。 特点与改进:多任务学习: 支持文本分类、情感分析和命名实体识别等任务。 知识增强: 融入知识图谱以提升特定领域的表现。 跨语言能力: 有效...

ERNIE-4.0-8K
Ernie
8K context $5.48/M input tokens $16.44/M output tokens

开发者/公司: 百度团队 概述: ERNIE-Tiny-8K 是一个轻量级的预训练语言模型,专为中文自然语言处理任务设计,结合了小巧的体积和快速的推理能力,同时具备高性能。 特点与优势:轻量级设计: 减少参数和层数,实现更小的体积和更快的推理,同时保持性能。 知识增强: 继承了 ERNIE 系列的知识整合,提升...

ERNIE-Tiny-8K
Ernie
8K context $0 input tokens $0 output tokens
ChatGPT 的未来解析:未来 5 年一切都将改变

ChatGPT 的未来解析:未来 5 年一切都将改变

这可能会让人工智能走得更远…… OpenAI已经制定了一个清晰的愿景,来指导ChatGPT的演变,最近公布了一个五步路线图,以实现他们所称的人工通用智能(AGI)。 AGI代表一种理论上的人工智能系统,能够学习、理解和执行任何智力任务,其能力达到人类水平,且完全自主和适应性强。 这是一个开创性的愿景,但实现这一雄心勃勃的目标需要经历

阅读更多

基本信息 “GLM-4-AIRX”是一种先进的大型语言模型,由人工智能领域的专家研发。它以其强大的自然语言处理能力著称,能够有效地理解和生成自然语言文本。此模型依赖于深度学习技术,特别是广泛应用于NLP(自然语言处理)领域的Transformer架构。 技术特点 1. 基于Transformer架构 该模型利用了Transformer架构, ...

GLM-4 AirX
ChatGLM
7.81K context $1.4/M input tokens $1.4/M output tokens

GLM-4-Flash 模型介绍 关键能力和主要使用案例处理多轮对话、网络搜索和工具调用。 支持长文本推理,上下文长度可达 128K,输出长度可达 4K。 支持 26 种语言的多语言功能,包括中文、英语、日语、韩语和德语。最重要的特性和改进通过自适应权重量化、并行处理、批处理和推测采样优化速度。 提供微调功能,以适应...

glm-4-flash
ChatGLM
125K context $0.01/M input tokens $0.01/M output tokens

GLM-4-Plus 模型介绍 关键能力和主要使用案例语言理解:在语言理解、指令执行和长文本处理方面具有先进能力。 多模态支持:包括文本到图像生成模型(CogView-3-Plus)、图像/视频理解模型(GLM-4V-Plus)和视频生成模型(CogVideoX)。 跨模态交互:支持文本、音频和视频模态,如在青眼...

glm-4-plus
ChatGLM
125K context $7/M input tokens $7/M output tokens

SorcererLM 是一个先进的 RP 和故事讲述模型,作为一个低秩 16 位 LoRA 在 WizardLM-2-8x22B 上进行微调。先进的推理和情感智能,实现引人入胜和沉浸式的互动 生动的写作能力,增强了空间和上下文意识 增强的叙事深度,促进创造性和动态的故事讲述...

Sorcererlm 8x22b
Raifle
15.63K context $4.5/M input tokens $4.5/M output tokens

一个角色扮演/故事创作专用模型,针对合成数据和自然数据的混合进行全参数微调的Qwen2.5-32B。 它使用Celeste 70B 0.1数据混合,极大地扩展了数据,提高了模型的多样性、创造力和“风味”。 ...

Eva Qwen2.5 32B
Eva unit 01
31.25K context $0.5/M input tokens $0.5/M output tokens

UnslopNemo v4.1 是来自 Rocinante 创作者的最新作品,旨在用于冒险写作和角色扮演场景。 ...

Unslopnemo 12b
Thedrummer
31.25K context $0.5/M input tokens $0.5/M output tokens

Claude 3.5 Haiku 在所有技能领域中都进行了增强,包括编码、工具使用和推理。作为 Anthropic 系列中速度最快的模型,它提供快速的响应时间,适用于需要高交互性和低延迟的应用,如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色,使其成为广泛行业的多功能工具。 它不支持图像输入。 查看发布公告和基准测试结果 [he ...

Anthropic: Claude 3.5 Haiku (2024-10-22)
Rifx.Online
195.31K context $1/M input tokens $5/M output tokens

Claude 3.5 Haiku 特性提供了更高的速度、编码准确性和工具使用能力。旨在在实时应用中表现出色,它提供了快速的响应时间,这对于动态任务(如聊天互动和即时编码建议)至关重要。 这使其非常适合需要速度和精度的环境,例如软件开发、客户服务机器人和数据管理系统。 此模型当前指向 [Claude 3.5 Haiku (2024-10-22)](/anthropi ...

Anthropic: Claude 3.5 Haiku
Anthropic
195.31K context $1/M input tokens $5/M output tokens
Google 发布 Gemma — 轻量级开源模型

Google 发布 Gemma — 轻量级开源模型

在短短一周内,世界见证了两家科技巨头带来的最具突破性的AI进展。OpenAI推出了令人惊叹的AI视频生成器Sora,而谷歌则揭晓了其[Gemini 1.5模型](https://generativeai.pub/google-releases-gemini-1-5-with-1m-context-window-

阅读更多

这是一个系列模型,旨在复制Claude 3模型的散文质量,特别是Sonnet和Opus。 该模型是在[Qwen2.5 72B]s的基础上进行微调的。 ...

Magnum v4 72B
Anthracite org
32K context $1.875/M input tokens $2.25/M output tokens

Grok Beta 是 xAI 的实验性语言模型,具有最先进的推理能力,最适合复杂和多步骤的用例。 它是 Grok 2 的继任者,具有增强的上下文长度。 ...

xAI: Grok Beta
X ai
128K context $5/M input tokens $15/M output tokens

Qwen2.5 7B 是 Qwen 大语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学方面的能力大幅提升,这得益于我们在这些领域的专业模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出,特别是 JSON 方面有显著改进。对系统提示的多样性更具韧...

Qwen2.5 7B Instruct
Qwen
128K context $0.27/M input tokens $0.27/M output tokens

Inflection 3 Pi 的 Pi 聊天机器人,包含背景故事、情感智能、生产力和安全性。它在客户支持、角色扮演和情感智能等场景中表现出色。 ...

Inflection: Inflection 3 Pi
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Inflection 3 的生产力经过优化,以便更好地遵循指令。它更适合需要 JSON 输出或精确遵循提供的指导方针的任务。 有关类似于 Pi 的情感智能,请参见 Inflect 3 Pi。 有关更多详细信息,请参见 [Inflection 的公告](https://inflection.ai/blog ...

Inflection: Inflection 3 Productivity
Inflection
7.81K context $2.5/M input tokens $10/M output tokens

Gemini 1.5 Flash-8B 针对速度和效率进行了优化,在聊天、转录和翻译等小提示任务中提供了增强的性能。通过减少延迟,它在实时和大规模操作中非常有效。该模型专注于成本效益解决方案,同时保持高质量的结果。 [点击此处了解更多关于此模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-i ...

Google: Gemini 1.5 Flash-8B
Google
976.56K context $0.037/M input tokens $0.15/M output tokens

一个专注于角色扮演和创意写作的模型,该模型基于 Qwen2.5-14B,经过合成数据和自然数据的混合微调。 它在 1.5M 令牌的角色扮演数据上进行训练,并在 1.5M 令牌的合成数据上进行微调。 ...

EVA Qwen2.5 14B
Eva unit 01
32K context $0.25/M input tokens $0.5/M output tokens

Rocinante 12B 旨在提供引人入胜的叙事和丰富的散文。 早期测试者报告:词汇量扩展,独特且富有表现力的用词选择 创造力增强,能够生动叙述 充满冒险和引人入胜的故事...

Rocinante 12B
Thedrummer
32K context $0.25/M input tokens $0.5/M output tokens

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型,针对对话生成、推理和摘要等高级自然语言处理任务进行了优化。它采用最新的 transformer 架构,支持包括英语、西班牙语和印地语在内的八种语言,并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练,擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语 ...

Meta: Llama 3.2 3B Instruct
Meta llama
128K context $0.03/M input tokens $0.05/M output tokens

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型,针对对话生成、推理和摘要等高级自然语言处理任务进行了优化。该模型采用最新的 Transformer 架构,支持包括英语、西班牙语和印地语在内的八种语言,并可适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练,擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语 ...

Meta: Llama 3.2 3B Instruct (free)
Rifx.Online
4K context $0 input tokens $0 output tokens

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学能力上有了很大提升,这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出(特别是 JSON)方面有显著改进。对系统提示的多样...

Qwen2.5 72B Instruct
Qwen
128K context $0.35/M input tokens $0.4/M output tokens

Lumimaid v0.2 8B 是对 Llama 3.1 8B 的微调,相较于 Lumimaid v0.1,数据集有了“巨大的提升”。不当的聊天输出已被清除。 使用此模型须遵循 [Meta 的可接受使用政策](https://llama.meta.com/llama3/use-policy/ ...

Lumimaid v0.2 8B
Neversleep
128K context $0.188/M input tokens $1.125/M output tokens

Gemini 1.5 Flash 8B Experimental 是 Gemini 1.5 Flash 模型的实验性 8B 参数版本。 使用 Gemini 需遵循 Google 的 Gemini 使用条款。 #multimodal 注意:该模型目 ...

Google: Gemini Flash 8B 1.5 Experimental
Google
976.56K context $0 input tokens $0 output tokens

Euryale L3.1 70B v2.2 是一个专注于创意角色扮演的模型,来自 Sao10k。它是 Euryale L3 70B v2.1 的继任者。 ...

Llama 3.1 Euryale 70B v2.2
Sao10k
8K context $0.35/M input tokens $0.4/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力,更好的角色扮演,推理,多轮对话,长上下文连贯性,以及各方面的改进。 Hermes 3 70B 是一个具有竞争力的微调版本,甚至可以说是 [Llama-3.1 70B 基础模型](/ ...

Nous: Hermes 3 70B Instruct
Nousresearch
128K context $0.4/M input tokens $0.4/M output tokens

Hermes 3 是一个通用语言模型,相较于 Hermes 2 有许多改进,包括先进的代理能力、显著更好的角色扮演、推理、多轮对话、长上下文一致性以及各方面的提升。 Hermes 3 405B 是 Llama-3.1 405B 基础模型的前沿级全参数微调,专注于将 LLM 与用户对齐,赋予终端用户强大的引导能力和控制权。 Hermes 3 系列在 Hermes 2 ...

Nous: Hermes 3 405B Instruct
Nousresearch
128K context $1.79/M input tokens $2.49/M output tokens

动态模型持续更新到 ChatGPT 中的当前版本 GPT-4o。旨在用于研究和评估。 注意:此模型目前处于实验阶段,不适合生产使用,并可能受到严格的速率限制。 ...

OpenAI: ChatGPT-4o
Openai
125K context $5/M input tokens $15/M output tokens $0.007/M image tokens

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能上超越了他们早期的 Sonar 模型。该模型基于 Llama 3.1 405B,并具有互联网访问功能。 ...

Perplexity: Llama 3.1 Sonar 405B Online
Perplexity
124.09K context $5/M input tokens $5/M output tokens $0.005/M request tokens

Lunaris 8B 是一个多功能的通用和角色扮演模型,基于 Llama 3。它是多个模型的战略合并,旨在平衡创造力与改进的逻辑和一般知识。 由 Sao10k 创建,该模型旨在提供比 Stheno v3.2 更好的体验,具有增强的创造力和逻辑推理能力。 为了获得最佳效果,请使用 Llama 3 In ...

Llama 3 8B Lunaris
Sao10k
8K context $2/M input tokens $2/M output tokens

Starcannon 12B 是一个创意角色扮演和故事写作模型,基于 nothingiisreal/mn-celeste-12b 并使用 [intervitens/mini-magnum-12b-v1.1](https://huggingface.co/int ...

Mistral Nemo 12B Starcannon
Aetherwiing
11.72K context $2/M input tokens $2/M output tokens

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效益、速度和性能方面超越了他们早期的 Sonar 模型。 这是 离线聊天模型 的在线版本。它专注于提供有帮助、最新和真实的响应。 #online ...

Perplexity: Llama 3.1 Sonar 70B Online
Perplexity
124.09K context $1/M input tokens $1/M output tokens $0.005/M request tokens

Llama 3.1 Sonar 是 Perplexity 最新的模型系列。它在成本效率、速度和性能上超越了他们早期的 Sonar 模型。 这是 离线聊天模型 的在线版本。它专注于提供有用、最新和真实的响应。 #online ...

Perplexity: Llama 3.1 Sonar 8B Online
Perplexity
124.09K context $0.2/M input tokens $0.2/M output tokens $0.005/M request tokens

Meta最新发布的模型类别(Llama 3.1)推出了多种尺寸和版本。这个70B的指令调优版本针对高质量对话用例进行了优化。 在人工评估中,它与领先的闭源模型相比表现出色。 使用该模型需遵循Meta的可接受使用政策。 ...

Meta: Llama 3.1 70B Instruct
Meta llama
128K context $0.3/M input tokens $0.3/M output tokens

Meta最新发布的模型系列(Llama 3.1)推出了多种规模和版本。这个70B的指令调优版本针对高质量对话用例进行了优化。 与领先的闭源模型相比,它在人工评估中表现出色。 使用该模型须遵循Meta的可接受使用政策。 _这些是[Llama 3.1 70B Instruct]( ...

Meta: Llama 3.1 70B Instruct (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

Gemma 2 27B 由 Google 开发,是一个开放模型,基于创建 Gemini 模型 所使用的相同研究和技术。 Gemma 模型非常适合多种文本生成任务,包括问答、摘要和推理。 有关更多详细信息,请参阅 [发布公告](https://blog.google/technology/developers/google-g ...

Google: Gemma 2 27B
Google
8K context $0.27/M input tokens $0.27/M output tokens

Claude 3.5 Sonnet 提供了超越 Opus 的能力,以比 Sonnet 更快的速度,且价格与 Sonnet 相同。Sonnet 在以下方面表现尤为出色:编程:自主编写、编辑和运行代码,并进行推理和故障排除 数据科学:增强人类的数据科学专业知识;在使用多种工具获取见解的同时,处理非结构化数据 视觉处理:擅长解读图表、图形和图像,准确转录文本...

Anthropic: Claude 3.5 Sonnet (2024-06-20)
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Dolphin 2.9 旨在进行指令跟随、对话和编码。该模型是 Mixtral 8x22B Instruct 的微调版本。它具有 64k 的上下文长度,并使用 ChatML 模板进行了 16k 序列长度的微调。 该模型是 [Dolphin Mixtral 8x7B](/cognitivecom ...

Dolphin 2.9.2 Mixtral 8x22B 🐬
Cognitivecomputations
64K context $0.9/M input tokens $0.9/M output tokens

一个高性能、行业标准的7.3B参数模型,针对速度和上下文长度进行了优化。 Mistral 7B Instruct有多个版本变体,本文旨在介绍最新版本。 ...

Mistral: Mistral 7B Instruct
Mistralai
32K context $0.055/M input tokens $0.055/M output tokens

一个高性能、行业标准的 7.3B 参数模型,针对速度和上下文长度进行了优化。 Mistral 7B Instruct 有多个版本变体,这里是最新版本。 _这些是 Mistral 7B Instruct 的免费限速端点。输出可能会被缓存。有关速率限制的信息,请阅读 [这里](/docs/limi ...

Mistral: Mistral 7B Instruct (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

Phi-3 Mini 是一个强大的 3.8B 参数模型,旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化,它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。 在发布时,Phi-3 Medium 在轻量级模型中展示了最先进的性能。该模型是静态的,训练于一个截至 2023 年 10 月的离线数据集。 _这些是免费的、速率限制的端点,适用于 [ ...

Phi-3 Mini 128K Instruct (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

Phi-3 128K Medium 是一个强大的 140 亿参数模型,旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化,它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。 在发布时,Phi-3 Medium 在轻量级模型中展示了最先进的性能。在 MMLU-Pro 评估中,该模型甚至接近 Llama3 70B 的性能水平。 对于 4k 上下 ...

Phi-3 Medium 128K Instruct (free)
Rifx.Online
8K context $0 input tokens $0 output tokens

DeepSeek-V2.5 是一个升级版本,结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。新模型整合了前两个版本的通用能力和编码能力。 DeepSeek-V2 Chat 是 DeepSeek-V2 的对话微调版本,属于混合专家(MoE)语言模型。它总共包含 236B 个参数,其中每个 token 激活 21B。 ...

DeepSeek V2.5
Deepseek
125K context $0.14/M input tokens $0.28/M output tokens

Gemini 1.5 Flash 是一个基础模型,在视觉理解、分类、摘要以及从图像、音频和视频创建内容等多种多模态任务中表现出色。它擅长处理视觉和文本输入,例如照片、文档、信息图和截图。 Gemini 1.5 Flash 旨在处理高容量、高频率的任务,其中成本和延迟至关重要。在大多数常见任务中,Flash 的质量与其他 Gemini Pro 模型相当,但成本显著降低 ...

Google: Gemini Flash 1.5
Google
976.56K context $0.075/M input tokens $0.3/M output tokens $0.04/K image tokens

WizardLM-2 7B 是微软 AI 最新 Wizard 模型的较小版本。它是最快的,并且在性能上与现有的 10 倍更大的开源领先模型相当。 它是对 Mistral 7B Instruct 的微调,使用与 [WizardLM-2 8x22B](/microsoft/wizardlm-2-8x22 ...

WizardLM-2 7B
Microsoft
31.25K context $0.055/M input tokens $0.055/M output tokens

WizardLM-2 8x22B 是微软 AI 最先进的 Wizard 模型。与领先的专有模型相比,它展示了高度竞争的性能,并且始终优于所有现有的最先进的开源模型。 它是 Mixtral 8x22B 的指令微调版本。 要了解有关模型发布的更多信息,[请点击这里](https://wizardlm.github ...

WizardLM-2 8x22B
Microsoft
64K context $0.5/M input tokens $0.5/M output tokens

谷歌最新的多模态模型,支持在文本或聊天提示中使用图像和视频。 针对以下语言任务进行了优化:代码生成 文本生成 文本编辑 问题解决 推荐 信息提取 数据提取或生成 AI代理Gemini的使用受限于谷歌的Gemini使用条款。 #multimodal ...

Google: Gemini Pro 1.5
Google
1.91M context $1.25/M input tokens $5/M output tokens $0.003/M image tokens

Claude 3 Haiku 是 Anthropic 反应速度最快、体积最小的模型,能够实现近乎即时的响应。快速且准确的定向性能。 查看发布公告和基准测试结果 这里 #multimodal ...

Anthropic: Claude 3 Haiku
Anthropic
195.31K context $0.25/M input tokens $1.25/M output tokens $0.4/K image tokens

Claude 3 Opus 是 Anthropic 针对高度复杂任务的最强大模型。它拥有顶级的性能、智能、流畅性和理解能力。 查看发布公告和基准测试结果 here #multimodal ...

Anthropic: Claude 3 Opus
Anthropic
195.31K context $15/M input tokens $75/M output tokens $0.024/M image tokens

None ...

Anthropic: Claude 3 Sonnet
Anthropic
195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

该模型目前由 Mistral-7B-v0.2 驱动,并结合了比 Mistral 7B 更“优越”的微调,灵感来自社区的工作。它最适合用于大批量处理任务,在这些任务中,成本是一个重要因素,但推理能力并不是关键。 ...

Mistral Tiny
Mistralai
31.25K context $0.25/M input tokens $0.25/M output tokens

这是对 Mixtral-8x7b 的 16k 上下文微调。由于大量使用编码数据进行训练,它在编码任务中表现出色,并以其服从性而闻名,尽管缺乏 DPO 调优。 该模型未经过审查,并且去除了对齐和偏见。它需要一个外部对齐层以确保伦理使用。用户被提醒要负责任地使用这个高度合规的模型,具体细节可参见关于未审查模型的博客文 ...

Dolphin 2.6 Mixtral 8x7B 🐬
Cognitivecomputations
32K context $0.5/M input tokens $0.5/M output tokens

A Mythomax/MLewd_13B风格的选定70B模型合并。 一个多模型合并,结合了多个LLaMA2 70B微调模型,用于角色扮演和创意工作。目标是创建一个将创造力与智能相结合的模型,以提升体验。 #merge #uncensored ...

lzlv 70B
Lizpreciatior
4K context $0.35/M input tokens $0.4/M output tokens

一个野生的7B参数模型,通过mergekit中的新task_arithmetic合并方法合并了多个模型。 合并模型列表:NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonilia/AshhLimaRP-...

Toppy M 7B
Undi95
4K context $0.07/M input tokens $0.07/M output tokens

PaLM 2 是谷歌推出的一种语言模型,具备更强的多语言、推理和编码能力。 ...

Google: PaLM 2 Chat 32k
Google
31.99K context $1/M input tokens $2/M output tokens

PaLM 2 针对帮助解决代码相关问题的聊天机器人对话进行了微调。 ...

Google: PaLM 2 Code Chat 32k
Google
31.99K context $1/M input tokens $2/M output tokens

该模型是GPT-3.5 Turbo的一个变体,针对教学提示进行了调整,并省略了与聊天相关的优化。训练数据:截至2021年9月。 ...

OpenAI: GPT-3.5 Turbo Instruct
Openai
4K context $1.5/M input tokens $2/M output tokens

原始 MythoMax-L2-B13 的重创版本,但采用了更新的模型。 #merge ...

ReMM SLERP 13B
Undi95
4K context $1.125/M input tokens $1.125/M output tokens

原始 MythoMax-L2-B13 的重现试验,但使用了更新的模型。 #merge 这些是 ReMM SLERP 13B 的扩展上下文端点。它们可能具有更高的价格。 ...

ReMM SLERP 13B (extended)
Undi95
6K context $1.125/M input tokens $1.125/M output tokens