Technology

DeepSeek R1

DeepSeek-R1 来了！ ⚡ 性能与 OpenAI-o1 相当 📖 完全开源的模型和技术报告 🏆 MIT 许可证：自由提炼和商业化！ ...

DeepSeek 62.5K context $0.55/M input tokens $2.19/M output tokens

MiniMax: MiniMax-01

Text image 2 text

MiniMax-01 是一个结合了 MiniMax-Text-01 进行文本生成和 MiniMax-VL-01 进行图像理解的模型。它拥有 4560 亿个参数，每次推理激活 459 亿个参数，并且可以处理多达 400 万个 token 的上下文。文本模型采用混合架构，结合了 Lightning Attention、Softmax Attention 和专家混合（MoE）。图像模型采用“ViT ...

Rifx.Online 976.75K context $0.2/M input tokens $1.1/M output tokens

30% OFF

OpenAI: o1-preview

OpenAI 最新和最强大的模型系列，o1 旨在在响应之前花更多时间思考。 o1 模型针对数学、科学、编程和其他 STEM 相关任务进行了优化。它们在物理、化学和生物学的基准测试中始终表现出博士级的准确性。了解更多信息请查看 launch announcement。注意：该模型目前处于实验阶段，不适合生产使用，并且可能会受到严重的速率限制。 ...

OpenAI 125K context $15/M input tokens $60/M output tokens

40% OFF

OpenAI: o1-mini

OpenAI 最新和最强大的模型系列，o1 旨在在响应之前花更多时间思考。 o1 模型针对数学、科学、编程和其他 STEM 相关任务进行了优化。它们在物理、化学和生物学的基准测试中始终表现出博士级的准确性。有关更多信息，请参阅发布公告。注意：该模型目前处于实验阶段，不适合生产使用，可能会受到严格的速率限制。 ...

OpenAI 125K context $3/M input tokens $12/M output tokens

DeepSeek V3

1. 介绍我们推出了 DeepSeek-V3，这是一款强大的混合专家 (MoE) 语言模型，拥有 671B 的总参数，其中每个令牌激活 37B。为了实现高效推理和具有成本效益的训练，DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构，这些架构在 DeepSeek-V2 中得到了充分验证。此外，DeepSeek-V3 首创了一种无辅助损失的 ...

DeepSeek 62.5K context $0.14/M input tokens $0.28/M output tokens

OpenAI: o1-mini

OpenAI 最新和最强大的模型系列，o1 旨在在响应之前花更多时间思考。 o1 模型针对数学、科学、编程和其他 STEM 相关任务进行了优化。它们在物理、化学和生物学的基准测试中始终表现出博士级的准确性。有关更多信息，请参阅发布公告。注意：该模型目前处于实验阶段，不适合生产使用，可能会受到严格的速率限制。 ...

OpenAI 125K context $3/M input tokens $12/M output tokens

DeepSeek V3

DeepSeek-V3 是 DeepSeek 团队最新的模型，基于之前版本的指令跟随和编码能力。该模型在近 15 万亿个标记上进行预训练，报告的评估显示该模型在性能上优于其他开源模型，并与领先的闭源模型相媲美。有关模型的详细信息，请访问 DeepSeek-V3 仓库以获取更多信息。 DeepSeek-V2 Chat 是 DeepSeek-V2 的对话微调版本，属于混合专家（MoE）语言模型。 ...

DeepSeek 62.5K context $0.14/M input tokens $0.28/M output tokens

xAI: Grok 2 Vision 1212

Text image 2 text

Grok 2 Vision 1212 通过更强的视觉理解、精细的指令跟随和多语言支持，推动基于图像的 AI 发展。从物体识别到风格分析，它使开发者能够构建更直观、具视觉意识的应用程序。其增强的可操控性和推理能力为下一代图像解决方案奠定了坚实的基础。要了解更多关于该模型的信息，请查看 xAI's announcement. ...

X AI 32K context $2/M input tokens $10/M output tokens $0.004/M image tokens

Sao10K: Llama 3.3 Euryale 70B

Euryale L3.3 70B 是一个专注于创意角色扮演的模型，来自 Sao10k。它是 Euryale L3 70B v2.2 的继任者。 ...

Rifx.Online 7.81K context $1.5/M input tokens $1.5/M output tokens

70% OFF

nova-lite

Text image 2 text

Amazon Nova Lite 1.0 是亚马逊推出的一款非常低成本的多模态模型，专注于快速处理图像、视频和文本输入以生成文本输出。Amazon Nova Lite 可以高精度地处理实时客户交互、文档分析和视觉问答任务。在 300K tokens 的输入上下文下，它可以在单个输入中分析多个图像或长达 30 分钟的视频。 ...

Amazon 292.97K context $0.06/M input tokens $0.24/M output tokens

70% OFF

nova-pro

Text image 2 text

Amazon Nova Pro 1.0 是一款来自亚马逊的强大多模态模型，专注于为广泛任务提供准确性、速度和成本的结合。截至2024年12月，它在关键基准测试上实现了最先进的性能，包括视觉问答（TextVQA）和视频理解（VATEX）。 Amazon Nova Pro 在处理视觉和文本信息以及分析财务文件方面表现出色。注意：目前不支持视频输入和工具调用。 ...

Amazon 292.97K context $0.8/M input tokens $3.2/M output tokens $0.001/M image tokens

gemini-exp-1206

Text image 2 text

实验性版本（2024年12月6日）发布的 Gemini。 ...

Google 8K context $4/M input tokens $16/M output tokens

text-embedding-3-large

text-embedding-3-large 是 OpenAI 于2024年发布的最新文本嵌入模型。相比前代模型，它具有以下主要特点：主要特性更强的性能: 在大多数任务上的表现都优于之前的 text-embedding-ada-002 模型更好的多语言支持: 支持100多种语言的文本嵌入更长的上下文: 支持最多8192个tokens的输入...

OpenAI $0.13/M input tokens $0 output tokens

40% OFF

Gemini 1.5 Pro

Text image 2 text

Google最新的多模态模型，支持在文本或聊天提示中使用图像和视频。针对以下语言任务进行了优化：代码生成文本生成文本编辑问题解决推荐信息提取数据提取或生成 AI代理使用Gemini需遵循Google的Gemin使用条款。 #multimodal ...

Google 1.91M context $2.5/M input tokens $10/M output tokens $0.003/M image tokens

Amazon: Nova Pro 1.0

Text image 2 text

Amazon Nova Pro 1.0 是一款来自亚马逊的强大多模态模型，专注于为广泛任务提供准确性、速度和成本的结合。截至2024年12月，它在关键基准测试上实现了最先进的性能，包括视觉问答（TextVQA）和视频理解（VATEX）。 Amazon Nova Pro 在处理视觉和文本信息以及分析财务文件方面表现出色。注意：目前不支持视频输入和工具调用。 ...

Amazon 292.97K context $0.8/M input tokens $3.2/M output tokens $0.001/M image tokens

Amazon: Nova Lite 1.0

Text image 2 text

Amazon Nova Lite 1.0 是亚马逊推出的一款非常低成本的多模态模型，专注于快速处理图像、视频和文本输入以生成文本输出。Amazon Nova Lite 可以高精度地处理实时客户交互、文档分析和视觉问答任务。在 300K tokens 的输入上下文下，它可以在单个输入中分析多个图像或长达 30 分钟的视频。 ...

Amazon 292.97K context $0.06/M input tokens $0.24/M output tokens

40% OFF

Claude-3-Haiku-20240307

Text image 2 text

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型，提供近乎即时的响应能力。快速且准确的针对性表现。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $0.5/M input tokens $2.5/M output tokens $0.4/K image tokens

40% OFF

Gemini Flash 1.5

Text image 2 text

Gemini 1.5 Flash 是一个基础模型，在视觉理解、分类、摘要以及从图像、音频和视频创建内容等多种多模态任务中表现出色。它擅长处理视觉和文本输入，如照片、文档、信息图和截图。 Gemini 1.5 Flash 旨在应对高容量、高频率的任务，在这些任务中，成本和延迟至关重要。在大多数常见任务中，Flash 的质量与其他 Gemini Pro 模型相当，但成本显著降低。Flash 非常 ...

Google 976.56K context $0.15/M input tokens $0.6/M output tokens $0.04/K image tokens

Toppy M 7B

一个野生的 7B 参数模型，使用来自 mergekit 的新任务算术合并方法合并了多个模型。合并模型列表： NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonilia/AshhLimaRP-Mistral-7B...

Undi95 4K context $0.07/M input tokens $0.07/M output tokens

GPT-4o mini

Text image 2 text

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

40% OFF

gpt-4o

Text image 2 text

GPT-4o（“o”代表“全能”）是OpenAI最新的AI模型，支持文本和图像输入，并输出文本。它保持了GPT-4 Turbo的智能水平，同时速度是其两倍，成本效益提高了50%。GPT-4o在处理非英语语言和增强视觉能力方面也提供了更好的性能。为了与其他模型进行基准测试，它曾被暂时称为["im-also-a-good-gpt2-chatbot"] ...

OpenAI 125K context $2.5/M input tokens $10/M output tokens $0.004/M image tokens

40% OFF

GPT-4o mini

Text image 2 text

# Discount # 40%Off # Discount

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

MythoMax 13B (extended)

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $1.125/M input tokens $1.125/M output tokens

FREE

MythoMax 13B (free)

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $0 input tokens $0 output tokens

Mistral: Pixtral Large 2411

Text image 2 text

Pixtral Large 是一个 124B 开放权重的多模态模型，基于 Mistral Large 2 构建。该模型能够理解文档、图表和自然图像。该模型在 Mistral Research License (MRL) 下提供，供研究和教育使用；并在 Mistral Commercial License 下提供，供实验、测试和 ...

MistralAI 125K context $2/M input tokens $6/M output tokens $0.003/M image tokens

FREE

Toppy M 7B (free)

一个野生的 7B 参数模型，使用来自 mergekit 的新任务算术合并方法合并了多个模型。合并模型列表： NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonilia/AshhLimaRP-Mistral-7B...

Undi95 4K context $0 input tokens $0 output tokens

Google: Gemini Pro Vision 1.0

Text image 2 text

Google的旗舰多模态模型，支持在文本或聊天提示中使用图像和视频，以获得文本或代码响应。请参阅Deepmind提供的基准和提示指南。使用Gemini需遵循Google的Gemini使用条款。 #multimodal ...

Google 16K context $0.5/M input tokens $1.5/M output tokens $0.003/M image tokens

Google: Gemini Pro 1.5

Text image 2 text

Google最新的多模态模型，支持在文本或聊天提示中使用图像和视频。针对以下语言任务进行了优化：代码生成文本生成文本编辑问题解决推荐信息提取数据提取或生成 AI代理使用Gemini需遵循Google的Gemin使用条款。 #multimodal ...

Google 1.91M context $1.25/M input tokens $5/M output tokens $0.003/M image tokens

Cohere: Command R+

command-r-plus-08-2024 是 Command R+ 的更新，与之前的 Command R+ 版本相比，吞吐量提高了大约 50%，延迟降低了 25%，同时硬件占用保持不变。在此处阅读发布帖子 here。 ...

Cohere 125K context $2.85/M input tokens $14.25/M output tokens

AI21: Jamba Instruct

The Jamba-Instruct model, introduced by AI21 Labs, is an instruction-tuned variant of their hybrid SSM-Transformer Jamba model, specifically optimized for enterprise applications.256K Context Win...

Ai21 250K context $0.5/M input tokens $0.7/M output tokens

Mistral: Mistral 7B Instruct

一个高性能、行业标准的 7.3B 参数模型，针对速度和上下文长度进行了优化。 Mistral 7B Instruct 有多个版本变体，这里是最新版本。 ...

MistralAI 32K context $0.055/M input tokens $0.055/M output tokens

Google: Gemini Flash 1.5

Text image 2 text

Gemini 1.5 Flash 是一个基础模型，在视觉理解、分类、摘要以及从图像、音频和视频创建内容等多种多模态任务中表现出色。它擅长处理视觉和文本输入，如照片、文档、信息图和截图。 Gemini 1.5 Flash 旨在应对高容量、高频率的任务，在这些任务中，成本和延迟至关重要。在大多数常见任务中，Flash 的质量与其他 Gemini Pro 模型相当，但成本显著降低。Flash 非常适 ...

Google 976.56K context $0.075/M input tokens $0.3/M output tokens $0.04/K image tokens

FREE

Google: Gemma 2 9B (free)

Gemma 2 9B by Google 是一个先进的开源语言模型，在其尺寸类别中设定了效率和性能的新标准。该模型旨在处理多种任务，使开发者和研究人员能够构建创新应用，同时保持可访问性、安全性和成本效益。有关更多详细信息，请参见 launch announcement ...

Google 8K context $0 input tokens $0 output tokens

Google: Gemma 2 9B

Gemma 2 9B by Google 是一个先进的开源语言模型，在其尺寸类别中设定了效率和性能的新标准。该模型旨在处理多种任务，使开发者和研究人员能够构建创新应用，同时保持可访问性、安全性和成本效益。有关更多详细信息，请参见 launch announcement ...

Google 8K context $0.06/M input tokens $0.06/M output tokens

Mistral: Codestral Mamba

A 7.3B 参数的基于 Mamba 的模型，旨在处理代码和推理任务。线性时间推理，允许理论上无限的序列长度 256k 令牌上下文窗口针对快速响应进行了优化，特别有利于代码生产力在代码和推理任务中表现与最先进的变换器模型相当根据 Apache 2.0 许可证提供，允许免费使用、修改和分发...

MistralAI 250K context $0.25/M input tokens $0.25/M output tokens

Mistral: Mistral Nemo

A 12B 参数模型，具有 128k 令牌上下文长度，由 Mistral 与 NVIDIA 合作构建。该模型是多语言的，支持英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语。它支持函数调用，并在 Apache 2.0 许可证下发布。 ...

MistralAI 125K context $0.13/M input tokens $0.13/M output tokens

Mistral: Pixtral 12B

Text image 2 text

Mistral AI 的第一个图像到文本模型。根据他们的传统，其权重通过 torrent 发布： https://x.com/mistralai/status/1833758285167722836 ...

MistralAI 4K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Meta: Llama 3.2 1B Instruct

Llama 3.2 1B 是一个拥有 10 亿参数的语言模型，专注于高效执行自然语言任务，如摘要、对话和多语言文本分析。其较小的体积使其能够在低资源环境中高效运行，同时保持强大的任务性能。支持八种核心语言，并可进行微调以支持更多，Llama 1.3B 非常适合寻求轻量级但强大的 AI 解决方案的企业或开发者，这些解决方案能够在多样的多语言环境中运行，而不需要大型模型的高计算需求。点击这里 ...

Meta Llama 128K context $0.01/M input tokens $0.02/M output tokens

FREE

Google: Gemini Pro 1.5 Experimental

Text image 2 text

Google最新的多模态模型，支持在文本或聊天提示中使用图像和视频。针对以下语言任务进行了优化：代码生成文本生成文本编辑问题解决推荐信息提取数据提取或生成 AI代理使用Gemini需遵循Google的Gemin使用条款。 #multimodal ...

Google 1.91M context $0 input tokens $0 output tokens $0.003/M image tokens

Anthropic: Claude 3 Sonnet

Text image 2 text

Claude 3 Sonnet 是企业工作负载的智能与速度的理想平衡。以更低的价格提供最大效用，可靠，适合大规模部署的平衡。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Anthropic: Claude 3 Haiku

Text image 2 text

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型，提供近乎即时的响应能力。快速且准确的针对性表现。查看发布公告和基准测试结果 here #multimodal ...

Anthropic 195.31K context $0.25/M input tokens $1.25/M output tokens $0.4/K image tokens

Qwen2-VL 7B Instruct

Text image 2 text

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：对各种分辨率和比例的图像的最先进理解：Qwen2-VL 在视觉理解基准测试中取得了最先进的表现，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以实现高质量的视频问答、对话、内容创作等。...

Qwen 32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

OpenAI: o1-preview

OpenAI 最新和最强大的模型系列，o1 旨在在响应之前花更多时间思考。 o1 模型针对数学、科学、编程和其他 STEM 相关任务进行了优化。它们在物理、化学和生物学的基准测试中始终表现出博士级的准确性。了解更多信息请查看 launch announcement。注意：该模型目前处于实验阶段，不适合生产使用，并且可能会受到严重的速率限制。 ...

OpenAI 125K context $15/M input tokens $60/M output tokens

AI21: Jamba 1.5 Large

Jamba 1.5 Large 是 AI21 新一代开放模型家族的一部分，提供卓越的速度、效率和质量。它具有 256K 的有效上下文窗口，是开放模型中最长的，能够在文档摘要和分析等任务上提升性能。基于新颖的 SSM-Transformer 架构，它在基准测试中超越了更大的模型，如 Llama 3.1 70B，同时保持资源效率。阅读他们的 [announcement](https:// ...

Ai21 250K context $2/M input tokens $8/M output tokens

AI21: Jamba 1.5 Mini

Jamba 1.5 Mini 是世界上首个生产级的基于 Mamba 的模型，结合了 SSM 和 Transformer 架构，具有 256K 的上下文窗口和高效能。它支持 9 种语言，能够处理各种写作和分析任务，表现与类似的小模型相当或更好。该模型使用更少的计算机内存，并且在处理较长文本时比以前的设计更快。阅读他们的 [announcement](https://www.ai21.c ...

Ai21 250K context $0.2/M input tokens $0.4/M output tokens

GPT-4o

Text image 2 text

GPT-4o（“o”代表“全能”）是OpenAI最新的AI模型，支持文本和图像输入，并输出文本。它保持了GPT-4 Turbo的智能水平，同时速度是其两倍，成本效益提高了50%。GPT-4o在处理非英语语言和增强视觉能力方面也提供了更好的性能。为了与其他模型进行基准测试，它曾被暂时称为["im-also-a-good-gpt2-chatbot"] ...

OpenAI 125K context $2.5/M input tokens $10/M output tokens $0.004/M image tokens

OpenAI: GPT-4o

Text image 2 text

GPT-4o（“o”代表“全能”）是OpenAI最新的AI模型，支持文本和图像输入，并输出文本。它保持了GPT-4 Turbo的智能水平，同时速度是其两倍，成本效益提高了50%。GPT-4o在处理非英语语言和增强视觉能力方面也提供了更好的性能。为了与其他模型进行基准测试，它曾被暂时称为["im-also-a-good-gpt2-chatbot"] ...

OpenAI 125K context $2.5/M input tokens $10/M output tokens $0.004/M image tokens

OpenAI: GPT-4o-mini

Text image 2 text

GPT-4o mini 是 OpenAI 在 GPT-4 Omni 之后推出的最新模型，支持文本和图像输入，并提供文本输出。作为他们最先进的小型模型，它的价格比其他最近的前沿模型便宜了许多，且比 GPT-3.5 Turbo 便宜超过 60%。它保持了 SOTA 智能，同时在成本效益上显著更高。 GPT-4 ...

OpenAI 125K context $0.15/M input tokens $0.6/M output tokens $0.007/M image tokens

Inflection: Inflection 3 Productivity

Inflection 3 的生产力经过优化，以便更好地遵循指令。它更适合需要 JSON 输出或严格遵循提供的指南的任务。有关类似于 Pi 的情感智能，请参见 Inflect 3 Pi。有关更多详细信息，请参见 Inflection 的公告。 ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Liquid: LFM 40B MoE (free)

Liquid的40.3B专家混合模型（MoE）。Liquid基础模型（LFMs）是基于动态系统构建的大型神经网络。 LFMs是通用的AI模型，可以用于建模任何类型的序列数据，包括视频、音频、文本、时间序列和信号。请查看发布公告以获取基准测试和更多信息。 _这些是免费的、速率限制的端点，适 ...

Liquid 8K context $0 input tokens $0 output tokens

FREE

Meta: Llama 3.2 1B Instruct (free)

Llama 3.2 1B 是一个拥有 10 亿参数的语言模型，专注于高效执行自然语言任务，如摘要、对话和多语言文本分析。其较小的体积使其能够在低资源环境中高效运行，同时保持强大的任务性能。支持八种核心语言，并可进行微调以支持更多，Llama 1.3B 非常适合寻求轻量级但强大的 AI 解决方案的企业或开发者，这些解决方案能够在多样的多语言环境中运行，而不需要大型模型的高计算需求。点击这里 ...

Meta Llama 128K context $0 input tokens $0 output tokens

OpenAI: o1-mini (2024-09-12)

OpenAI 最新和最强大的模型系列，o1 旨在在响应之前花更多时间思考。 o1 模型针对数学、科学、编程和其他 STEM 相关任务进行了优化。它们在物理、化学和生物学的基准测试中始终表现出博士级的准确性。有关更多信息，请参阅发布公告。注意：该模型目前处于实验阶段，不适合生产使用，可能会受到严格的速率限制。 ...

OpenAI 125K context $3/M input tokens $12/M output tokens

Google: Gemini Experimental 1121 (free)

Text image 2 text

实验性版本（2024年11月21日）的 Gemini。 ...

Rifx.Online 8K context $0 input tokens $0 output tokens

ERNIE-Speed-128K

开发者/公司: 百度研究关键能力与应用场景: ERNIE-Speed-128K 在实时应用中表现出色，利用知识整合增强语义理解，适用于机器翻译、文本摘要、情感分析和智能问答系统。特点与改进:知识增强: 集成全面的知识图谱。模型压缩: 采用剪枝和量化技术提高效率。动态推理: 根据输入特征动态调整计...

Ernie 128K context $0 input tokens $0 output tokens

ERNIE-Bot-turbo

开发者/公司：百度概述： ERNIE Bot Turbo 是 ERNIE Bot 的增强版本，提供扩展的功能，支持 7K 输入 + 1K 输出。它包括系统设置和新的推理参数。 ERNIE Bot 特性：文学创作：总结核心内容并为文学作品建议续写角度；回答有关衍生品的事实问题。商业文案：创建富有创意和吸引力...

Ernie 8K context $1.65/M input tokens $1.65/M output tokens

GLM-4 AirX

基本信息 “GLM-4-AIRX”是一种先进的大型语言模型，由人工智能领域的专家研发。它以其强大的自然语言处理能力著称，能够有效地理解和生成自然语言文本。此模型依赖于深度学习技术，特别是广泛应用于NLP（自然语言处理）领域的Transformer架构。技术特点 1. 基于Transformer架构该模型利用了Transformer架构， ...

ChatGLM 7.81K context $1.4/M input tokens $1.4/M output tokens

glm-4v

GLM-4V 模型介绍关键能力和主要使用案例多模态对话：参与基于文本和图像的对话。图像理解：分析和描述图像，包括高达 1120x1120 像素的高分辨率图像。文本生成：为聊天机器人、语言翻译和文本摘要等任务生成类人文本。使用案例：智能助手、多模态内容生成、多语言理解和客户服务[1][2][4]。...

ChatGLM 31.25K context $7/M input tokens $7/M output tokens

glm-4-flash

GLM-4-Flash 模型介绍关键能力和主要使用案例处理多轮对话、网络搜索和工具调用。支持长文本推理，上下文长度可达 128K，输出长度可达 4K。支持 26 种语言的多语言功能，包括中文、英语、日语、韩语和德语。最重要的特性和改进通过自适应权重量化、并行处理、批处理和推测采样优化速度。提供微调功能，以适应...

ChatGLM 125K context $0.01/M input tokens $0.01/M output tokens

glm-4v-plus

GLM-4V-Plus 模型介绍关键能力和主要应用场景多模态理解：在图像和视频理解方面表现出色，包括时间序列分析和视觉问答[2][3]。文本到图像生成：与行业顶尖模型如 MJ-V6 和 FLUX 的表现相当[2]。多模态对话 AI：支持文本、音频和视频模态，实现流畅的对话和实时推理[2]。最重要的 ...

ChatGLM 31.25K context $1.4/M input tokens $1.4/M output tokens

glm-4-plus

GLM-4-Plus 模型介绍关键能力和主要使用案例语言理解：在语言理解、指令执行和长文本处理方面具有先进能力。多模态支持：包括文本到图像生成模型（CogView-3-Plus）、图像/视频理解模型（GLM-4V-Plus）和视频生成模型（CogVideoX）。跨模态交互：支持文本、音频和视频模态，如在青眼...

ChatGLM 125K context $7/M input tokens $7/M output tokens

GLM-4 Long

GLM-4 Long GLM-4 Long 是一款先进的语言模型，专为扩展上下文处理而设计，非常适合需要对长文档进行全面文本分析和生成的应用。关键能力扩展上下文理解：能够处理显著更长的文本而不失去连贯性。多功能应用：适用于内容创作、摘要、翻译和复杂问题解决。重要特性增强记忆机制：改进了对大量输入数据的...

ChatGLM 976.56K context $0.14/M input tokens $0.14/M output tokens

GLM-4 Air

GLM-4 Air 模型介绍关键能力和主要使用案例多语言支持：主要针对中文和英文，同时支持24种其他语言。任务完成：能够通过网页浏览访问在线信息，使用Python解释器解决数学问题，利用文本到图像模型，并调用用户定义的函数[2][5]。指令遵循：在英文和中文中有效地遵循指令[2]。最重要的特性和改 ...

ChatGLM 125K context $0.14/M input tokens $0.14/M output tokens

Ministral 8B

Ministral 8B 是一个具有 8B 参数的模型，采用独特的交错滑动窗口注意力模式，以实现更快、更节省内存的推理。该模型专为边缘使用案例设计，支持最长 128k 的上下文长度，并在知识和推理任务中表现出色。它在低于 10B 的类别中优于同类产品，非常适合低延迟、注重隐私的应用。 ...

Mistralai 125K context $0.1/M input tokens $0.1/M output tokens

Inflection: Inflection 3 Productivity

Inflection 3 的生产力经过优化，以便更好地遵循指令。它更适合需要 JSON 输出或精确遵循提供的指导方针的任务。有关类似于 Pi 的情感智能，请参见 Inflect 3 Pi。有关更多详细信息，请参见 [Inflection 的公告](https://inflection.ai/blog ...

Inflection 7.81K context $2.5/M input tokens $10/M output tokens

Meta: Llama 3.2 1B Instruct

Llama 3.2 1B 是一个拥有10亿参数的语言模型，专注于高效执行自然语言任务，如摘要、对话和多语言文本分析。其较小的规模使其能够在低资源环境中高效运行，同时保持强大的任务性能。支持八种核心语言，并可针对更多语言进行微调，Llama 1.3B 非常适合寻求轻量级但强大的 AI 解决方案的企业或开发者，这些解决方案能够在多样化的多语言环境中运行，而不需要大型模 ...

Meta llama 128K context $0.01/M input tokens $0.02/M output tokens

Meta: Llama 3.2 90B Vision Instruct (free)

Text image 2 text

The Llama 90B Vision模型是一款顶级的90亿参数多模态模型，旨在应对最具挑战性的视觉推理和语言任务。它在图像描述、视觉问答和高级图像-文本理解方面提供无与伦比的准确性。该模型在庞大的多模态数据集上进行预训练，并通过人类反馈进行微调，旨在处理最苛刻的基于图像的AI任务。该模型非常适合需要尖端多模态AI能力的行业，特别是那些处理复杂实时视觉和文本分析 ...

Rifx.Online 4K context $0 input tokens $0 output tokens

Mistral: Pixtral 12B

Text image 2 text

Mistral AI 的第一个图像到文本模型。根据他们的传统，其权重通过 torrent 发布： https://x.com/mistralai/status/1833758285167722836 ...

Mistralai 4K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Cohere: Command R+ (08-2024)

command-r-plus-08-2024 是 Command R+ 的更新，与之前的 Command R+ 版本相比，吞吐量提高了大约 50%，延迟降低了 25%，同时保持相同的硬件占用。在 [这里](https://docs.cohere.com/changelog/command-gets-refresh ...

Cohere 125K context $2.375/M input tokens $9.5/M output tokens

Google: Gemini Flash 8B 1.5 Experimental

Text image 2 text

Gemini 1.5 Flash 8B Experimental 是 Gemini 1.5 Flash 模型的实验性 8B 参数版本。使用 Gemini 需遵循 Google 的 Gemini 使用条款。 #multimodal 注意：该模型目 ...

Google 976.56K context $0 input tokens $0 output tokens

AI21: Jamba 1.5 Large

Jamba 1.5 Large 是 AI21 新一代开放模型家族的一部分，提供卓越的速度、效率和质量。它具有 256K 的有效上下文窗口，是开放模型中最长的，能够在文档摘要和分析等任务上提升性能。基于新颖的 SSM-Transformer 架构，它在基准测试中超越了更大的模型，如 Llama 3.1 70B，同时保持资源效率。阅读他们的 [announce ...

Ai21 250K context $2/M input tokens $8/M output tokens

AI21: Jamba 1.5 Mini

Jamba 1.5 Mini 是世界上首个生产级 Mamba 基础模型，结合了 SSM 和 Transformer 架构，具有 256K 的上下文窗口和高效率。它支持 9 种语言，并能够处理各种写作和分析任务，效果与类似的小模型相当或更好。该模型比以前的设计使用更少的计算机内存，并且在处理较长文本时速度更快。阅读他们的 [公告](https://www.a ...

Ai21 250K context $0.2/M input tokens $0.4/M output tokens

Anthropic: Claude 3 Sonnet

Text image 2 text

None ...

Anthropic 195.31K context $3/M input tokens $15/M output tokens $0.005/M image tokens

Google: PaLM 2 Chat 32k

PaLM 2 是谷歌推出的一种语言模型，具备更强的多语言、推理和编码能力。 ...

Google 31.99K context $1/M input tokens $2/M output tokens