MiniMax: MiniMax-01

976.75K Context
0.2/M Input Tokens
1.1/M Output Tokens

MiniMax-01 是一个结合了 MiniMax-Text-01 进行文本生成和 MiniMax-VL-01 进行图像理解的模型。它拥有 4560 亿个参数，每次推理激活 459 亿个参数，并且可以处理多达 400 万个 token 的上下文。

文本模型采用混合架构，结合了 Lightning Attention、Softmax Attention 和专家混合（MoE）。图像模型采用“ViT-MLP-LLM”框架，并在文本模型的基础上进行训练。

要了解更多关于发布的信息，请访问： https://www.minimaxi.com/en/news/minimax-01-series-2

Anthropic: Claude 3.5 Haiku (2024-10-22)

Text 2 text

Claude 3.5 Haiku 在所有技能领域中都进行了增强，包括编码、工具使用和推理。作为 Anthropic 系列中速度最快的模型，它提供快速的响应时间，适用于需要高交互性和低延迟的应用，如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色，使其成为广泛行业的多功能工具。它不支持图像输入。查看发布公告和基准测试结果 [he ...

Rifx.Online 195.31K context $1/M input tokens $5/M output tokens

Google: Gemini Experimental 1121 (free)

Text image 2 text

实验性版本（2024年11月21日）的 Gemini。 ...

Rifx.Online 8K context $0 input tokens $0 output tokens

Google: Gemma 2 9B (free)

Text 2 text

Gemma 2 9B by Google 是一个先进的开源语言模型，在其尺寸类别中设定了效率和性能的新标准。该模型旨在支持多种任务，使开发者和研究人员能够构建创新应用，同时保持可访问性、安全性和成本效益。有关更多详细信息，请参阅发布公告。 ...

Rifx.Online 4K context $0 input tokens $0 output tokens

Inflatebot: Mag Mell R1 12B

Text 2 text

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并，使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型，结合了许多其他模型的最佳部分，成为许多用例的通用解决方案。旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成：Hero (RP, trop...

Rifx.Online 15.63K context $0.9/M input tokens $0.9/M output tokens