technologyweb

baichuan3-turbo

Baichuan3-Turbo 是一款先进的人工智能语言模型，旨在为用户提供高效、智能的自然语言处理解决方案。该模型结合了最新的深度学习技术，具有强大的文本生成和理解能力，可以广泛应用于对话系统、内容创作、信息检索等领域。主要特点：高效性：Baichuan3-Turbo 采用优化算法，使得处理速度显著提升，能够快速响应用户请求。多样性：该模型支持多...

Baichuan 31.25K context $1.7/M input tokens $1.7/M output tokens

ReMM SLERP 13B

Text 2 text

对原始 MythoMax-L2-B13 的一次重现试验，但使用了更新的模型。 #merge ...

Undi95 4K context $1.125/M input tokens $1.125/M output tokens

ReMM SLERP 13B (extended)

Text 2 text

对原始 MythoMax-L2-B13 的一次重现试验，但使用了更新的模型。 #merge ...

Undi95 4K context $1.125/M input tokens $1.125/M output tokens

Mixtral 8x7B (base)

Text 2 text

一个由 Mistral AI 提供的预训练生成稀疏专家混合模型，包含 8 个专家（前馈网络），总计 47B 参数。基础模型（未针对指令进行微调） - 请参见 Mixtral 8x7B Instruct 以获取经过指令微调的模型。 #moe ...

MistralAI 32K context $0.54/M input tokens $0.54/M output tokens

Phi-3 Mini 128K Instruct

Text 2 text

Phi-3 Mini 是一个强大的 3.8B 参数模型，旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化，它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。在发布时，Phi-3 Medium 在轻量级模型中展示了最先进的性能。该模型是静态的，训练于一个截止日期为 2023 年 10 月的离线数据集。 ...

Microsoft Azure 125K context $0.1/M input tokens $0.1/M output tokens

Phi-3 Medium 128K Instruct

Text 2 text

Phi-3 128K Medium 是一个强大的 140 亿参数模型，旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化，它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。在发布时，Phi-3 Medium 在轻量级模型中展示了最先进的性能。在 MMLU-Pro 评估中，该模型甚至接近 Llama3 70B 的性能水平。对于 4k 上下文长度，请尝试 [Phi-3 ...

Microsoft Azure 125K context $1/M input tokens $1/M output tokens

Cohere: Command R

Text 2 text

Command-R 是一个 35B 参数模型，能够以更高的质量、更可靠的方式以及更长的上下文执行对话语言任务。它可以用于复杂的工作流程，如代码生成、检索增强生成（RAG）、工具使用和代理。阅读发布帖子 here。使用此模型须遵循 Cohere 的 [Acceptable Use Policy](https://do ...

Cohere 125K context $0.475/M input tokens $1.425/M output tokens

Google: Gemma 2 27B

Text 2 text

Gemma 2 27B by Google 是一个开放模型，基于创建 Gemini models 所使用的相同研究和技术构建。 Gemma 模型非常适合各种文本生成任务，包括问答、摘要和推理。有关更多详细信息，请参阅 [launch announcement](https://blog.google/technology/developers/goo ...

Google 8K context $0.27/M input tokens $0.27/M output tokens

Gemini 1.5 Flash-8B 针对速度和效率进行了优化，在聊天、转录和翻译等小提示任务中提供了增强的性能。由于延迟降低，它在实时和大规模操作中非常有效。该模型专注于具有成本效益的解决方案，同时保持高质量的结果。 [点击这里了解更多关于该模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-gener ...

Google 976.56K context $0.037/M input tokens $0.15/M output tokens

Meta: Llama 3.2 3B Instruct

Text 2 text

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型，优化用于高级自然语言处理任务，如对话生成、推理和摘要。该模型采用最新的 transformer 架构，支持包括英语、西班牙语和印地语在内的八种语言，并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练，擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语言环境中进行文本生成时的准确 ...

Meta Llama 128K context $0.03/M input tokens $0.05/M output tokens

FREE

Meta: Llama 3.2 3B Instruct (free)

Text 2 text

# Free

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型，优化用于高级自然语言处理任务，如对话生成、推理和摘要。该模型采用最新的 transformer 架构，支持包括英语、西班牙语和印地语在内的八种语言，并且可以适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练，擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语言环境中进行文本生成时的准确 ...

Meta Llama 128K context $0 input tokens $0 output tokens

Qwen2-VL 72B Instruct

Text image 2 text

Qwen2 VL 72B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：SoTA 对各种分辨率和比例图像的理解：Qwen2-VL 在视觉理解基准测试中实现了最先进的性能，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以进行高质量的视频问答、对话、内容创作...

Qwen 32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

Google: Gemini 1.5 Flash-8B

Text image 2 text

Gemini 1.5 Flash-8B 针对速度和效率进行了优化，在聊天、转录和翻译等小提示任务中提供了增强的性能。通过减少延迟，它在实时和大规模操作中非常有效。该模型专注于成本效益解决方案，同时保持高质量的结果。 [点击此处了解更多关于此模型的信息](https://developers.googleblog.com/en/gemini-15-flash-8b-i ...