Qwen2-VL 72B Instruct

32K Context
0.4/M Input Tokens
0.4/M Output Tokens
0.578/K Image Tokens

Qwen
Text image 2 text
02 Dec, 2024

与模型对话

Qwen2 VL 72B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：

SoTA 对各种分辨率和比例图像的理解：Qwen2-VL 在视觉理解基准测试中实现了最先进的性能，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。
理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以进行高质量的视频问答、对话、内容创作等。
能够操作您的手机、机器人等的代理：凭借复杂推理和决策能力，Qwen2-VL 可以与手机、机器人等设备集成，基于视觉环境和文本指令进行自动操作。
多语言支持：为了服务全球用户，除了英语和中文，Qwen2-VL 现在还支持理解图像中不同语言的文本，包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。

有关更多详细信息，请参见此 blog post 和 GitHub repo。

使用此模型须遵循 Tongyi Qianwen LICENSE AGREEMENT。

Qwen 2 7B Instruct

Text 2 text

Qwen2 7B 是一个基于变换器的模型，在语言理解、多语言能力、编码、数学和推理方面表现出色。它具有 SwiGLU 激活、注意力 QKV 偏置和组查询注意力。它在大量数据上进行了预训练，并进行了监督微调和直接偏好优化。有关更多详细信息，请参见这篇博客文章和 [GitHub 仓库](https://git ...

Qwen 32K context $0.054/M input tokens $0.054/M output tokens

FREE

Qwen 2 7B Instruct (free)

Text 2 text

# Free

Qwen 32K context $0 input tokens $0 output tokens

Qwen2-VL 7B Instruct

Text image 2 text

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：对各种分辨率和比例的图像的最先进理解：Qwen2-VL 在视觉理解基准测试中取得了最先进的表现，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以实现高质量的视频问答、对话、内容创作等。...

Qwen 32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Qwen2.5 72B Instruct

Text 2 text

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学方面大幅提升了能力，这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出（特别是 JSON）方面有显著改进。对系统提示的多样性更具韧性，增强了角色扮演的...

Qwen 128K context $0.35/M input tokens $0.4/M output tokens

Qwen2.5 7B Instruct

Text 2 text

Qwen2.5 7B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进：知识显著增加，并在编码和数学方面的能力大幅提升，这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本（超过 8K tokens）、理解结构化数据（例如，表格）以及生成结构化输出（尤其是 JSON）方面有显著改进。对系统提示的多样性更具韧性，增强了角色扮演的实...

Qwen 128K context $0.27/M input tokens $0.27/M output tokens

FREE