Type something to search...
Qwen2-VL 7B Instruct

Qwen2-VL 7B Instruct

  • 32K Context
  • 0.1/M Input Tokens
  • 0.1/M Output Tokens
  • 0.144/K Image Tokens
模型已不可用

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM,具有以下关键增强功能:

  • 对各种分辨率和比例的图像的最先进理解:Qwen2-VL 在视觉理解基准测试中实现了最先进的性能,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。

  • 理解超过 20 分钟的视频:Qwen2-VL 能够理解超过 20 分钟的视频,以便进行高质量的视频问答、对话、内容创作等。

  • 能够操作手机、机器人等的代理:凭借复杂推理和决策能力,Qwen2-VL 可以与手机、机器人等设备集成,实现基于视觉环境和文本指令的自动操作。

  • 多语言支持:为了服务全球用户,除了英语和中文,Qwen2-VL 现在还支持理解图像中不同语言的文本,包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。

有关更多详细信息,请参阅此 博客文章GitHub 仓库

使用此模型须遵循 Tongyi Qianwen LICENSE AGREEMENT

Related Posts

Qwen2 7B 是一个基于变换器的模型,擅长语言理解、多语言能力、编码、数学和推理。 它具有 SwiGLU 激活、注意力 QKV 偏置和组查询注意力。它在大量数据上进行预训练,并经过监督微调和直接偏好优化。 有关更多详细信息,请参阅此 博客文章 和 [GitHub 仓库](https ...

Qwen 2 7B Instruct
Qwen
32K context $0.054/M input tokens $0.054/M output tokens

Qwen2 VL 72B 是来自 Qwen Team 的多模态 LLM,具有以下关键增强功能:对各种分辨率和比例图像的最先进理解:Qwen2-VL 在视觉理解基准测试中实现了最先进的性能,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频:Qwen2-VL 可以理解超过 20 分钟的视频,以进行高...

Qwen2-VL 72B Instruct
Qwen
32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

Qwen2.5 72B 是 Qwen 大型语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学能力上有了很大提升,这得益于我们在这些领域的专业专家模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出(特别是 JSON)方面有显著改进。对系统提示的多样...

Qwen2.5 72B Instruct
Qwen
128K context $0.35/M input tokens $0.4/M output tokens

Qwen2.5 7B 是 Qwen 大语言模型的最新系列。Qwen2.5 在 Qwen2 的基础上带来了以下改进:知识显著增加,并在编码和数学方面的能力大幅提升,这得益于我们在这些领域的专业模型。在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如,表格)以及生成结构化输出,特别是 JSON 方面有显著改进。对系统提示的多样性更具韧...

Qwen2.5 7B Instruct
Qwen
128K context $0.27/M input tokens $0.27/M output tokens

Qwen2.5-Coder 是最新一系列针对代码的 Qwen 大型语言模型(以前称为 CodeQwen)。Qwen2.5-Coder 在 CodeQwen1.5 的基础上带来了以下改进:在 代码生成、代码推理 和 代码修复 方面有显著提升。 为现实世界应用(如 代码代理)提供了更全面的基础。不仅增强了编码能力,还保持了其在数...

Qwen2.5 Coder 32B Instruct
Qwen
32K context $0.18/M input tokens $0.18/M output tokens