robotics

Qwen2-VL 7B Instruct

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：对各种分辨率和比例的图像的最先进理解：Qwen2-VL 在视觉理解基准测试中取得了最先进的表现，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以实现高质量的视频问答、对话、内容创作等。...

Qwen 32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Qwen2-VL 72B Instruct

Text image 2 text

Qwen2 VL 72B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：SoTA 对各种分辨率和比例图像的理解：Qwen2-VL 在视觉理解基准测试中实现了最先进的性能，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以进行高质量的视频问答、对话、内容创作...

Qwen 32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

glm-4v

Text 2 text

GLM-4V 模型介绍关键能力和主要使用案例多模态对话：参与基于文本和图像的对话。图像理解：分析和描述图像，包括高达 1120x1120 像素的高分辨率图像。文本生成：为聊天机器人、语言翻译和文本摘要等任务生成类人文本。使用案例：智能助手、多模态内容生成、多语言理解和客户服务[1][2][4]。...

ChatGLM 31.25K context $7/M input tokens $7/M output tokens

认识 Ministral 3B 和 8B：边缘 AI 游戏规则改变者

Rifx.Online
Technology , Autonomous Systems , Data Science
01 Nov, 2024

Mistral AI在边缘AI和设备计算的新前沿在快速发展的AI领域，边缘计算变得越来越重要，适用于那些需要低延迟、以隐私为首的高效推理的应用，而不依赖于基于云的基础设施。 Mistral AI最新推出的Ministral模型家族，标志着AI领域的一次突破性进展。为庆祝其开创性的*

Qwen2-VL 72B Instruct

Text image 2 text

Qwen2 VL 72B 是来自 Qwen Team 的多模态 LLM，具有以下关键增强功能：对各种分辨率和比例图像的最先进理解：Qwen2-VL 在视觉理解基准测试中实现了最先进的性能，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 可以理解超过 20 分钟的视频，以进行高...

Qwen 32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

Qwen2-VL 7B Instruct

Text image 2 text

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM，具有以下关键增强功能：对各种分辨率和比例的图像的最先进理解：Qwen2-VL 在视觉理解基准测试中实现了最先进的性能，包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频：Qwen2-VL 能够理解超过 20 分钟的视频，以便进行高质量...

Qwen 32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Robotics

Qwen2-VL 7B Instruct

Qwen2-VL 72B Instruct

glm-4v

认识 Ministral 3B 和 8B：边缘 AI 游戏规则改变者

Qwen2-VL 72B Instruct

Qwen2-VL 7B Instruct