Type something to search...

Robotics

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM,具有以下关键增强功能:对各种分辨率和比例的图像的最先进理解:Qwen2-VL 在视觉理解基准测试中取得了最先进的表现,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频:Qwen2-VL 能够理解超过 20 分钟的视频,以实现高质量的视频问答、对话、内容创作等。...

Qwen2-VL 7B Instruct
Qwen
32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens

Qwen2 VL 72B 是来自 Qwen 团队的多模态 LLM,具有以下关键增强功能:SoTA 对各种分辨率和比例图像的理解:Qwen2-VL 在视觉理解基准测试中实现了最先进的性能,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频:Qwen2-VL 能够理解超过 20 分钟的视频,以进行高质量的视频问答、对话、内容创作...

Qwen2-VL 72B Instruct
Qwen
32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

GLM-4V 模型介绍 关键能力和主要使用案例多模态对话:参与基于文本和图像的对话。 图像理解:分析和描述图像,包括高达 1120x1120 像素的高分辨率图像。 文本生成:为聊天机器人、语言翻译和文本摘要等任务生成类人文本。 使用案例:智能助手、多模态内容生成、多语言理解和客户服务[1][2][4]。...

glm-4v
ChatGLM
31.25K context $7/M input tokens $7/M output tokens
认识 Ministral 3B 和 8B:边缘 AI 游戏规则改变者

认识 Ministral 3B 和 8B:边缘 AI 游戏规则改变者

Mistral AI在边缘AI和设备计算的新前沿 在快速发展的AI领域,边缘计算变得越来越重要,适用于那些需要低延迟、以隐私为首的高效推理的应用,而不依赖于基于云的基础设施。 Mistral AI最新推出的Ministral模型家族,标志着AI领域的一次突破性进展。 为庆祝其开创性的*

阅读更多

Qwen2 VL 72B 是来自 Qwen Team 的多模态 LLM,具有以下关键增强功能:对各种分辨率和比例图像的最先进理解:Qwen2-VL 在视觉理解基准测试中实现了最先进的性能,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频:Qwen2-VL 可以理解超过 20 分钟的视频,以进行高...

Qwen2-VL 72B Instruct
Qwen
32K context $0.4/M input tokens $0.4/M output tokens $0.578/K image tokens

Qwen2 VL 7B 是来自 Qwen 团队的多模态 LLM,具有以下关键增强功能:对各种分辨率和比例的图像的最先进理解:Qwen2-VL 在视觉理解基准测试中实现了最先进的性能,包括 MathVista、DocVQA、RealWorldQA、MTVQA 等。理解超过 20 分钟的视频:Qwen2-VL 能够理解超过 20 分钟的视频,以便进行高质量...

Qwen2-VL 7B Instruct
Qwen
32K context $0.1/M input tokens $0.1/M output tokens $0.144/K image tokens