Meta: Llama 3.2 90B Vision Instruct
- 128K Context
- 0.35/M Input Tokens
- 0.4/M Output Tokens
- 0.506/K Image Tokens
- Meta llama
- Text image 2 text
- 25 Sep, 2024
Llama 90B Vision模型是一款顶级的90亿参数多模态模型,旨在应对最具挑战性的视觉推理和语言任务。它在图像描述、视觉问答和高级图像-文本理解方面提供无与伦比的准确性。该模型在庞大的多模态数据集上进行预训练,并通过人类反馈进行微调,专为处理最苛刻的基于图像的AI任务而设计。
此模型非常适合需要尖端多模态AI能力的行业,尤其是那些处理复杂实时视觉和文本分析的行业。
点击此处查看原始模型卡片。
使用此模型需遵守Meta的可接受使用政策。