GLM-4 Air
- 125K Context
- 0.14/M Input Tokens
- 0.14/M Output Tokens
- ChatGLM
- Text 2 text
- 14 Nov, 2024
GLM-4 Air 模型介绍
关键能力和主要使用案例
- 多语言支持:主要针对中文和英文,同时支持24种其他语言。
- 任务完成:能够通过网页浏览访问在线信息,使用Python解释器解决数学问题,利用文本到图像模型,并调用用户定义的函数[2][5]。
- 指令遵循:在英文和中文中有效地遵循指令[2]。
最重要的特性和改进
- 多阶段后训练:包括监督微调和从人类反馈中学习,以实现高质量的对齐[2]。
- 高效推理:与GLM-4相比,设计上具有更低的延迟和推理成本,使其在实时应用中更高效[2][3]。
- 高级工具集成:自动选择并使用适当的工具来完成复杂任务[2]。
重要技术规格
- 训练数据:在十万亿个标记上进行预训练,主要为中文和英文[2]。
- 上下文长度:支持最长128K的上下文长度[2][5]。
- 模型版本:提供多种版本,包括GLM-4-Air、GLM-4-9B和GLM-4V-9B[2][5]。
显著的性能特征
- 基准性能:在多个基准测试中,如MMLU、GSM8K、MATH和HumanEval,紧密追赶或超越GPT-4。在中文对齐方面超越GPT-4,并在指令遵循方面与GPT-4-Turbo相匹配[2]。
- 长上下文任务:在长上下文任务中与GPT-4 Turbo和Claude 3的表现相当[2]。