Hallucination

结构化生成是构建复杂的多步骤推理代理在LLM评估中的基础——尤其是对于开源模型披露：我是Opik的维护者，这是本文后面使用的开源项目之一。在过去几个月里，我一直在为语言模型开发基于LLM的评估（“LLM作为评判者”指标）。到目前为止，结果非常令人鼓舞，尤其是在像幻觉检测或内容审核这样的评估中，这些