曼巴比特

LLMEval3

LLMEval-3是复旦大学NLP实验室推出的最新大模型评测基准，专注于评估模型在13个学科门类、50多个二级学科的专业知识能力，包含约20万道标准生成式问答题目。

体验LLMEval3

LLMEval是由复旦大学自然语言处理实验室开发的大型语言模型评测基准。其最新版本LLMEval-3专注于评估模型的专业知识能力，覆盖范围广泛而深入：

评测内容涵盖：

通过这一全面的评测体系，LLMEval-3旨在深入衡量大型语言模型在各专业领域的知识掌握和应用能力。