曼巴比特

C-Eval

C-Eval是一个由顶尖大学研发的中文大语言模型评估套件，涵盖52个学科和4个难度级别，通过13,948个多项选择题全面测试AI的中文理解能力。

体验C-Eval

C-Eval是一款专为评估大语言模型（LLMs）中文理解能力而设计的综合评测套件。这个创新性的工具由上海交通大学、清华大学和爱丁堡大学的研究团队于2023年5月联合推出。

C-Eval的主要特点包括：

通过这种多层次、多学科的评估方法，C-Eval能够全面且深入地测试大语言模型在中文理解和应用方面的能力，为研究人员和开发者提供了宝贵的评估工具。