SuperCLUE

SuperCLUE是一个全面的中文大模型评测基准,从基础能力、专业能力和中文特性三个维度,评估模型在语义理解、专业知识和中文特有任务等方面的表现,涵盖70多项能力测试。

体验SuperCLUE

什么是SuperCLUE

SuperCLUE:全面评估中文大模型的综合基准

SuperCLUE是一个专为中文通用大模型设计的综合性评测基准,通过三个关键维度全面衡量模型能力:

1. 基础能力

涵盖10项核心技能,包括:

  • 语义理解
  • 对话能力
  • 逻辑推理
  • 角色模拟
  • 代码处理
  • 生成与创作
  • 等其他能力

2. 专业能力

评估超过50项专业领域的能力,涉及:

  • 中学水平知识
  • 大学水平知识
  • 专业考试内容
  • 涵盖数学、物理、地理到社会科学等多个学科

3. 中文特性能力

专门针对中文语言特点,评估10项独特能力,包括:

  • 成语运用
  • 诗歌创作与理解
  • 文学鉴赏
  • 汉字字形分析
  • 等其他中文特有能力

通过这三个维度的综合评估,SuperCLUE旨在全面、客观地衡量中文大模型的各方面能力。