SuperCLUE
工具介绍:SuperCLUE是一个全面的中文大模型评测基准,从基础能力、专业能力和中文特性三个维度,评估模型在语义理解、专业知识和中文特有任务等方面的表现,涵盖70多项能力测试。
收录时间:2024-06-09 12:34:56
打开网站SuperCLUE 工具信息
目录
SuperCLUE:全面评估中文大模型的综合基准
SuperCLUE是一个专为中文通用大模型设计的综合性评测基准,通过三个关键维度全面衡量模型能力:
1. 基础能力
涵盖10项核心技能,包括:
- 语义理解
- 对话能力
- 逻辑推理
- 角色模拟
- 代码处理
- 生成与创作
- 等其他能力
2. 专业能力
评估超过50项专业领域的能力,涉及:
- 中学水平知识
- 大学水平知识
- 专业考试内容
- 涵盖数学、物理、地理到社会科学等多个学科
3. 中文特性能力
专门针对中文语言特点,评估10项独特能力,包括:
- 成语运用
- 诗歌创作与理解
- 文学鉴赏
- 汉字字形分析
- 等其他中文特有能力
通过这三个维度的综合评估,SuperCLUE旨在全面、客观地衡量中文大模型的各方面能力。
评论 (0)
暂无评论