SuperCLUE

工具介绍:SuperCLUE是一个全面的中文大模型评测基准,从基础能力、专业能力和中文特性三个维度,评估模型在语义理解、专业知识和中文特有任务等方面的表现,涵盖70多项能力测试。

收录时间:2024-06-09 12:34:56

打开网站

SuperCLUE 工具信息

目录

    SuperCLUE:全面评估中文大模型的综合基准

    SuperCLUE是一个专为中文通用大模型设计的综合性评测基准,通过三个关键维度全面衡量模型能力:

    1. 基础能力

    涵盖10项核心技能,包括:

    • 语义理解
    • 对话能力
    • 逻辑推理
    • 角色模拟
    • 代码处理
    • 生成与创作
    • 等其他能力

    2. 专业能力

    评估超过50项专业领域的能力,涉及:

    • 中学水平知识
    • 大学水平知识
    • 专业考试内容
    • 涵盖数学、物理、地理到社会科学等多个学科

    3. 中文特性能力

    专门针对中文语言特点,评估10项独特能力,包括:

    • 成语运用
    • 诗歌创作与理解
    • 文学鉴赏
    • 汉字字形分析
    • 等其他中文特有能力

    通过这三个维度的综合评估,SuperCLUE旨在全面、客观地衡量中文大模型的各方面能力。

    评论 (0)

    暂无评论