StableVicuna

工具介绍:探索StabilityAI推出的StableVicuna:首个采用RLHF训练的大规模开源聊天机器人,基于Vicuna v0 13b模型,性能显著提升。

收录时间:2024-06-09 12:34:56

打开网站

StableVicuna 工具信息

目录

    StableVicuna:StabilityAI 的开创性RLHF聊天机器人

    StabilityAI,即著名的 Stable Diffusion 背后的公司,推出了一款突破性的开源聊天机器人——StableVicuna。这是业界首个通过基于人类反馈的强化学习(RLHF)方法训练的大规模开源对话系统。

    StableVicuna 的基础是 Vicuna v0 13b,一个经过指令微调的 LLaMA 130亿参数模型。StabilityAI 在此基础上进行了进一步的指令微调,并应用了 RLHF 训练技术,使其性能得到显著提升。

    评论 (0)

    暂无评论