StableVicuna

工具介绍：探索StabilityAI推出的StableVicuna：首个采用RLHF训练的大规模开源聊天机器人，基于Vicuna v0 13b模型，性能显著提升。

收录时间：2024-06-09 12:34:56

打开网站

StableVicuna 工具信息

StableVicuna：StabilityAI 的开创性RLHF聊天机器人

StabilityAI，即著名的 Stable Diffusion 背后的公司，推出了一款突破性的开源聊天机器人——StableVicuna。这是业界首个通过基于人类反馈的强化学习（RLHF）方法训练的大规模开源对话系统。

StableVicuna 的基础是 Vicuna v0 13b，一个经过指令微调的 LLaMA 130亿参数模型。StabilityAI 在此基础上进行了进一步的指令微调，并应用了 RLHF 训练技术，使其性能得到显著提升。

暂无评论

StableVicuna 替代品