StableVicuna

探索StabilityAI推出的StableVicuna:首个采用RLHF训练的大规模开源聊天机器人,基于Vicuna v0 13b模型,性能显著提升。

体验StableVicuna

什么是StableVicuna

StableVicuna:StabilityAI 的开创性RLHF聊天机器人

StabilityAI,即著名的 Stable Diffusion 背后的公司,推出了一款突破性的开源聊天机器人——StableVicuna。这是业界首个通过基于人类反馈的强化学习(RLHF)方法训练的大规模开源对话系统。

StableVicuna 的基础是 Vicuna v0 13b,一个经过指令微调的 LLaMA 130亿参数模型。StabilityAI 在此基础上进行了进一步的指令微调,并应用了 RLHF 训练技术,使其性能得到显著提升。