曼巴比特

StableVicuna

探索StabilityAI推出的StableVicuna：首个采用RLHF训练的大规模开源聊天机器人，基于Vicuna v0 13b模型，性能显著提升。

体验StableVicuna

StabilityAI，即著名的 Stable Diffusion 背后的公司，推出了一款突破性的开源聊天机器人——StableVicuna。这是业界首个通过基于人类反馈的强化学习（RLHF）方法训练的大规模开源对话系统。

StableVicuna 的基础是 Vicuna v0 13b，一个经过指令微调的 LLaMA 130亿参数模型。StabilityAI 在此基础上进行了进一步的指令微调，并应用了 RLHF 训练技术，使其性能得到显著提升。