第一个通过强化学习人类反馈 (RHLF) 进行训练的大型开源聊天机器人
第一个通过强化学习人类反馈 (RHLF) 进行训练的大型开源聊天机器人
模型下载:
https://huggingface.co/CarperAI/stable-vicuna-13b-delta
Stability AI 发布了 StableVicuna,这是 AI 世界上第一个开源 RLHF LLM 聊天机器人
https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot
扫描二维码推送至手机访问。
版权声明:本站内容为原创和部分整理自网络,如有侵权务必联系我们删除,保障您的权益,本站所有软件资料仅供学习研究使用,不可进行商业用途和违法活动,本站不承担任何法律责任。