CarperAI
/

stable-vicuna-13b-delta

Text Generation

text-generation-inference

Model card Files Files and versions

jon-tow commited on Apr 28, 2023

Commit

37035ae

·

1 Parent(s): d370485

fix: update base model link

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ datasets:
 ## Model Description
-StableVicuna-13B is a [Vicuna-13B v0](https://vicuna.lmsys.org/) model fine-tuned using reinforcement learning from human feedback (RLHF) via Proximal Policy Optimization (PPO) on various conversational and instructional datasets.
 ### Apply Delta Weights

 ## Model Description
+StableVicuna-13B is a [Vicuna-13B v0](https://huggingface.co/lmsys/vicuna-13b-delta-v0) model fine-tuned using reinforcement learning from human feedback (RLHF) via Proximal Policy Optimization (PPO) on various conversational and instructional datasets.
 ### Apply Delta Weights