LLM Course documentation
Modelli decoder
0. Installazione
1. Modelli Transformer
IntroduzioneNatural Language ProcessingCosa fanno i Transformer?Come funzionano i Transformer?Modelli encoderModelli decoderModelli sequence-to-sequenceBias e limitiRiassuntoQuiz di fine capitolo
2. Usare i 🤗 Transformers
3. Affinamento di un modello pre-addestrato
4. Condividere modelli e tokenizers
5. La libreria 🤗 Datasets
8. Come chiedere un aiuto
9. Creare e condividere demo
Modelli decoder
I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti auto-regressive models.
Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale.
Questi modelli sono particolarmente adatti a compiti di generazione testuale.
Alcuni rappresentanti di questa famiglia includono:
Update on GitHub