karpathy
/

nanochat-d32

burtenshaw HF Staff commited on Oct 18, 2025

Commit

8a7bd77

verified ·

1 Parent(s): 9c3978e

Upload config.json with huggingface_hub

Files changed (1) hide show

config.json CHANGED Viewed

@@ -3,13 +3,12 @@
     "NanoChatForCausalLM"
   ],
   "attention_dropout": 0.0,
-  "bos_token": "<|bos|>",
-  "bos_token_id": 0,
-  "chat_template": "{% if messages[0]['role'] == 'system' %}<|bos|><|user_start|>{{ messages[0]['content'] }}\n\n{{ messages[1]['content'] }}<|user_end|>{% set messages = messages[2:] %}{% else %}<|bos|>{% endif %}{% for message in messages %}{% if loop.index0 % 2 == 0 %}<|user_start|>{{ message['content'] }}<|user_end|>{% else %}<|assistant_start|>{{ message['content'] }}<|assistant_end|>{% endif %}{% endfor %}",
   "dtype": "bfloat16",
   "eos_token": "<|assistant_end|>",
   "eos_token_id": 65531,
   "hidden_act": "relu2",
   "initializer_range": 0.02,
   "intermediate_size": 8192,
   "logits_soft_cap": 15.0,
@@ -18,7 +17,6 @@
   "n_embd": 2048,
   "n_head": 16,
   "n_layer": 32,
-  "hidden_size": 2048,
   "num_attention_heads": 16,
   "num_hidden_layers": 32,
   "num_key_value_heads": 16,
@@ -33,4 +31,4 @@
   "transformers_version": "4.57.0.dev0",
   "use_cache": true,
   "vocab_size": 65536
-}

     "NanoChatForCausalLM"
   ],
   "attention_dropout": 0.0,
+  "bos_token_id": 65527,
   "dtype": "bfloat16",
   "eos_token": "<|assistant_end|>",
   "eos_token_id": 65531,
   "hidden_act": "relu2",
+  "hidden_size": 2048,
   "initializer_range": 0.02,
   "intermediate_size": 8192,
   "logits_soft_cap": 15.0,
   "n_embd": 2048,
   "n_head": 16,
   "n_layer": 32,
   "num_attention_heads": 16,
   "num_hidden_layers": 32,
   "num_key_value_heads": 16,
   "transformers_version": "4.57.0.dev0",
   "use_cache": true,
   "vocab_size": 65536
+}