Instructions to use ogulcanakca/Kumru-2B-EPDK-DPO with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- PEFT
How to use ogulcanakca/Kumru-2B-EPDK-DPO with PEFT:
from peft import PeftModel from transformers import AutoModelForCausalLM base_model = AutoModelForCausalLM.from_pretrained("vngrs-ai/Kumru-2B-Base") model = PeftModel.from_pretrained(base_model, "ogulcanakca/Kumru-2B-EPDK-DPO") - Transformers
How to use ogulcanakca/Kumru-2B-EPDK-DPO with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="ogulcanakca/Kumru-2B-EPDK-DPO") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoModel model = AutoModel.from_pretrained("ogulcanakca/Kumru-2B-EPDK-DPO", dtype="auto") - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use ogulcanakca/Kumru-2B-EPDK-DPO with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "ogulcanakca/Kumru-2B-EPDK-DPO" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "ogulcanakca/Kumru-2B-EPDK-DPO", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/ogulcanakca/Kumru-2B-EPDK-DPO
- SGLang
How to use ogulcanakca/Kumru-2B-EPDK-DPO with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "ogulcanakca/Kumru-2B-EPDK-DPO" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "ogulcanakca/Kumru-2B-EPDK-DPO", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "ogulcanakca/Kumru-2B-EPDK-DPO" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "ogulcanakca/Kumru-2B-EPDK-DPO", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use ogulcanakca/Kumru-2B-EPDK-DPO with Docker Model Runner:
docker model run hf.co/ogulcanakca/Kumru-2B-EPDK-DPO
Model Card for Kumru-2B-EPDK-DPO
Bu adaptör, modele EPDK (Enerji Piyasası Düzenleme Kurumu) alanında hem (domain knowledge) hem de sohbet yeteneğini kazandırmak amacıyla vngrs-ai/Kumru-2B-Base modeli üzerine eğitilmiş bir DPO (Direct Preference Optimization) LoRA adaptörü eğitilmiştir.
Eğitim, Gemini API kullanılarak ogulcanakca/epdk_corpus'tan üretilen sentetik, yüksek kaliteli ogulcanakca/epdk_dpo tercih veri seti (prompt, chosen, rejected) kullanılarak yapılmıştır.
Model, 4-bit (QLoRA) ile yüklenmeli ve üzerine bu DPO adaptörü eklenmelidir.
!pip install -q \
"transformers" \
"peft" \
"accelerate" \
"bitsandbytes" \
"trl" \
"datasets"
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
from peft import PeftModel
import torch
base_model_name = "vngrs-ai/Kumru-2B-Base"
adapter_name = "ogulcanakca/Kumru-2B-EPDK-DPO"
bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
# T4 için torch.float16, P100/Ampere+ için torch.bfloat16
bnb_4bit_compute_dtype=torch.float16
)
model = AutoModelForCausalLM.from_pretrained(
base_model_name,
quantization_config=bnb_config,
device_map="auto",
trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
if tokenizer.pad_token is None:
tokenizer.pad_token = tokenizer.eos_token
model = PeftModel.from_pretrained(model, adapter_name)
model.eval()
prompt_soru = "2007 yılına ait Türkiye Ortalama Elektrik Toptan Satış Fiyatının (TORETOSAF) değeri nedir?"
messages = [
{"role": "user", "content": prompt_soru}
]
input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(input_text, return_tensors="pt", return_token_type_ids=False).to(model.device)
outputs = model.generate(
**inputs,
max_new_tokens=150,
temperature=0.2,
do_sample=True
)
print("\n--- Modelin Cevabı ---")
print(tokenizer.decode(outputs[0][inputs.input_ids.shape[1]:], skip_special_tokens=True))
WandB
Modelin eğitimi ogulcanakca/epdk_dpo veri setinin train split'i üzerinde 1 epoch ve dev split'i üzerinde her 25 adımda bir değerlendirme yapılarak izlenmiştir.
{
"prompt": "Belirlenen 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatının (TORETOSAF) değeri nedir?",
"Base Model": "Belirlenen 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatının (TORETOSAF) değeri nedir? 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatı 1,11 TL/kWh'dir. 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatı 1,11 TL/kWh'dir. 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatı 1,11 TL/kWh'dir. 2007 yılı Türkiye Ortalama Elektrik Toptan Satış Fiyatı 1,11 TL/kWh'dir.",
"Adapter'lı Model": "2007 yılı toptan satış fiyatı 15,80 krş/kWh olan elektrik enerjisinin fiyatı, 2007 yılı toptan satış fiyatı 15,80 krş/kWh’dir. 2007 yılı toptan satış fiyatı 15,80 krş/kWh olan toptan satış fiyatı 15,80 krş/kWh’dir. 2007 yılı toptan satış fiyatı 15,80 kr"
}
Eğitim Parametreleri (Kaggle P100)
DPOConfig
- GPU: 1x Tesla T4 (16GB)
- Model:
vngrs-ai/Kumru-2B-Base - Veri Seti:
ogulcanakca/epdk_dpo(train24.5k,dev1.3k) - Quantization:
4-bit (NF4) - Compute Precision:
float16 max_length:1024max_prompt_length:512optim:paged_adamw_8bitgradient_checkpointing:Truelearning_rate:5e-5(LR Tipi:cosine)num_train_epochs:1loss_type:ipobeta:0.1- Batch Size:
per_device_train_batch_size:1gradient_accumulation_steps:8- (Effective Batch Size: 8)
LoraConfig
r(Rank):16lora_alpha:32lora_dropout:0.05target_modules:q_projk_projv_projo_projgate_projup_projdown_proj
- Downloads last month
- 1
Model tree for ogulcanakca/Kumru-2B-EPDK-DPO
Base model
vngrs-ai/Kumru-2B-Base