---
language: ru
license: mit
tags:
- pytorch
- sentiment-analysis
- russian
datasets:
- mar1mba.russian-sentiment-dataset
---


# Модель тональности отзывов (positive / neutral / negative)

Эта модель определяет эмоциональную окраску русскоязычных отзывов: **позитивную**, **нейтральную** или **негативную**.

Обучена на реальных отзывах с маркетплейсов и сервисов. Подходит для анализа отзывов о товарах, услугах, фильмах, ресторанах и т.д.

---

## 📊 Характеристики

- **Язык**: Русский
- **Архитектура**: [`cointegrated/rubert-tiny2`](https://huggingface.co/cointegrated/rubert-tiny2) (дообученная)
- **Классы**: 
  - `neutral` (0)
  - `positive` (1)
  - `negative` (2)
- **F1-score (валидация)**: 73.4%
- **Accuracy**: 73.4%
- **Validation loss**: 0.61
- **Размер датасета**: 290 390 отзывов
- **Баланс классов**: сбалансированный (≈33% на каждый класс)

---

## 🚀 Быстрый старт

### Установка

```bash
pip install transformers torch
```

### Использование

```py
from transformers import pipeline

classifier = pipeline("text-classification", model="./sentiment-model-rus", tokenizer="./sentiment-model-rus", top_k=1)
label_map = {0: "neutral", 1: "positive", 2: "negative"}

raw_output = classifier("проведец честный, рекомендую", top_k=1)
for pred in raw_output:
    label_id = int(pred['label'].replace('LABEL_', ''))
    pred['label'] = label_map[label_id]

print(raw_output)
```

⚠️ Ограничения
- Может ошибаться на сарказме и иронии.
- Работает лучше на типичных отзывах, чем на художественных или поэтических текстах.
- Не учитывает контекст за пределами одного отзыва.