--- language: ru license: mit tags: - pytorch - sentiment-analysis - russian datasets: - mar1mba.russian-sentiment-dataset --- # Модель тональности отзывов (positive / neutral / negative) Эта модель определяет эмоциональную окраску русскоязычных отзывов: **позитивную**, **нейтральную** или **негативную**. Обучена на реальных отзывах с маркетплейсов и сервисов. Подходит для анализа отзывов о товарах, услугах, фильмах, ресторанах и т.д. --- ## 📊 Характеристики - **Язык**: Русский - **Архитектура**: [`cointegrated/rubert-tiny2`](https://huggingface.co/cointegrated/rubert-tiny2) (дообученная) - **Классы**: - `neutral` (0) - `positive` (1) - `negative` (2) - **F1-score (валидация)**: 73.4% - **Accuracy**: 73.4% - **Validation loss**: 0.61 - **Размер датасета**: 290 390 отзывов - **Баланс классов**: сбалансированный (≈33% на каждый класс) --- ## 🚀 Быстрый старт ### Установка ```bash pip install transformers torch ``` ### Использование ```py from transformers import pipeline classifier = pipeline("text-classification", model="./sentiment-model-rus", tokenizer="./sentiment-model-rus", top_k=1) label_map = {0: "neutral", 1: "positive", 2: "negative"} raw_output = classifier("проведец честный, рекомендую", top_k=1) for pred in raw_output: label_id = int(pred['label'].replace('LABEL_', '')) pred['label'] = label_map[label_id] print(raw_output) ``` ⚠️ Ограничения - Может ошибаться на сарказме и иронии. - Работает лучше на типичных отзывах, чем на художественных или поэтических текстах. - Не учитывает контекст за пределами одного отзыва.