Significato di "skewed classes" nel machine learning

Domanda e risposta

Scritto il 28 Gennaio 2021 da

Significato di "skewed classes" nel machine learning

Qualcuno saprebbe spiegarmi cosa significa "skewed classes" nell'ambito del machine learning?

Ricompensa per la miglior risposta: 6 monete

Risposta di Arturo del 31 Maggio 2024

Nel contesto del machine learning, il termine "skewed classes" (o "classi sbilanciate") si riferisce a una situazione in cui le diverse classi di dati non sono rappresentate in modo uniforme nel dataset. In altre parole, alcune classi hanno molti più esempi rispetto ad altre.

Immagina di avere un dataset per classificare le email come "spam" o "non spam". Se il 95% delle email nel tuo dataset sono "non spam" e solo il 5% sono "spam", hai una situazione di classi sbilanciate. Questo è un problema perché i modelli di machine learning tendono ad essere "bias" verso la classe dominante, ossia, impareranno più facilmente a riconoscere la classe con più esempi (in questo caso "non spam") e potrebbero avere difficoltà a riconoscere la classe meno rappresentata ("spam").

Le classi sbilanciate possono portare a modelli che sembrano funzionare bene secondo alcune metriche (come l'accuratezza), ma che in realtà non sono utili per rilevare correttamente le classi minoritarie.

Per affrontare questo problema, ci sono varie tecniche che si possono utilizzare, come:

Raccolta di più dati: Aumentare il numero di esempi della classe minoritaria.
Resampling: Bilanciare il dataset riducendo il numero di esempi nella classe dominante (undersampling) o aumentando il numero di esempi nella classe minoritaria (oversampling).
Algoritmi specifici: Utilizzare algoritmi di machine learning progettati per gestire classi sbilanciate.
Metriche di valutazione: Utilizzare metriche che tengano conto delle classi sbilanciate, come l'F1-score, la precisione e il richiamo, invece della semplice accuratezza.

In sintesi, "skewed classes" significa che una classe ha molti più esempi rispetto all'altra, e questo può influenzare negativamente le prestazioni del modello di machine learning.

0 Mi piace

Conosci la risposta? Effettua il login ed inviaci la risposta!

Computer e Web

Domanda e risposta

Significato di "skewed classes" nel machine learning

Leggi anche: