FeatureSelection.find_constant_features

FeatureSelection.find_constant_features(**kwargs)

Esegue solo il filtro per le feature costanti.

Questo metodo è un wrapper attorno al metodo run, configurato per attivare specificamente il filtro delle feature costanti e disabilitare tutti gli altri filtri. Aggiorna lo stato dell’istanza in base ai risultati di questo singolo filtro.

Questa funzione ha lo scopo di trovare le colonne che hanno un numero di valori distinti uguale a 1. Se una colonna ha un solo valore distinto, significa che è costante (ad esempio, una colonna dove ogni riga ha il valore True), e il nome di questa colonna viene incluso nella lista dei risultati, ovvero tutte le feature da escludere.

Dopo l’applicazione del filtro vengono modificati gli attributi della classe con la selezione effettuata.

Parameters:

**kwargs – Argomenti keyword aggiuntivi per sovrascrivere i parametri dell’istanza per questa esecuzione (anche se per le feature costanti non ci sono parametri specifici).

Dati utilizzati per gli esempi:

>>> db_test_filters
feature_Afeature_Bfeature_C
0534.835708Z
153.086785X
2542.384427Y
3586.151493X
45-1.707669V
55-1.706848V
6588.960641X
7548.371736V
85-13.473719Z
9537.128002Y
105-13.170885X
115-13.286488Z
12522.098114W
135-85.664012W
145-76.245892X
155-18.114376X
165-40.641556Z
17525.712367Y
185-35.401204Y
195-60.615185Y

Esempio:

>>> from cefeste.selection import FeatureSelection
>>> fs = FeatureSelection(
...    db=df_test_filters,
...    verbose=True # Utile per vedere cosa succede
... )
>>> fs.find_constant_features()
>>> fs.make_report()
feat_name result drop_reason
0 feature_A drop constant
1 feature_B keep NaN
2 feature_C keep NaN