FeatureSelection.eda¶
- FeatureSelection.eda()¶
Genera un’analisi esplorativa dei dati (EDA) di base.
(Metodo importato dalla classe
FeatureAnalysis)Per ogni feature numerica specificata nell’attributo numerical_features, calcola statistiche descrittive. Per ogni feature categorica specificata nell’attributo categorical_features, calcola il conteggio dei valori unici.
- Returns:
Un dizionario dove le chiavi sono i nomi delle colonne (feature) e i valori sono:
Per le feature numeriche: un oggetto pd.Series con le statistiche descrittive.
Per le feature categoriche: un oggetto pd.Series con i conteggi dei valori.
- Return type:
dict
Esempio:
>>> from cefeste import FeatureAnalysis >>> #from cefeste.selection import FeatureSelection >>> #from cefeste.elimination import FeatureElimination >>> import pandas as pd >>> data = { ... 'eta': [25, 30, 25, 35, 30, 40], ... 'citta': ['Roma', 'Milano', 'Roma', 'Napoli', 'Milano', 'Roma'], ... 'punteggio': [10.5, 15.2, 10.5, 12.0, 18.1, 9.0] ... } >>> df = pd.DataFrame(data) >>> analyzer = FeatureAnalysis(df) >>> #analyzer = FeatureSelection(df) >>> #analyzer = FeatureElimination(df) >>> analysis_results = analyzer.eda() >>> analysis_results {'eta': count 6.000000 mean 30.833333 std 5.845226 min 25.000000 25% 26.250000 50% 30.000000 75% 33.750000 max 40.000000 Name: eta, dtype: float64, 'punteggio': count 6.000000 mean 12.550000 std 3.439041 min 9.000000 25% 10.500000 50% 11.250000 75% 14.400000 max 18.100000 Name: punteggio, dtype: float64, 'citta': Roma 3 Milano 2 Napoli 1 Name: citta, dtype: int64}