FeatureSelection.eda¶

FeatureSelection.eda()¶

Genera un’analisi esplorativa dei dati (EDA) di base.

(Metodo importato dalla classe FeatureAnalysis)

Per ogni feature numerica specificata nell’attributo numerical_features, calcola statistiche descrittive. Per ogni feature categorica specificata nell’attributo categorical_features, calcola il conteggio dei valori unici.

Returns:

Un dizionario dove le chiavi sono i nomi delle colonne (feature) e i valori sono:

Per le feature numeriche: un oggetto pd.Series con le statistiche descrittive.

Per le feature categoriche: un oggetto pd.Series con i conteggi dei valori.

Return type:

dict

Esempio:

>>> from cefeste import FeatureAnalysis
>>> #from cefeste.selection import FeatureSelection
>>> #from cefeste.elimination import FeatureElimination
>>> import pandas as pd
>>> data = {
...     'eta': [25, 30, 25, 35, 30, 40],
...     'citta': ['Roma', 'Milano', 'Roma', 'Napoli', 'Milano', 'Roma'],
...     'punteggio': [10.5, 15.2, 10.5, 12.0, 18.1, 9.0]
... }
>>> df = pd.DataFrame(data)
>>> analyzer = FeatureAnalysis(df)
>>> #analyzer = FeatureSelection(df)
>>> #analyzer = FeatureElimination(df)
>>> analysis_results = analyzer.eda()
>>> analysis_results
{'eta': count     6.000000
 mean     30.833333
 std       5.845226
 min      25.000000
 25%      26.250000
 50%      30.000000
 75%      33.750000
 max      40.000000
 Name: eta, dtype: float64,
 'punteggio': count     6.000000
 mean     12.550000
 std       3.439041
 min       9.000000
 25%      10.500000
 50%      11.250000
 75%      14.400000
 max      18.100000
 Name: punteggio, dtype: float64,
 'citta': Roma      3
 Milano    2
 Napoli    1
 Name: citta, dtype: int64}

FeatureSelection.eda¶

Table of Contents

This Page