Categorizer.fit_transform

Categorizer.fit_transform(X, y=None)

Esegue fit e transform in un unico passaggio.

Identifica le colonne di tipo ‘object’ nel DataFrame X e successivamente le converte al tipo ‘category’.

Parameters:
  • X (pd.DataFrame) – Il DataFrame pandas di input.

  • y (np.array/pd.Series, optional) – Ignorato. Default: None.

Returns:

Il DataFrame con le colonne appropriate convertite in ‘category’.

Return type:

pd.DataFrame

Esempio:

>>> import pandas as pd
>>> from cefeste.transform import Categorizer
>>> data = {'col1': ['A', 'B', 'A'], 'col2': [1, 2, 3], 'col3': ['X', 'Y', 'X']}
>>> df = pd.DataFrame(data)
>>> df.dtypes
col1    object
col2     int64
col3    object
dtype: object
>>> categorizer_all = Categorizer() # Controlla tutte le colonne
>>> df_transformed_all = categorizer_all.fit_transform(df)
>>> df_transformed_all.dtypes
col1    category
col2       int64
col3    category
dtype: object