Questa domanda potrebbe andare qui o su S.O. forse ...
Supponiamo che il set di dati di addestramento contenga dati sia categoriali che continui come questa impostazione:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
E la variabile dipendente da prevedere è il costo annuale del veterinario. Sono un po 'confuso riguardo alle tecniche specifiche disponibili per gestire un set di dati di questo tipo. Quali sono i metodi comunemente usati per trattare i set di dati che sono una combinazione di dati sia continui che categoriali?