Predicazione dei codici di diagnosi

1

Sono molto nuovo nell'apprendimento automatico. Ho letto su di esso e ho fatto con successo un tutorial in cui abbiamo esaminato le dimensioni dei petali di Iris e abbiamo previsto quali altre dimensioni dei petali di Iris potrebbero essere. Tutto ciò aveva senso perché stavamo solo guardando i numeri.

Ho difficoltà a fare il prossimo passo. In definitiva, il progetto che voglio realizzare è questo:

  1. Allenati con una serie di codici di diagnosi dalle visite al pronto soccorso.

  2. Determina una tendenza, ad esempio, diciamo che le persone con asma sviluppano la BPCO.

  3. Quindi prova con i dati di altre persone. L'idea è che queste persone hanno l'asma, possono sviluppare la BPCO.

Il problema che sto incontrando nel fare il salto è che i codici di diagnosi non sono numerici. Se puoi suggerire come avvicinarti a questo o darmi suggerimenti su cosa studiare, lo apprezzerei.

Grazie

    
posta Funkavenger 14.11.2018 - 23:33
fonte

1 risposta

2

I problemi di ML possono essere sostanzialmente suddivisi in problemi di regressione in cui vogliamo prevedere valori numerici e problemi classificazione dove vogliamo predire un valore categoriale. Tuttavia, questi due sono correlati e puoi spesso trasformare un problema di classificazione in un problema di regressione, ad es. codificando ogni classe come una variabile che può essere zero o uno. Quindi, invece di una singola variabile Diagnosis & in; {Asma, COPD, ...} potresti avere più variabili {Asma & in; [0,1], COPD & in; [0,1], ...}.

Si noti che non esiste una chiara delineazione tra algoritmi ML e statistiche computazionali, cioè statistiche ordinarie che un computer rende fattibile. A volte può essere opportuno calcolare semplicemente le correlazioni tra la diagnosi in un'unica fascia temporale con la diagnosi nella fascia temporale precedente e utilizzare tale correlazione per prevedere le probabilità per una data diagnosi nella successiva fascia temporale. Se si presta attenzione, una codifica di variabili sull'intervallo [0, 1] può essere interpretata direttamente come una probabilità. Anche se non è disponibile una forma chiusa per tali calcoli, le tecniche Monte Carlo possono spesso produrre buoni risultati.

    
risposta data 15.11.2018 - 11:10
fonte

Leggi altre domande sui tag