Ho una domanda riguardante l'apprendimento automatico in generale. Considera il seguente scenario:
Dato un pezzo di testo, vogliamo che un programma sappia se il testo è "offensivo" o meno.
Per fare ciò possiamo dare al programma 1000 campioni di testo e contrassegnare manualmente quali sono positivi e quali sono negativi. Il programma studia questi e registra quali parole / modelli sono comuni nei testi abusivi. Diamo poi un altro 1000 testi non marcati, e riesce a identificare il 95% di questi correttamente usando i modelli appresi dal 1000 originale.
Va bene, ma che dire dopo che il software 'diventa disponibile'? Cioè, lo lasciamo per estrarre altri 1000 testi ogni giorno e rimane da determinare se sono abusivi o meno per conto proprio. Si potrebbe pensare che sarebbe una buona idea continuare a riconoscere parole / schemi nel tentativo di "imparare" sempre di più ogni giorno? Ma il problema qui è che non sappiamo con certezza se il programma identifichi correttamente ciascun testo. Quindi, se contrassegna un testo pulito come offensivo, registrerà erroneamente parole / pattern come abusivi. Questo farà sì che l'intelligenza del programma diventi sempre più scorretta e fuori strada.
Qual è l'approccio generale al problema precedente?