Do you believe there is a gap between computer science research and software engineering problems?
La mia esperienza è che lo sviluppo di software commerciale / pratico è in ritardo rispetto alla ricerca accademica da 5 a 30+ anni. SQL è stato uno dei tempi più rapidi tra un documento accademico innovativo e un prodotto di spedizione commerciale. Il documento fu pubblicato nel 1969, IBM e altri impiegarono molto tempo e sforzi nel tentativo di realizzare prodotti fattibili, e il primo vero prodotto commercialmente valido fu Relational Software, la società che ora si chiama Oracle.
I linguaggi funzionali sono stati sviluppati dai ricercatori negli anni '60. Quanti sono in uso oggi? Alcuni. In questi giorni stanno diventando molto più utili di quanto non facessero al di fuori dei muri ricoperti di edera delle università. Ma ci sono voluti tre decenni per farlo.
Will engineers dive through years and years of research papers to solve a particular problem that they have?
Sì. Lo faccio tutto il tempo. Quando lavoravo in un'azienda che creava reti di storage, molti dei prodotti che iniziarono a essere spediti erano descritti in articoli di ricerca pubblicati 5-6 anni prima.
Un altro esempio riguardava un problema chiamato "abbinamento paziente". Gli umani sono bravi a guardare cose come Chem. Dept.
o Department of Chemistry
e determinare che tali cose sono identiche. La maggior parte degli algoritmi ha un tempo terribile che determina queste cose. Stavo lavorando in un'azienda che gestiva prescrizioni di farmaci elettronici, rapporti di laboratorio e richieste di risarcimento. Sarebbe stato utile essere in grado (anonimamente) di avere dati a lungo termine che coprano l'efficacia e l'efficacia dei trattamenti per i pazienti. Una cosa del genere avrebbe dovuto dipendere dalla capacità di determinare la vicinanza delle stringhe. Durante gli anni '90, la maggior parte dei ricercatori in quest'area svanì nel progetto Human Genome, e gran parte del loro lavoro scomparve dal web (con le NDA e la proprietà intellettuale, tutto ciò che queste persone inventarono svanì dal web quando andarono a lavorare per l'industria privata). Dopo il 911, i nomi corrispondenti diventarono un problema di "sicurezza nazionale" (ci sono circa 25 modi per scrivere Maometto in inglese, e circa una dozzina di modi per scrivere Osama) e molti dei rimanenti scomparvero. Quindi un inventore / azienda ha un prodotto che ti consente di abbinare persone e relazioni chiamate " non ovvio analizzatore di relazioni " che è finito svanendo in un componente aggiuntivo per DB2. Dovrai scavare molto nei giornali. Forse no se fai carrelli della spesa, ma è abbastanza comune farlo in altri progetti.
Tesi: Rilevamento adattivo di record di database duplicati approssimativi e approccio di integrazione del database alla scoperta di informazioni .
Libreria che implementa alcune delle funzioni nella tesi .