I sostenitori dei linguaggi di programmazione funzionale affermano che la programmazione funzionale rende più facile ragionare sul codice. Chi è a favore di linguaggi tipizzati staticamente afferma che i compilatori individuano errori sufficienti a compensare la complessità aggiuntiva dei sistemi di tipi. Ma tutto ciò che leggo su questi argomenti si basa su argomenti razionali, non su dati empirici.
Esistono studi empirici su quali effetti hanno le diverse categorie di linguaggi di programmazione sui tassi di difetti o altre metriche di qualità?
(Le risposte a questa domanda sembrano indicare che lì non sono tali studi, almeno non per il dibattito dinamico vs statico)