Dato che non hai specificato di quale tipo di test stai parlando, ne sto parlando in termini generali.
Molti di questi cosiddetti "test di convalida" sono solo un controllo di sintassi con un DOM di riferimento, questo significa che un punteggio elevato è per una fonte ben formattata, un punteggio inferiore è per i documenti che non rispettano la linea guida DOM.
Il problema principale con l'HTML è il fatto che è un linguaggio interpretato e non hai un'implementazione di riferimento e anche i valori e gli attributi che puoi usare all'interno della lingua non possono essere associati a un comportamento unico o un risultato unico.
La maggior parte delle volte si finisce con la necessità di alcuni hack che possono interrompere il controllo della sintassi, a volte è meglio avere una sintassi non corretta piuttosto che avere una pagina HTML che appare brutta e può essere resa nel modo sbagliato.
Da quello che so anche io non posso definire Usabilità / Accessibilità perché queste 2 parole possono avere un numero infinito di definizioni, per un utente mobile questo può significare un sito web con pulsanti più grandi, per una persona con alcuni problemi agli occhi può essere interpretato come un migliore contrasto di colore nella pagina; questo dipende molto da cosa stai mirando.
Come ho detto, questi test sono solo un controllo di sintassi ma il loro vero significato è intorno a zero o meno, alcuni client possono richiedere quei piccoli loghi in fondo alla pagina, ma non credo che sappiano cos'è una pagina web di e come funziona.