Il tuo desiderio di ottimizzazione (di trasformare una sequenza di if
nell'equivalente di switch
) ha senso solo (come Jörg W Mittag commentato saggiamente) per condizioni idempotenti (che sono indecidibili da rilevare in generale). Ma potremmo limitare queste condizioni ad essere una disgiunzione di test di uguaglianza come x ==
k dove x è sempre lo stesso ( Modulo SSA ) semplice variabile scalare (ad esempio alcuni dichiarati int
variabile locale in C o C ++) che non è modificato nelle parti quindi e k è una costante in fase di compilazione.
Per quanto ne so, alcune versioni di GCC in alcune modalità di ottimizzazione sono state in grado di tale ottimizzazione. E ho appena controllato (a marzo 2015), il mio Clang 3.5 (invocato come clang -O3 -fverbose-asm -S
) sta facendo una tale ottimizzazione con il codice sottostante, mentre il mio GCC 4.9 don ' Farlo (su GNU / Linux / Debian / Sid / x86-64):
extern void f_a(int);
extern void f_b(int);
extern void f_c(int);
extern void f_d(int);
extern void f_e(int);
extern void f_f(int);
extern void f_g(int);
extern void f_h(int);
extern void f_i(int);
extern void f_j(int);
extern void f_k(int);
extern void f_l(int);
extern void f_m(int);
extern void f_n(int);
void f1(int x, int y)
{
if (x=='a') f_a(y);
else if (x=='b') f_b(y);
else if (x=='c') f_c(y);
else if (x=='d') f_d(y);
else if (x=='e') f_e(y);
else if (x=='f') f_f(y);
else if (x=='g') f_g(y);
else if (x=='h') f_h(y);
else if (x=='i') f_i(y);
else if (x=='j') f_j(y);
else if (x=='k') f_k(y);
else if (x=='l') f_l(y);
else if (x=='m') f_m(y);
else if (x=='n') f_n(y);
}
Immagino che GCC non ottimizzi come vuoi perché non vale la pena farlo. GCC sta spesso producendo un codice leggermente più veloce di Clang.
BTW, switch
non è sempre compilato in un salto indiretto. In particolare un interruttore con una dozzina di casi ampiamente diffusi è non compilato usando una tabella di salto, ad es. codice come
unsigned u = something(x); /// practically would be some hash function
switch (u) {
case 3935272677: do_some_A(x); break;
case 2389398680: do_some_B(x); break;
case 1384792968: do_some_C(x); break;
case 3957729125: do_some_D(x); break;
case 4174747340: do_some_E(x); break;
/// etc...
default: do_other_thing(x); break;
}
In pratica con gcc -O3 -fverbose-asm -S
tale codice è compilato come un albero di rami.
Dovresti leggere il documento di Roger Anthony Sayle Un'analisi di Superoptimizer della generazione di codice di rami multipli (Vertice del GCC 2008)
Inoltre, le espressioni match
in Ocaml sono forse rilevanti, non sono sempre compilate come una sequenza di test ingenua, ma solitamente come un albero di test.
C'è una letteratura significativa sulla compilazione della corrispondenza del modello . Per cominciare, vedi Algoritmo di rete , e Luc Maranget & Fabrice Le Fessant carta su Ottimizzazione della corrispondenza del modello (ICFP2001); troverai molti articoli e conferenze sull'argomento.
BTW, la tua implicita ipotesi che qualche ramo indiretto sia sempre più veloce di una serie di salti è ingenuo (sui processori correnti), perché di TLB , cache della CPU , predittori di ramo , pipeline di istruzioni , istruzioni di movimenti condizionali della macchina, ecc. ecc. Leggi anche il codice filettato e noti che entrambi GCC e Clang / LLVM accettano il (molto utile) etichetta come valori e estensione goto a C.
Leggi anche GNU gperf generatore di hash perfetto.
Infine, non dovresti preoccuparti e lasciare tali micro-ottimizzazioni al compilatore ! Se ritieni (ma non lo so) che una lunga serie di if
è più leggibile di un codice switch
lungo come preferisci.