Ho un contenuto HTML nel mio DB e vorrei presentare un elenco di questi singoli articoli, ma troncare ciascuno di essi in modo che non siano completamente visualizzati. Vorrei mantenere gli elementi troncati umani-significativi, quindi non voglio semplicemente tagliare il contenuto in un indice di caratteri specifico. Poiché il mio contenuto è HTML, l'indice specifico potrebbe trovarsi nel mezzo di un tag HTML per quello che vale.
Vorrei troncare a specifici breakpoint significativi come elementi di fine blocco. Sia che si tratti di paragrafi, citazioni di blocchi, blocchi di codice, elenchi, voci di elenco, ecc. Questo dà al lettore la possibilità di ottenere un estratto semanticamente completo dell'intero contenuto.
La mia implementazione dovrebbe quindi essere chiamata come:
string truncateNear(string HTMLContent, int closestToIndex);
Sarei in grado di fornire un indice di prossimità in cui la funzione dovrebbe cercare il blocco HTML più vicino e restituire quel contenuto.
Come andresti a troncare il contenuto HTML in modo analogo a questo:
- output HTML valido
- scala le prestazioni del pozzo
- forse consente di cercare la prima immagine nel contenuto e posizionarla subito dopo il testo nel contenuto ritagliato
Sarebbe meglio trasformare l'HTML in un altro formato prima e poi manipolarlo se invece fosse più veloce e facile da manipolare?