Ottimizzazione dell'ordinamento di grandi quantità di testo memorizzato in un database

0

Come memorizzereste le informazioni di testo - in un database relazionale o magari usando NoSQL? Il problema è che il testo dovrebbe essere diviso in varie parti, ciascuna delle quali soddisfa alcuni requisiti, ad es. lo stesso testo dovrebbe essere contenuto in diversi "luoghi". C'è un altro modo per organizzare questo?

Ho diversi libri (ciascuno di essi di circa 600 pagine), che dovrebbero essere archiviati in un database, ma ci sarà un meccanismo che dovrebbe ordinare il contenuto dei libri secondo alcuni criteri. I criteri sono complessi, quindi mi chiedo se sta diventando un grosso problema. Aiuterebbe a memorizzare lo stesso testo in varie "tabelle", ognuna delle quali soddisfaceva una "condizione" concreta

Devo salvare lo stesso testo in varie "tabelle", ognuna delle quali soddisfa una serie specifica di criteri?

    
posta Dehumanizer 07.07.2011 - 10:34
fonte

2 risposte

1

Non è una buona pratica dell'RDBMS duplicare i dati in più tabelle, in generale. Ci sono modi, usando i tasti (chiavi primarie e chiavi esterne), per collegare i dati in modo che questo stesso disastro sia evitato.

RDBMS è una scienza al suo interno. Raccomando di leggere alcuni materiali di lettura sull'argomento prima ancora di tentare di progettare una struttura di database. E 9 volte su 10, NoSQL non è la risposta.

    
risposta data 13.07.2011 - 04:31
fonte
1

Penso che un approccio migliore sarebbe quello di archiviare l'intero testo singolo, possibilmente anche al di fuori del database, e nella tabella di lavoro attuale puntatori, criteri, scostamenti e intervalli, indici di parole chiave e così via. Semplicemente, separare i dati dai metadati, i contenuti del libro dai dati di ricerca contestuale.

    
risposta data 13.07.2011 - 11:18
fonte

Leggi altre domande sui tag