Domande con tag 'text-processing'

3
risposte

Trova le parole minime che useranno tutte le lettere date

Con una lista di migliaia di parole e un piccolo elenco di lettere sto cercando di trovare il minor numero di parole per fare uso di tutte le lettere date, supponendo che il mio dizionario di parole copra tutte le lettere. Il primo passo è ov...
posta 01.02.2018 - 18:41
2
risposte

La libreria di analisi XML C ++ più veloce

Ho migliaia di file .xml dalla dimensione 1MB-45MB (nessun DTD). Ho bisogno di analizzare e manipolare ulteriormente questi file XML prima di generare file .xml separati con i risultati della mia regex. Quale libreria di analisi XML open-sour...
posta 27.10.2011 - 07:40
1
risposta

Tokenizzazione del testo in una struttura dati di una corda

Sto creando un editor di testo che utilizza un tokenizzatore basato su Ragel per supportare l'evidenziazione della sintassi. Sto prendendo in considerazione l'uso di una struttura dei dati della corda per supportare modifiche efficienti e op...
posta 22.08.2014 - 22:01
1
risposta

Come caricare file di testo in file mappati in memoria

Ho un numero di file di testo di grandi dimensioni che devo manipolare in modo altamente performante. Ho deciso di utilizzare i file Memory Mapped in C # (.NET 4). Tuttavia, non riesco a trovare alcun esempio o guida su come leggere / scrivere s...
posta 02.12.2011 - 09:47
1
risposta

Quando avere un metodo generico per più attività quando alcune differiscono?

Elaboro molti tweet in tempo reale usando python e per ogni tweet ho bisogno di assegnarlo a un bucket specifico. Ho circa 50 secchi, ognuno con le proprie regole. La maggior parte di loro sono semplici come così bucket_one = ['test', 'foo'] i...
posta 16.06.2016 - 17:55
2
risposte

Inserimento avviso di copyright [chiuso]

Qual è il modo più semplice per inserire le informazioni sul copyright in molti file PHP. Non è possibile farlo manualmente.     
posta 19.07.2011 - 11:45
4
risposte

Compatibilità Windows con Unix / Linux newline "\ n"

Un seguito di Differenza tra '\ n' e '\ r \ n '. Sono passati alcuni decenni da quando è stato introdotto lo scisma. Oggigiorno, quando i documenti vengono scambiati su Internet, in genere senza alcuna conoscenza preliminare delle preferenze...
posta 30.09.2017 - 08:05
1
risposta

Un modo elegante per dividere il testo in parole combinate con la punteggiatura adiacente e determinare quale segno di punteggiatura è

In primo luogo, mi rendo conto che il titolo della domanda è tanto terribile quanto il codice di esempio che inserirò di seguito, quindi ti prego di sopportare me mentre spiego il problema più chiaramente, e se hai un'idea migliore per il titolo...
posta 18.05.2016 - 10:25
1
risposta

Come analizzare l'input dell'utente e determinare se (il tipo di) corrisponde a una risposta

Sto lavorando a un sistema di quiz che consentirà agli utenti di inserire il testo come risposta. La domanda potrebbe essere qualcosa di semplice da iniziare, cercando una frase breve o alcune parole selezionate come la risposta "corretta". A...
posta 28.11.2016 - 15:04
2
risposte

Riepilogo automatico: intero testo o paragrafi

Sto scrivendo uno strumento che darà agli utenti la possibilità di riassumere il contenuto del testo su una pagina web, evidenziando il testo che desiderano riassumere. Finora, ho ricevuto risultati con cui posso lavorare per ottimizzare ulte...
posta 02.04.2017 - 06:17