Domande con tag 'text-processing'

3
risposte

Perché la quantità nel software è ancora scritta come "1 risultato (i)"?

Ultimamente, ho notato che un sacco di software, sia esso un sito Web, un'applicazione client o un videogioco, spesso scrivono una rappresentazione della quantità come segue: "1 risultato (i)". Ora capisco perché lo avrebbero fatto 20 anni fa. M...
posta 05.10.2013 - 15:44
2
risposte

Separazione di parole in una stringa

Come separo le parole in una stringa? Di seguito ho un campione casuale di parole in una stringa estratta da un file di testo con oltre un milione di parole. Ecco la stringa: "intervengono Tasche Gerusalemme e tessuti potenti giorni gadget...
posta 12.07.2012 - 05:48
2
risposte

Modifica efficiente dei file di testo [duplicato]

Ho lavorato con file di testo abbastanza grandi contenenti circa due milioni di righe di testo. Non conosco la lunghezza del contenuto o delle linee in anticipo, solo il numero di righe. Ho considerato due problemi che probabilmente hanno una...
posta 14.10.2015 - 12:55
1
risposta

Quale metodo per archiviare un file di testo in memoria (c non c ++) mi permetterebbe di aprire qualsiasi formato (UTF-8, binario, ecc.) e un file di qualsiasi dimensione?

Il mio primo pensiero qui è di usare un array dinamico, ma sto cercando qualcosa di meglio. Attualmente ho i file di testo aperti in "blocchi". Ogni parola o gruppo di spazi costituisce un "pezzo". Poi ho un numero di linea in questa struttur...
posta 03.03.2016 - 11:09
1
risposta

Best Practice - XML To Excel

Devo leggere un grande file XML con molte informazioni. Successivamente estraggo le informazioni necessarie (~ 20 punti (colonne) / ~ 80 dati rilevanti (righe, alcune delle quali con sottodati) e scriverle in un file Excel. La mia domanda è c...
posta 21.09.2012 - 10:02
2
risposte

Algoritmo di classificazione del prodotto - classificazione del testo - C # - suggerimenti dell'algoritmo

Bene gente. Infine, con l'aiuto della community di stackoverflow, ho raccolto 20 pagine di prodotti commerciali di siti Web di vendita con le seguenti funzionalità Product URL Product Price Product Name Product Category Product Page Title Prod...
posta 09.02.2012 - 23:57
2
risposte

Opzioni disponibili per la classificazione delle parole nel testo?

Sto studiando modi per classificare le parole nel testo e mi sto chiedendo quali opzioni ci siano e quali siano le più adatte a questo lavoro. Sono principalmente interessato a parole chiave che sono più spesso sostantivi. Finora so che potre...
posta 13.02.2012 - 18:57
1
risposta

Come elaborare un flusso di dati XML senza fine

C'è un flusso di dati infinito di messaggi XML (e "heartbeat"), che ricevo tramite una connessione telnet e attraverso un tunnel IPsec VPN site-to-site. Sto ancora riflettendo. Qual è la soluzione migliore / più elegante per elaborare i me...
posta 21.03.2013 - 14:47
3
risposte

Miglior algoritmo per correlare articoli simili [chiuso]

qual è il modo migliore per correlare e raggruppare articoli simili? Intendo qualcosa come Google News, che raggruppa sotto un unico argomento diversi articoli provenienti da fonti diverse. Non mi interessa qualcosa di molto sofisticato, è...
posta 22.11.2011 - 12:46
3
risposte

Linguaggio specifico del dominio per la ricerca / elaborazione del testo?

Lavoro per un'organizzazione che lavora molto con i dati governativi. Abbiamo un paio di progetti diversi in cui abbiamo estrapolato le operazioni di ricerca / manipolazione di testo comuni in librerie riutilizzabili, per cose come standardizzar...
posta 29.03.2013 - 20:41