Domande con tag 'text-processing'

4
risposte

Possibili applicazioni dell'algoritmo ideato per differenziare tra testo strutturato e casuale

Ho scritto un programma che può rapidamente (entro 5 secondi su un desktop da 2 GB RAM, 2.33 Ghz CPU) differenziare tra testo strutturato (ad esempio testo inglese) e stringhe alfanumeriche casuali. Può anche fornire un punteggio di probabilità...
posta 13.04.2012 - 07:08
2
risposte

Ordina le frasi con nuove parole in ognuna

Uno strumento di apprendimento molto utile in cui mi sono imbattuto per il cinese era una massiccia lista di frasi che, tranne i primi 10 o 15, differivano solo da quelle precedenti con una o due parole , o almeno il meno possibile: il creatore...
posta 09.04.2015 - 05:20
1
risposta

Ordinamento alfabetico personalizzato di array in Java

Ho il requisito di leggere un file di testo con le righe nel formato tag = value e quindi di emettere il file con tag specifici elencati per primi e il resto in ordine alfabetico. Il file in arrivo viene ordinato in modo casuale con l'eccezione...
posta 02.05.2013 - 22:18
0
risposte

Quali sono i metodi per verificare accuratamente la precisione di una parte del tagger vocale?

So che la maggior parte degli algoritmi di tagger pos misura la loro accuratezza. se il token è taggato correttamente o meno Alcuni tagger pos forniscono anche la precisione della frase. Come viene calcolata l'accuratezza della frase. È come...
posta 21.06.2016 - 17:45
1
risposta

Perché gli indicatori ordinali sono considerati lettere?

Ho avuto la mia sorpresa ieri rispetto a gli indicatori ordinali sono considerati lettere. Pensavo che le lettere fossero solo [a-zA-Z] . Perché sono considerati lettere e non simboli? char.IsLetter('º'); // true char.IsLetter...
posta 04.04.2017 - 11:03
2
risposte

Nome e codice allo spazio tra linee / paragrafi

Sto cercando un termine e forse il codice dietro ciò che mi aiuterebbe a implementare quel termine in Python. Ho lavorato a un'applicazione di journaling in Python basata su testo.   Quando voglio rivedere il mio diario dalla shell della riga...
posta 13.01.2018 - 20:19
2
risposte

Ottimizzazione dell'ordinamento di grandi quantità di testo memorizzato in un database

Come memorizzereste le informazioni di testo - in un database relazionale o magari usando NoSQL? Il problema è che il testo dovrebbe essere diviso in varie parti, ciascuna delle quali soddisfa alcuni requisiti, ad es. lo stesso testo dovrebbe es...
posta 07.07.2011 - 10:34
2
risposte

In che modo Facebook rimuove html / apostrofi per XSS ma lo visualizza anche?

Non sono abbastanza sicuro se questa è una domanda per programmers.se piuttosto che stackoverflow, ma qui va. Così Facebook [o qualsiasi altra grande azienda] quando viene dato qualcosa come un apostrofo o html, può spogliarlo del suo intento ma...
posta 24.04.2013 - 22:34
0
risposte

Sincronizzazione della pagina Web e del pdf locale

Vorrei risolvere il seguente problema. Sul mio sito web, ho una lista delle mie pubblicazioni. Ho anche la mia lista di pubblicazioni su un file in lattice del mio curriculum. Il problema è che li aggiorno manualmente, e diventa noioso e soggett...
posta 20.07.2015 - 17:27
1
risposta

Alternative agli script Perl / python per trovare e sostituire

Sto lavorando su una base di codice abbastanza vecchia ma sufficientemente improduttiva che ho bisogno di creare uno (alcuni) script per aiutarmi. Ad esempio: aggiungiamo una versione # e un timestamp nell'intestazione del file (sì, usiam...
posta 20.01.2014 - 17:04