Esiste una formula per questo?

2

TL / DR: un modo per capire se i numeri noti tra una cifra iniziale e finale noti devono essere numeri positivi o negativi?

Sto sviluppando un'applicazione in PHP che può importare e leggere PDF. I PDF sono finanziari come estratti conto con registrazioni di transazioni in entrata e in uscita da un conto bancario. Ho solo PDF con cui lavorare, nessun altro formato come CSV, sfortunatamente.

Converto il PDF in HTML usando pdftohtml e inizio l'analisi dei dati, il risultato finale previsto è una serie di transazioni. Finora l'ho fatto lavorando senza intoppi raccogliendo date, descrizioni ed equilibrio. La conversione dell'XML invece non aiuta.

Ci sono altri pezzi di dati trascrizionali come gli importi di debito o di credito. Nel PDF, l'importo del credito si trova in una colonna e l'importo del debito si trova in un'altra colonna, quindi è abbastanza chiaro nel PDF. Tuttavia, quando convertito in HTML, la formattazione è persa e quindi non so se l'importo fosse un importo di credito o di debito.

Quindi, la mia domanda è, dato un saldo iniziale e un saldo finale e diverse figure conosciute nel mezzo, è possibile che un programma risolva se quelle figure note intermedie sono importi di credito o di debito?

Immagino che ci potrebbero essere diverse combinazioni di quei valori conosciuti per raggiungere il saldo finale, quindi vorrei applicare una formula per restituire la corretta sequenza di credito / debito solo se è l'unica soluzione possibile. Se ci sono diversi modi per aggiungere / sottrarre i valori conosciuti per raggiungere il saldo finale, posso chiedere all'utente di guardarlo manualmente, ma mi piacerebbe mantenerlo al minimo, se possibile.

Possibile fare, pensi? Grazie in anticipo per qualsiasi aiuto.

    
posta Gortron 20.12.2012 - 10:40
fonte

2 risposte

2

Se ci sono solo pochi valori tra la cifra iniziale e finale, è possibile utilizzare un algoritmo di forza bruta (provare tutte le combinazioni di vantaggi e svantaggi). Dubito che ci sia un modo molto più efficiente per farlo, dal momento che non è sufficiente trovare solo una soluzione: è necessario verificare se è l'unica soluzione. Probabilmente potresti usare alcuni trucchi per rendere l'intero processo un po 'più veloce, ma ciò non ti aiuterà se hai molti numeri in mezzo.

Questa soluzione, tuttavia, sembra inelegante ... Forse dovresti concentrarti sulla ricerca di un modo per preservare le informazioni di addebito / credito quando converti i dati da PDF a HTML. Come sono i tuoi file di output? Non c'è un modello (come "i valori di debito sono in posizioni dispari e i valori di credito sono in posizioni pari" o qualcosa di simile)?

    
risposta data 20.12.2012 - 11:55
fonte
3

Non riesco a vedere come sarebbe possibile. Considera questo:

Starting balance $100
$10 credit
$5 debit
$5 debit
Closing balance $100

E questo:

Starting balance $100
$10 debit
$5 credit
$5 credit
Closing balance $100

Come potresti distinguere tra questi due casi?

    
risposta data 20.12.2012 - 11:02
fonte

Leggi altre domande sui tag