TL / DR: un modo per capire se i numeri noti tra una cifra iniziale e finale noti devono essere numeri positivi o negativi?
Sto sviluppando un'applicazione in PHP che può importare e leggere PDF. I PDF sono finanziari come estratti conto con registrazioni di transazioni in entrata e in uscita da un conto bancario. Ho solo PDF con cui lavorare, nessun altro formato come CSV, sfortunatamente.
Converto il PDF in HTML usando pdftohtml e inizio l'analisi dei dati, il risultato finale previsto è una serie di transazioni. Finora l'ho fatto lavorando senza intoppi raccogliendo date, descrizioni ed equilibrio. La conversione dell'XML invece non aiuta.
Ci sono altri pezzi di dati trascrizionali come gli importi di debito o di credito. Nel PDF, l'importo del credito si trova in una colonna e l'importo del debito si trova in un'altra colonna, quindi è abbastanza chiaro nel PDF. Tuttavia, quando convertito in HTML, la formattazione è persa e quindi non so se l'importo fosse un importo di credito o di debito.
Quindi, la mia domanda è, dato un saldo iniziale e un saldo finale e diverse figure conosciute nel mezzo, è possibile che un programma risolva se quelle figure note intermedie sono importi di credito o di debito?
Immagino che ci potrebbero essere diverse combinazioni di quei valori conosciuti per raggiungere il saldo finale, quindi vorrei applicare una formula per restituire la corretta sequenza di credito / debito solo se è l'unica soluzione possibile. Se ci sono diversi modi per aggiungere / sottrarre i valori conosciuti per raggiungere il saldo finale, posso chiedere all'utente di guardarlo manualmente, ma mi piacerebbe mantenerlo al minimo, se possibile.
Possibile fare, pensi? Grazie in anticipo per qualsiasi aiuto.