Esiste un termine per un'entità che rappresenta un'altra entità nota mancante?

-1

Sto lavorando a un progetto in cui sto importando dati da fonti di terze parti. Spesso mancano alcuni dati (di solito quelli più vecchi), che sono rilevabili dai dati che ho. Ovviamente non riesco a riprodurre tutti i dati mancanti, ma posso effettivamente riprodurne alcuni ; in particolare i valori delta.

Quindi il mio piano è creare un'entità per rappresentare questi dati mancanti, archiviare i pochi valori che posso ricavare e mantenere in archivio fino a quando non sarà in seguito riconciliata con un'altra importazione. Questa entità mancante rappresenterebbe almeno una, o forse anche più di una, delle entità effettive.

La mia domanda è: esiste un termine comune che è già stato stabilito per rappresentare questo tipo di dati mancanti conosciuti?

    
posta Ben Harrison 01.06.2017 - 17:49
fonte

4 risposte

2

Segnaposto sembra appropriato, anche se in senso stretto un segnaposto conserva un posto per i dati che verranno in seguito.

Stimato può essere un buon termine da utilizzare se i valori che stai sostituendo potrebbero essere leggermente off.

Inferito , Calcolato o Derivato potrebbero anche comunicare correttamente il significato. Un valore calcolato sarebbe qualcosa derivato numericamente; derivato è più generale in quanto potrebbe esserci una funzione deterministica, ma gli input potrebbero essere non numerici, ad es. combinando stringhe. Inferito è ancora più generale e potrebbe richiedere un input di funzione che include dati esterni, ad es. se si deduce una posizione guardando su una mappa.

Fittizio sarebbe un buon termine se ti aspetti che i tuoi valori dedotti siano significativamente al di fuori.

Ovviamente deriso è il termine normale se i dati vengono forniti per il test dell'unità.

    
risposta data 01.06.2017 - 20:42
fonte
2

Non mi è chiaro cosa intendi per entità. Il valore da utilizzare al posto dei dati mancanti o di uno stereotipo?

Come stereotipo potresti usare il termine segnaposto o manichino. Per i dati reali potrebbe essere "sconosciuto" (vorresti che fosse unico, impossibile scontrarsi con qualunque cosa riceverai alla fine).

    
risposta data 01.06.2017 - 19:12
fonte
0

Le informazioni mancanti possono essere chiamate "non specificate"

Se l'informazione mancante esiste ma non è comunicata, può essere chiamata "non segnalata".

La struttura dei dati che ha alcune informazioni ma ne manca altre può essere chiamata "incompleta"

    
risposta data 01.06.2017 - 18:10
fonte
0

La mia opinione è che piuttosto che avere un'entità mancante rappresentata come un tipo alternativo, sarebbe meglio descrivere la provenienza dei dati che abbiamo in tutte le entità in qualche modo - come tagging con attributi o relazioni, qualcosa di semplice come come: conosciuto / dato, vs derivato / calcolato / dedotto contro assunto, o qualcosa di più complesso che cattura chi / cosa / quando.

In un modello relazionale, diversi tipi di entità significheranno tabelle separate, che impongono oneri sulle query. In OOP, diversi tipi imporranno oneri analoghi a meno che non si utilizzi l'ereditarietà per unificare i concetti - e per questo direi composizione sull'ereditarietà: in questo caso la composizione delle informazioni di provenienza sull'ereditarietà dei tipi (di provenienza).

is there a common term that is already established to represent this kind of known missing data?

Non che io sia a conoscenza del modo in cui lo descrivi, ma ci sono nozioni di provenienza di informazioni e queste nozioni possono variare da semplici a complesse.

Altrimenti, nel modello relazionale, NULL viene utilizzato per rappresentare due nozioni conflazionate: (1) mancante e non applicabile, e (2) mancante ma applicabile (o semplicemente dati mancanti). La tua descrizione va al secondo utilizzo di NULL in SQL.

(Il primo, mancante e non applicabile, significa che ci sono tipi veramente diversi nella stessa tabella, come quando un CEO non riferisce a nessuno (e mai lo farà: i dati non sono mancanti o sconosciuti, la colonna "non applicabile" a questa riga) così ha la colonna reports to come nulla, a differenza di tutto il resto dei dipendenti che fanno e devono riferire a qualcuno.)

Per vostra informazione, ci sono altri concetti come futures o promesse, che sono in effetti proxy per informazioni non ancora disponibili, sebbene questi siano profondamente correlati ai modelli di programmazione (thread, attività asincrona, altri comportamenti) e meno alla memorizzazione di informazioni del dominio oggetti.

    
risposta data 01.06.2017 - 19:16
fonte

Leggi altre domande sui tag