Voglio creare un formato di dati aperto ... ma non so davvero cosa sia

1

Ho trovato la necessità di una standardizzazione per la memorizzazione e la registrazione di dati relativi alle informazioni sul diabete (non credo che ce ne siano, ma potrei averlo perso)

A tal fine ho creato questo progetto github perché voglio crearne uno .. ma non so davvero come andare su di esso, o anche di sicuro quello che voglio creare è chiamato.

Devo scegliere una lingua (xml, json) o un tipo di database (mongo, sqlite, mysql), o come "non specifico" sia possibile con qualcosa di simile.

Un formato dati come descrivo qui è una cosa? Ci sono altri nomi per quello che voglio provare a fare? È un compito un po 'strano da realizzare rispetto a quello a cui sono abituato.

    
posta Damon 24.08.2012 - 07:06
fonte

3 risposte

4

Hai trovato bisogno di un formato standardizzato o solo di un formato?

La necessità di un formato standardizzato si verifica solo quando si desidera rendere disponibili i dati a più client e si desidera consentire ad altri provider di fornire anche dati. In tal caso, è necessario discuterne con tutte le organizzazioni interessate e ottenere di volta in volta una specifica valida e completa.

Qualsiasi formato di dati sufficientemente specificato può essere definito "standard". Tuttavia, è solo quando diventa ampiamente adottato che è veramente uno standard.

In ogni caso, la specifica dei dati dovrà essere non ambigua, facile da implementare, robusta, possibilmente versione, e probabilmente di più.

Quindi devi fare pressioni per avere organizzazioni importanti o molte persone che usano il tuo formato, costringendo il resto del mondo a usare anche il formato.

Congratulazioni, hai introdotto uno standard!

obbligatorio:

link

    
risposta data 24.08.2012 - 08:26
fonte
0

Per prima cosa, devi definire una ontologia : cosa sono le "cose" che hanno bisogno di essere rappresentate nel tuo dominio del problema, quali sono le loro proprietà, come si collegano tra loro? Se stai cercando di definire uno standard generale per la condivisione dei dati, la tua ontologia deve coprire tutti i casi che potrebbero presentarsi in una serie piuttosto ampia di scenari.

Una volta che il bit semantico è fuori mano, la parte successiva è relativamente semplice: basta definire un formato dati che possa esprimere tutto quanto sopra :-). Seriamente, scegliere la tecnologia per rappresentare il dominio del problema sarà molto meno problematico di quanto non si esprima in modo inequivocabile il problema.

Questo è sicuramente "il punto strong" con i dati medici, in cui esistono già più pratiche e tecniche esistenti: dove qualcuno ha registrato che il trattamento è stato avviato, ti hanno dato la data del calendario, o il numero di giorni dopo la diagnosi, o il numero di giorni dopo la prima presentazione dei sintomi? Quale di questi è importante? Puoi "standardizzarlo" in un'unica rappresentazione in tutti i casi?

    
risposta data 24.08.2012 - 10:35
fonte
-1

Non usare XML o Mr. Atwood ti troverà e ti distruggerà. A parte gli scherzi, JSON potrebbe essere usato, e può essere caricato, manipolato e salvato da una varietà di tecnologia in questi giorni, come con Javascript (JQuery) sulle pagine web. JQuery può caricare un file ospitato su un URL remoto, il risultato di un URI dell'API del servizio Web, analizzarlo in oggetti Javascript, salvarlo su disco o inviare risultati in altri luoghi. Ubermensch menziona sopra che MongoDB può caricare da JSON, ma è altrettanto facile creare il proprio servizio web (REST o SOAP) che prende JSON tramite HTTP POST e poi lo memorizza in qualsiasi sistema di database che si desidera. Egli menziona anche che è possibile creare uno schema di dati, ma non sono sicuro che esista qualcosa di così facile da convalidare come XML Schema Definition (XSD) e i vari strumenti più robusti attorno a quella tecnologia meno recente. Quindi un vantaggio dell'utilizzo di XML sarebbe quello di creare un XSD e pubblicarlo, e vari strumenti di modifica potrebbero caricarlo e capire come darti "completamento del codice" (ad esempio, IntelliSense di Visual Studio) e convalida in linea. Un'altra tecnologia da considerare per rendere l'accesso ai dati standardizzato sarebbe OData, quindi se si dispone di un servizio Web davanti al proprio data warehouse, è possibile esporlo a persone per eseguire query in modo sicuro.

    
risposta data 24.08.2012 - 07:58
fonte

Leggi altre domande sui tag