Sto costruendo un parser per una nota traccia & file di output del software di gestione del field meet ( output di esempio ).
Posso analizzarlo manualmente e inserire gli elementi nel mio modello di oggetto (panoramica sotto), ma è un po 'più lungo di tempo e avrà problemi manuali.
Per la cronaca, sto usando C # ma non ho problemi a superare i confini in lingue migliori / più appropriate qui.
Ho provato / pensato a un paio di modi diversi in questo, e sono tutti solo meh .
- Utilizza un
StringReader
per analizzare ogni riga, una alla volta, finché non corro nei "separatori di eventi", quindi cerco di raccogliere insieme questi dati. Parse after. - Utilizza un
Regex.Split
rispetto a un'espressione regolare che assomigli a qualcosa comeEvent\s+\d*\s+(Girls|Boys)\s+(.*)\n[=]+\n(.*)\n[=]+
per dividere la stringa di input in blocchi simili. Parse after. - Utilizza Amazon Mechanical Turk e assumi un piccolo esercito di umani per fare questo lavoro per me.
- Succhialo e continua a farlo manualmente
Quindi, è del tutto possibile che io stia andando tutto storto, e dovrei usare un linguaggio / schema / concetto che non so nemmeno esistere. Qualsiasi aiuto qui sarebbe notevolmente apprezzato.
Tieni presente che in realtà non ho bisogno del codice per eseguire l'analisi, sto solo cercando l'idea alla base.
Il modello di oggetto (semplificato) ha un aspetto simile al seguente:
- Incontra
- Nome
- Data
- posizione
- Scuola
- Nome
- Athlete
- Nome
- di genere
- Anno della laurea
- Performance
- MeetId
- SchoolId
- Dati (tempo, altezza o distanza effettivi)
- AthletePerformance
- AthleteId
- PerformanceId