La traccia di analisi incontra il risultato del file di output

3

Sto costruendo un parser per una nota traccia & file di output del software di gestione del field meet ( output di esempio ).

Posso analizzarlo manualmente e inserire gli elementi nel mio modello di oggetto (panoramica sotto), ma è un po 'più lungo di tempo e avrà problemi manuali.

Per la cronaca, sto usando C # ma non ho problemi a superare i confini in lingue migliori / più appropriate qui.

Ho provato / pensato a un paio di modi diversi in questo, e sono tutti solo meh .

  • Utilizza un StringReader per analizzare ogni riga, una alla volta, finché non corro nei "separatori di eventi", quindi cerco di raccogliere insieme questi dati. Parse after.
  • Utilizza un Regex.Split rispetto a un'espressione regolare che assomigli a qualcosa come Event\s+\d*\s+(Girls|Boys)\s+(.*)\n[=]+\n(.*)\n[=]+ per dividere la stringa di input in blocchi simili. Parse after.
  • Utilizza Amazon Mechanical Turk e assumi un piccolo esercito di umani per fare questo lavoro per me.
  • Succhialo e continua a farlo manualmente

Quindi, è del tutto possibile che io stia andando tutto storto, e dovrei usare un linguaggio / schema / concetto che non so nemmeno esistere. Qualsiasi aiuto qui sarebbe notevolmente apprezzato.

Tieni presente che in realtà non ho bisogno del codice per eseguire l'analisi, sto solo cercando l'idea alla base.

Il modello di oggetto (semplificato) ha un aspetto simile al seguente:

  • Incontra
    • Nome
    • Data
    • posizione
  • Scuola
    • Nome
  • Athlete
    • Nome
    • di genere
    • Anno della laurea
  • Performance
    • MeetId
    • SchoolId
    • Dati (tempo, altezza o distanza effettivi)
  • AthletePerformance
    • AthleteId
    • PerformanceId
posta Tony Morris 12.04.2018 - 07:04
fonte

0 risposte

Leggi altre domande sui tag