Parsen der NRW Landtagsprotokolle: Technik und Fehleranalyse
by Marc-Andre Lemburg
Bei unserem letzten Python Meeting Düsseldorf Sprint im Herbst 2021, haben Oliver Stapel und ich an einem Projekt gearbeitet, um die Protokolle der Plenarsitzungen des NRW Landtags maschinell auswertbar zu machen.
Im Vortrag zeige ich die Vorgehensweise, typische Fehlerquellen bei solchen Ansätzen, Protokolle in strukturierte Daten zu verwandeln und werde, wenn noch Zeit ist, auch das OpenSearch (=ElasticSearch) System zeigen, in das wir die Daten füttert haben.
PS: Ich bin nur Samstag dabei.