EMC Greenplum Database erlaubt komplexe Auswertungen der Arbeitsmarktzahlen
Bill Cook, President Greenplum.
Zürich – Statistische Betrachtungen, die unter anderem als kurzfristiger Konjunkturindikator dienen, sowie die Steuerung des Vollzugs des AVIG (Arbeitslosenversicherungsgesetz) benötigen aktuelle Informationen und flexible, der jeweiligen Fragestellung exakt angepasste Auswertungen. Zu diesem Zweck betreibt die Arbeitsmarktstatistik des Bundes, die dem Staatssekretariat für Wirtschaft (SECO) angegliedert ist, bereits seit 2003 ein Business-Intelligence-System auf Basis eines klassischen Data Warehouse. Schon mit dieser ersten BI-Generation konnte man die früher üblichen, mit allmonatlich 17’000 Seiten äusserst umfangreichen und entsprechend unpraktischen Statistiken in Papierform durch eine viel bequemere Browserabfrage ablösen.
Zu den rund 900 Nutzern gehören neben den zuständigen Bundesstellen Mitarbeitende der 120 regionalen Arbeitsvermittlungszentren (RAV) in den 26 Kantonen sowie der über 40 Arbeitslosenkassen – für die Arbeitsmarktstatistik ergibt sich eine komplexe und heterogene Nutzergemeinde mit unterschiedlichen Anspruchsgruppen, die dem föderalistischen System der Schweiz entspricht. Auf Basis der EMC Greenplum Database kann das Schweizer Staatssekretariat für Wirtschaft komplexe Auswertungen der Arbeitsmarktzahlen seiner heterogenen Nutzergemeinde rascher und flexibler zur Verfügung stellen.
Im Rahmen der anstehenden Erneuerung der Infrastruktur für das BI-Umfeld wurde die bestehende Architektur und Umgebung durch SECO und den langjährigen Beratungspartner Saracus Consulting kritisch hinterfragt. Dabei wurden verschiedene Alternativen geprüft und der Entscheid fiel schliesslich auf eine Massiv Parallel Processing Datenbank von EMC Greenplum.
EMC Greenplum hat bei SECO mit ihrer Proof-of-Concept-Installation, in der die EMC Greenplum Database das bisherige Datenbanksystem ersetzt, eine neue Datenbanklösung geschaffen, die den Anforderungen von „Big Data“ genügt. Die Greenplum-Datenbank arbeitet mit massiv-paralleler Verarbeitung (MPP). Ein Master-Server steuert die Verarbeitung auf beliebig vielen Segment-Servern – die Lösung ist flexibel skalierbar und lässt sich auf unterschiedlichen Hardwareplattformen betreiben. Der Proof of Concept der Arbeitsmarktstatistik umfasst einen Master-Server, ergänzt durch einen zweiten Server für Redundanz, sowie vier Segment-Server.
Neue BI-Lösung für wachsende Ansprüche
Aufgrund steigender Anforderungen an die Arbeitsmarktstatistik startete das SECO im Jahr 2007 das Projekt LAMDA X (Labor Market Data Analysis). Die BI-Lösung wurde auf einem neuen Quellsystem aufgesetzt und das Frontend neu auf Basis von Microstrategy 9 entwickelt. Damit wurden flexiblere Auswertungen und künftig auch Abfragen von Mobilgeräten möglich. Im Rahmen von LAMDA X wurden bis 2009 verschiedene BI-Anwendungen mit teils komplexen Berechnungen realisiert, darunter etwa die offizielle Arbeitsmarktstatistik, Auszahlungsstatistiken der Arbeitslosenversicherungen, Führungskennzahlen (KPI) für die RAV-Leiter sowie Arbeitsloseninformationen für die Öffentlichkeit, die unter www.amstat.ch abgerufen werden können.
Flexibilität im Zentrum steigert Leistung deutlich
Für Dr. Elmar Benelli, Leiter DataWarehouse LAMDA beim SECO, war die Flexibilität bei der Hardware matchentscheidend. SECO‘s Data Warehouse ist mit rund 500 GB, davon 200 für die Data Marts, relativ klein und benötigt daher vor allem auch Skalierbarkeit nach unten. EMC Greenplum erlaubt ebenfalls den Betrieb auf preisgünstigen Industriestandard-Servern, die SECO bei den üblichen Bundeslieferanten unkompliziert beschaffen kann. Flexibler Umgang ist aber nicht nur bei der Hardwareauswahl wichtig. Im BI-Umfeld muss man Flexibilität generell höher gewichten als Stabilität – die Anforderungen ändern sich naturgemäss ständig, anders als etwa in einem Transaktionssystem, wo die Nutzer grundsätzlich möglichst wenig Wechsel wünschen. Die mit dem Proof-of-Concept angezielte und auch erreichte Performance-Steigerung trägt zur erwünschten Flexibilität bei.
Erfolgreiches Testprojekt mit Zukunft
„Das Team aus Mitarbeitern des SECO, der Saracus AG, des Bundesamts für Informatik und Telekommunikation (BIT) als Lösungsbetreiber sowie von Microstrategy und von EMC hat sehr gut zusammengearbeitet. Die Techniker haben sich schnell gefunden, waren immer gut erreichbar und haben Probleme jeweils zuverlässig gelöst.“ Laut Elmar Benelli konnte die Testphase Anfang Sommer 2012 erfolgreich abgeschlossen werden. Nun werden das bestehende System und die neue EMC-Greenplum-Lösung einige Monate parallel betrieben und dabei letzte Bereinigungen und Optimierungen eingebaut. Spätestens Ende Jahr soll die Schweizerische Arbeitsmarktstatistik dann definitiv über die neue Datenbank laufen. (EMC/mc/pg)
Über EMC
EMC unterstützt mit seinen Technologien und Lösungen Firmen dabei, den maximalen Nutzen aus ihrem Informationsbestand zu ziehen. Dabei hilft EMC Organisationen von der Entwicklung über den Aufbau bis hin zur Verwaltung von flexiblen, skalierbaren und sicheren Informationsinfrastrukturen – die zukünftig vollständig virtualisiert sein werden. EMC ist in der Schweiz in Zürich (Hauptsitz), Bern und Gland/VD vertreten.