Die Dateninfrastruktur des SMM

Die Grundlage der Berechnungen und Veröffentlichungen des Stellenmarktmonitor (SMM) ist eine komplexe Dateninfrastruktur. Diese umfasst (1) die Sammlung von Daten, (2) deren Bearbeitung, (3) die Qualitätssicherung der Prozesse, und (4) die Publikationen des SMM.

Diese vier Komponenten unserer Infrastruktur sind in der Grafik abgebildet und werden nachfolgend detailliert beschrieben.

Zusätzliche Angaben zum Adecco Swiss Job Market Index finden sich hier, das Scientific-Use-File ist zudem noch hier genauer beschrieben.
 

Jährlicher Methodologischer Zyklus der SMM-Dateninfrastruktur

Methodischer Zyklus des SMM

1. Datensammlung

Der SMM sammelt Stelleninserate-Daten, die im Web entweder auf Webseiten von Firmen oder auf Jobportalen publiziert werden. Die Aggregation von Daten der Jobportale läuft kontinuierlich über automatisierte Software. Hierbei werden drei Mal pro Tag Inserate auf 11 Portalen gesichtet, was jährlich zu einer Erfassung von etwa 1,3 Mio. neuen Inseraten führt. Auf den Firmenwebseiten werden quartalsweise von über 1.300 Firmen etwa 4.700 Inserate computergestützt erhoben. Zudem werden jedes Quartal für eine Stichprobe der Jobportal-Daten die Inseratetexte gespeichert. 

1. Jobportalpanel

Die ausgeschriebenen Stellen auf den Jobportalen werden seit 2006 erfasst. Die für die Ausschreibung offener Stellen meistgenutzten Portale werden anhand unserer jährlichen Unternehmensbefragung (siehe unten) identifiziert. Damit stellen wir sicher, dass rund 95% der auf Jobportalen publizierten Inserate von uns erfasst werden.

2. Firmenpanel

Die Stellenangebote auf unternehmenseigenen Webseiten werden seit 2001 erfasst. Hierfür wurde ein für die Schweiz representatives Panel, mit anfangs über 1.500 Firmen, aus dem Betriebs- und Unternehmensregister (BUR) des Bundesamt für Statistik gezogen. Eigene Qualitätssicherungsmechanismen (siehe unten) und ein jährliches Update aus dem BUR werden zudem genutzt, um das Panel zu erneuern. Das Firmenpanel ist proportional nach Branchen und disproportional nach Grössenklassen geschichtet, so dass die zahlenmässig wenigen, aber für den Stellenmarkt besonders wichtigen grossen und ganz grossen Unternehmen zuverlässig erfasst werden. Durch eine entsprechende Gewichtung wird diese Disproportionalität bei der Auswertung ausgeglichen. Die in dieser Stichprobe berücksichtigten Firmen bilden die Grundlage sowohl für die Erhebung der Stelleninserate von Unternehmens-Webseiten, als auch für unsere Unternehmensbefragung. Für die Erhebung werden nur Firmen berücksichtigt, die über eine eigene Webseite verfügen.

2. Datenbearbeitung und Informationsextraktion

Die Infrastruktur des SMM beinhaltet mehrere Sektionen, in denen Daten bearbeitet und Informationen aus den Stelleninseraten extrahiert werden.

1. Vercodung von Variablen für das SUF

Jedes Jahr werden neue Stelleninserate-Daten des Vorjahres im Rahmen des Scientific-Use-File (SUF) publiziert. Die Codierung der im SUF angebotenen Variablen wird ab April über mehrere Monate von ausgebildeten MitarbeiterInnen erledigt. Hierfür wird das Personal eingehend geschult und unterliegende Dokumente mit Codierungs-Schemata werden periodisch aktualisiert.

2. Automatische Vercodung von Daten für den ASJMI

Für den quartalsweise erscheinenden Adecco Swiss Job Market Index nutzt der SMM automatische Vercodungstools, über die Regionen- und Berufskategorien aus den Stelleninseraten extrahiert werden.

3. Informationsextraktion in anderen Projekte 

Zudem nutzen wir die Vielfalt der Stelleninserate-Daten in verschiedenen wissenschaftlichen Projekten, in deren Rahmen wir per Informationsextraktion auf Job- oder Berufsebene Variablen generieren. Bspw. haben wir in einem Projekt zur Entlohnung von IT-Kenntnissen solche Kenntnisanforderungen direkt aus Inseratetexten extrahiert und auf Berufsebene aggregiert. In einem neuen und bis 2024 laufenden Projekt wird diese Arbeit zudem ausgeweitet, um Kenntnis- wie auch Qualifikationsprofile in der digitalen Wirtschaft zu untersuchen.

3. Qualitätsmanagement

Die Sammlung von Daten aus dem Web ermöglicht dem SMM, einen weltweit einzigartigen Datensatz von Stelleninseraten anzubieten. Gleichzeitig werden wir durch die Nutzung von sogenannten big data vor neue methodische Probleme gestellt. Bspw. können Web-basierte Datenquellen zu mangelhafter Repräsentativität führen. Ein anderes Risiko wird drift genannt, ein Phänomen, bei dem sich Änderungen der beobachteten Webseiten in Messungen widerspiegeln.

Um solche Risiken maximal zu kontrollieren, nutzt der SMM verschiedene Qualitätsmanagement (QM)-Methoden:

1. Zeitliche Vergleichbarkeit

Um sicherzustellen, dass unsere Daten über Zeit vergleichbar sind, nutzen wir unsere jährliche Firmenbefragung, die uns Aufschluss darüber gibt, wie und wo Firmen ihre Vakanzen inserieren. Zudem setzen wir auf kontinuierlich laufende QM-Tools, die uns z.B. Ausreißer in Zeitreihen identifizieren und frühzeitig korrigieren lassen.

2. Repräsentativität & Unternehmensbefragung

Ein besonderes Qualitätsmerkmal der SMM-Daten ist ihre Repräsentativität. Das Hauptinstrument, um diese zu gewährleisten, ist die jährliche Firmenbefragung, die zwischen Januar und März durchgeführt wird. Dabei befragen wir Firmen zu den von ihnen genutzten Recruitment-Kanälen und zu den Namen der relevantesten Jobportale. Die Analyse der Befragung ermöglicht es uns, die Erhebung von Stelleninseraten laufend so zu aktualisieren, dass sie die gesamte Schweiz umfasst. Die Befragung wird seit 2001 durchgeführt und hat seitdem eine Reponse-Rate von etwa 60%. Zusätzlich zu der Firmenbefragung nutzen wir ein internes Feedback-System und eine jährliche Aktualisierung über das Betriebs- und Unternehmensregister (BUR), um unser Firmenpanel aktuell zu halten.

3. Anderes Qualitätsmanagement

Weitere QM-Tools werden an verschiedenen Stellen im Datenerhebungsprozess eingesetzt. Dies beinhaltet, z.B., ein Tool um die Konsistenz von Zeitreihen zu inspizieren, ein Tool um automatisch gesammelte Stelleninserate zu prüfen und ein Tool um Duplikate im Stelleninserate-Corpus zu identifizieren.

4. Publikationen

Als wissenschaftliches Projekt sind Publikationen unser wichtigster Output. Dabei adressieren wir wissenschaftliche Experten, aber genauso Politik, Wirtschaft, Verbände und die breitere Öffentlichkeit.

Jedes Jahr wird eine neue Version des SUF publiziert, das mit Stelleninserate-Daten des Vorjahres aktualisiert wurde. Zentrale Publikationen, die in Zusammenarbeit mit der Adecco Group Switzerland entstehen, sind der quartalsweise Adecco Swiss Job Market Index und der jährlich erscheinende Fachkräftemangel-Index. Die Veröffentlichung dieser Indices erzeugt mehrere Hunderte Mediennennungen jedes Jahr.

Neben diesen periodisch erscheinenden Publikation erarbeitet der SMM zudem Artikel in Fachzeitschriften, Policy-Papiere oder Gutachten für Verbände, Wirtschaft und Politk (siehe hier).

5. Erhebung von Pressedaten (alt)

Ein abgeschlossener Teil der Datenerhebung am SMM ist die Erhebung von Stelleninseraten aus Schweizer Pressetiteln.

Dabei wurden Stelleninserate ab 1950 (Deutschschweiz), respektive ab 2001 (ganze Schweiz), für ein repräsentatives Sample der Schweizer Presse erhoben. Das Sample wurde nach Auflagekategorie (3 Kategorien) und Erscheinungsregion (7 Regionen) geschichtet und entsprechend den Veränderungen in der Presselandschaft (Zeitungsauflösungen, Neulancierungen, Fusionen) jährlich aktualisiert. Hierbei wurden alle Zeitungstitel mit einer Auflage ab 75.000 einbezogen, während die zahlreichen kleinen und mittelgrossen Zeitungen und Anzeiger durch eine Zufallsstichprobe vertreten waren.

Das Pressesample umfasste rund 90 Titel. Inserate wurden jährlich und jeweils in der zweiten Märzwoche erhoben. Bis 2000 wurden 500 Stelleninserate jährlich erfasst, ab 2001 erhoben wir rund 650 Inserate.

Die Erhebung der Presse wurde 2018 eingestellt, nachdem Ergebnisse der Firmenbefragung über mehrere Jahre indizierten, dass nur noch ein minimaler Anteil aller Inserate ausschliesslich über Printmedien publiziert wird.