Automatisierte Informationserfassung aus Stellenausschreibungen

Das Stelleninserat ist eine relativ standardisierte Textsorte, die mit hoher Regelmässigkeit eine Auswahl grundlegender Angaben zur ausgeschriebenen Stelle, zu den Anforderungen, zur gesuchten Person und zum inserierenden Unternehmen enthält. Es bietet sich deshalb an, mit automatisierter Informationsverarbeitung eine Vielzahl höchst relevanter und interessanter Informationen aus Stelleninseraten zu gewinnen.

Dabei strebt der SMM einerseits an, die Erfassung von Informationen, die im Scientific Use File bereitgestellt werden, weitestgehend zu automatisieren. Andererseits sollen über innovative Text Mining-Verfahren neue, zusätzliche Informationen aus den Stelleninseraten erschlossen werden.

Zu diesem Zweck hat der SMM ein Text Zoning basierend auf neuronalen Netzen entwickelt (Gnehm, 2018). Dabei werden die verschiedenen inhaltlichen Bereiche des Stelleninserates, wie etwa die Beschreibung des Unternehmens, der ausgeschriebenen Stelle oder der gesuchten Person identifiziert und so die anschliessende Informationsextraktion erleichtert. Darauf aufbauend wurde beispielsweise die automatische Extraktion von IT-Skills realisiert (Buchmann, Buchs & Gnehm, in print).

Eine umfassende automatische Erfassung von Stellenanforderungen (Aus- und Weiter-bildungen, Methoden-, Selbst-, Sozialkompetenzen, Sprachkompetenzen und IT-komplementäre Skills) und von Tätigkeitsbereichen der zu besetzenden Stelle wird im Rahmen des NFP-77 Projekts Monitoring Task and Skill Profiles in the Digital Economy angestrebt.

Als weiteres langfristiges Ziel sollen Informationen zur Selbstdarstellung der Unternehmen erfasst werden sowie auch die Ansprache der Stellensuchenden, respektive die expliziten oder impliziten Aussagen zu Geschlecht und Alter der gesuchten Person.