Naïve Bayes and named entity recognition for requirements mining in job postings

Vorschaubild nicht verfügbar
Autor:in (Körperschaft)
Publikationsdatum
2021
Typ der Arbeit
Studiengang
Typ
04B - Beitrag Konferenzschrift
Herausgeber:innen
Herausgeber:in (Körperschaft)
Betreuer:in
Übergeordnetes Werk
2021 3rd International Conference on Natural Language Processing. Proceedings
Themenheft
Link
Reihe / Serie
Reihennummer
Jahrgang / Band
Ausgabe / Nummer
Seiten / Dauer
155-161
Patentnummer
Verlag / Herausgebende Institution
Verlagsort / Veranstaltungsort
Bejing
Auflage
Version
Programmiersprache
Abtretungsempfänger:in
Praxispartner:in/Auftraggeber:in
Zusammenfassung
This paper analyses how the required skills in a job post can be extracted. With an automated extraction of skills from unstructured text, applicants could be more accurately matched and search engines could provide better recommendations. The problem is optimized by classifying the relevant parts of the description with a multinomial naïve Bayes model. The model identifies the section of the unstructured text in which the requirements are stated. Subsequently, a named entity recognition (NER) model extracts the required skills from the classified text. This approach minimizes the false positives since the data which is analyzed is already filtered. The results show that the naïve Bayes model classifies up to 99% of the sections correctly, and the NER model extracts 65% of the skills required for a position. The accuracy of the NER model is not sufficient to be used in production. On the validation set, the performance was insufficient. A more consistent labelling guideline would be needed and more data should be annotated to increase the performance.
Schlagwörter
Fachgebiet (DDC)
330 - Wirtschaft
Projekt
Veranstaltung
2021 3rd International Conference on Natural Language Processing (ICNLP 2021)
Startdatum der Ausstellung
Enddatum der Ausstellung
Startdatum der Konferenz
26.03.2021
Enddatum der Konferenz
28.03.2021
Datum der letzten Prüfung
ISBN
978-1-6654-1411-1
ISSN
Sprache
Englisch
Während FHNW Zugehörigkeit erstellt
Ja
Publikationsstatus
Veröffentlicht
Begutachtung
Peer-Review der ganzen Publikation
Open Access-Status
Closed
Lizenz
Zitation
WILD, Simon, Soyhan PARLAR, Thomas HANNE und Rolf DORNBERGER, 2021. Naïve Bayes and named entity recognition for requirements mining in job postings. In: 2021 3rd International Conference on Natural Language Processing. Proceedings. Bejing. 2021. S. 155–161. ISBN 978-1-6654-1411-1. Verfügbar unter: https://irf.fhnw.ch/handle/11654/42936