Μελέτη αλγορίθμων εξόρυξης σημαντικών λέξεων/φράσεων από κείμενο και δημιουργία εφαρμογής
Abstract
Η παρούσα εργασία πραγματεύεται την αυτόματη εξαγωγή λέξεων και φράσεων-κλειδιών από κείμενα. Στα πλαίσια της εργασίας, μελετήθηκε διεξοδικά η ερευνητική περιοχή της εξόρυξης κειμένου και πιο συγκεκριμένα, εξετάστηκαν αλγόριθμοι εξαγωγής λέξεων-κλειδιών όπως οι RAKE, YAKE, TF-IDF και TextRank. Παράλληλα, η εργασία επεκτείνει τον υπάρχοντα αλγόριθμο RAKE, προσθέτοντας σημασιολογία στον τρόπο με τον οποίο εξάγονται οι λέξεις-κλειδιά. Στόχος της παρούσας εργασίας είναι η επαύξηση του αλγορίθμου RAKE για την πιο αποδοτική και αποτελεσματική εξαγωγή λέξεων-κλειδιών, οι οποίες να αντιπροσωπεύουν με τον καλύτερο δυνατό τρόπο το κείμενο από το οποίο εξάγονται.------------------------------------ This paper deals with the automatic extraction of key words and phrases from texts. As part of the work, the research area of text mining was thoroughly studied and more specifically, keyword extraction algorithms such as RAKE, YAKE, TF-IDF and TextRank were examined. In parallel, the work extends the existing RAKE algorithm by adding semantics to the way keywords are extracted. The aim of this work is to augment the RAKE algorithm for the most efficient and effective extraction of keywords, which represent in the best possible way the text from which they are extracted.