Διανυσματική Αναπαράσταση Λέξεων Για Επεξεργασία Φυσικής Γλώσσας
Abstract
Η συγκεκριμένη εργασία αναφέρεται στην μελέτη της επεξεργασίας της φυσικής γλώσσας
καθώς και στην υλοποίηση αρκετών τεχνικών της, χρησιμοποιώντας διάφορες μεθόδους
αναπαράστασης λέξεων με την μορφή διανυσμάτων. Πραγματοποιείται ανάλυση και
εκτέλεση του αλγορίθμου word2vec για το συγκεκριμένο σκοπό. Δημιουργείται και
αξιολογείται ένα μοντέλο γλώσσας στα ελληνικά. Τέλος παρουσιάζεται η υλοποίηση μιας
εφαρμογής διεπαφής χρήστη μέσω της οποίας παρουσιάζεται το μοντέλο που
κατασκευάστηκε στα ελληνικά.
This study refers to the analysis of the processing of natural language as well as the
implementation of several techniques, using various methods of vector word representation.
The word2vec algorithm is presents and implemented for the specific purpose. A language
model for the Greek language is create and evaluated. Finally, the creation of a web
application is presented, through which the model we built in the Greek language is
presented.