dc.description.abstract | Η παρούσα διπλωματική εργασία εξετάζει τα εργαλεία μηχανικής μάθησης που μπορούν να συμβάλλουν στη μελέτη, κατανόηση και επεξεργασία της φυσικής γλώσσας (Natural Language Process, συντομογραφία NLP).
Σε μία προσπάθεια ενοποίησης των κύριων εννοιών της καθημερινότητας ‘Μάθηση’, ‘Εκπαίδευση’ και ‘Διασκέδαση’, αξιοποιήθηκε ένα από τα πλέον πιο διαδεδομένα εργαλεία μελέτης φυσικής γλώσσας (Stanford Natural Language Process Library). Δημιουργήθηκε η κατάλληλη υποδομή, ώστε να χρησιμοποιηθεί από δύο εφαρμογές, οι οποίες έχουν ως στόχο την ευχάριστη εκμάθηση του συντακτικού της αγγλικής γλώσσας.
Οι εφαρμογές αποφασίστηκε να φέρουν την ονομασία ‘BrainTag’. Η ονομασία αυτή συνδέει δύο λέξεις. Brain (μυαλό - εγκέφαλος), γιατί αυτός είναι και το κύριος στόχος της εφαρμογής, η εκμάθηση. Tag (ετικέτα), γιατί κατά τη διάρκεια του παιχνιδιού, η κάθε λέξη έχει τη δική της ετικέτα με την πληροφορία της συντακτικής της ανάλυσης. Επίσης, η επιλογή μιας σύντομης λέξης μπορεί να βοηθήσει στην πιο εύκολη αποτύπωση και αφομοίωση του ονόματος της εφαρμογής από τους χρήστες.
Το πρώτο βήμα της διπλωματικής εργασίας ήταν η εξερεύνηση και η εκμάθηση της σουίτας Stanford Natural Language Process Library. Χρειάστηκε να γίνουν πειραματισμοί με τις διάφορες γλώσσες υποστήριξης, μέχρι να παρθεί η απόφαση ότι εν τέλει θα χρησιμοποιηθεί η γλώσσα προγραμματισμού Java. Η επιλογή της συγκεκριμένης γλώσσας έγινε λόγω του ότι μπορεί με ευκολία να εκτελεστεί από όλα τα λειτουργικά συστήματα. Ακόμα, μπορεί να επικοινωνήσει με την γλώσσα NodeJs, η οποία χρησιμοποιήθηκε για την δημιουργία του διαδικτυακού κορμού της υπηρεσίας εφαρμογών (backend).
Η δημιουργία του διαδικτυακού κορμού (backend) έγινε με κύριο στόχο την επαναχρησιμοποίηση και την ευκολία χρήσης του από έναν τρίτο προγραμματιστή. Δημιουργήθηκαν ξεχωριστά τερματικά σημεία (http endpoints) για κάθε μία από τις βασικές λειτουργίες της πλατφόρμας, όπως σύνδεση χρήστη, εγγραφή χρήστη, επεξεργασία φυσικού κειμένου, καταχώρηση αποτελεσμάτων, κ.α.
Μετά την επιτυχημένη δημιουργία του εξυπηρετητή, άρχισε ο προγραμματισμός της πρώτης τερματικής εφαρμογής, η οποία προορίστηκε για την κινητή πλατφόρμα Android. Στοχεύοντας ως κύρια ομάδα χρηστών, αγγλόφωνα παιδιά ηλικιών 11-17 (αντίστοιχες ηλικίες του ελληνικού Γυμνασίου - Λυκείου), χρησιμοποιήθηκαν κυρίως φωτεινά και έντονα χρώματα. Σκοπός ήταν η αύξηση του ενδιαφέροντος, κάτι που αποσκοπεί σε περισσότερες ώρες χρήσης της εφαρμογής.
Στη συνέχεια, έχοντας ως κύρια γραμμή το γραφικό περιβάλλον της εφαρμογής Android, πάρθηκε η απόφαση να δημιουργηθεί η αντίστοιχη εφαρμογή για τα λειτουργικά συστήματα Windows, MacOS και Linux. Ο βασικός σκοπός της επιλογής δημιουργίας εφαρμογών για αυτά τα λειτουργικά συστήματα είναι ότι στοχεύουν σε μικρές, κυρίως, ηλικίες, όπου ακόμα η χρήση υπολογιστή και κινητών τηλεφώνων πιθανά είναι περιορισμένη και υπό την εποπτεία γονέων. Ο γονέας νιώθει πιο ασφαλής όταν το παιδί του βρίσκεται σε μια κλειστή εφαρμογή στον υπολογιστή, σε σύγκριση με το να βρίσκεται σε μια ιστοσελίδα στο ίντερνετ, οπού μπορεί ανά πάσα στιγμή να μεταφερθεί σε κάποιον αμφιβόλου ποιότητας χώρο.
Οι δύο εφαρμογές/παιχνίδια έχουν τον ίδιο στόχο. Ο χρήστης ξεκινώντας το παιχνίδι χρησιμοποιεί μια τυχαία παράγραφο κειμένου, η οποία προέρχεται από την ιστοσελίδα της Wikipedia, είτε από τίτλους άρθρων των ειδησεογραφικών γραφείων Techcrunch, BBC news, Google News, CNN, National Geographic, The Verge, USA Today. Εφόσον το κείμενο υποστεί την κατάλληλη συντακτική ανάλυση, εμφανίζεται στον χρήστη χωρισμένο σε κομμάτια, ανά προτάσεις. Στο πάνω μέρος της οθόνης εμφανίζεται η πρόταση, και στο κάτω μέρος η συντακτική ανάλυση της κάθε λέξης με τυχαία σειρά. Ο χρήστης καλείται να σύρει με το ποντίκι ή με το χέρι του την ετικέτα με τη σωστή συντακτική ανάλυση πάνω από την κάθε λέξη. Στο τέλος κάθε πρότασης, ο χρήστης έχει τη δυνατότητα να δει τις σωστές και τις λανθασμένες επιλογές του. | en_US |
dc.subject | Natural language processing, learning, BrainTag, NLP, Android, Windows, MacOS, Linux, Stanford, επεξεργασία φυσικού κειμένου, εκμάθηση, διασκέδαση | en_US |