Κατηγοριοποίηση κειμένου με χρήση εργαλείων μηχανικής μάθησης
Abstract
Η ανάπτυξη των τεχνολογιών του διαδικτύου οδήγησε στην μεγάλη διαθεσιμότητα διαδικτυακού περιεχομένου. Η πρόκληση που προέκυψε ήταν η διαχείριση μεγάλων όγκων δεδομένων, καθώς οι συμβατικές μέθοδοι δεν ήταν κατάλληλες πλέον να χρησιμοποιηθούν για το σκοπό αυτό. Οι αλγόριθμοι μηχανικής μάθησης είναι σε θέση να παράγουν πληροφορίες και συμπεράσματα από μεγάλα σύνολα δεδομένων, παρουσιάζοντας μικρή σχετικά πολυπλοκότητα. Μια δημοφιλής χρήση των τεχνικών της μηχανικής μάθησης είναι στην επεξεργασία φυσικής γλώσσας. Στην παρούσα εργασία πραγματοποιείται μία επισκόπηση των τρόπων εφαρμογής της μηχανικής μάθησης στην κατηγοριοποίηση κειμένων. Επιπλέον, εξετάζεται η αποτελεσματικότητα των μηχανισμών αυτών μέσα από την υλοποίηση τους σε γλώσσα προγραμματισμού υψηλού επιπέδου. Τα αποτελέσματα της μελέτης φανερώνουν τις υψηλές δυνατότητες της μηχανικής μάθησης για την ολοκλήρωση διαδικασιών επεξεργασίας φυσικής γλώσσας.