Show simple item record

dc.contributor.authorΜαραγκός, Γεώργιος
dc.date.accessioned2023-02-13T11:18:04Z
dc.date.available2023-02-13T11:18:04Z
dc.date.issued2022-09
dc.identifier.urihttps://dspace.uowm.gr/xmlui/handle/123456789/3156
dc.description.abstractΟ τομέας της ανάλυσης συναισθήματος (sentiment analysis) είναι ένα πεδίο που γνωρίζει ραγδαία αύξηση τα τελευταία χρόνια. Η ανάλυση συναισθήματος αποτελεί ισχυρό εργαλείο στον τομέα της διαφήμισης και του μάρκετινγκ, αφού μέσω αυτού οι εταιρείες του χώρου είναι σε θέση να πληροφορηθούν για την γνώμη του κόσμου σε ποικίλους τομείς. Πέρα από τον τομέα την διαφήμισης η ανάλυση συναισθήματος αποτελεί σημαντικό παράγοντα στην διευκόλυνση εξυπηρέτησης πελατών, αφού κατανοεί μέσω του τόνου αλλά και του ύφους που διαθέτουν τις ανάγκες τους. Η παρούσα διπλωματική εργασία σχετίζεται με την εφαρμογή μεθόδων ανάλυσης συναισθήματος στον τομέα της οικονομίας, με χρήση άρθρων οικονομικού χαρακτήρα. Για την αντιμετώπιση του προβλήματος εφαρμόστηκαν αλγόριθμοι μηχανικής μάθησης όπως τα δένδρα αποφάσεων (decision tree - DT), o αφελής ταξινομητής Bayes ( gaussian naïve classifier - GND), οι μηχανές διανυσμάτων υποστήριξης (support vector machines), γραμμική διακριτική ανάλυση (linear discriminating analysis – LDA), η στοχαστική κλίση καθόδου (stochastic gradient descent – SGD), ο αλγόριθμος k-κοντινότερων γειτόνων (K-nearest neighbors - KNN), αλλά και μοντέλα νευρωνικών δικτύων (Artificial Neural Networks - ANN) . Ωστόσο, πριν την εφαρμογή των παραπάνω αλγορίθμων, τα δεδομένα υποβλήθηκαν σε προ-επεξεργασία , ενώ ταυτόχρονα μετατράπηκαν και σε μορφή κατάλληλη ώστε να είναι κατανοητή από αυτούς. Στην παρούσα διπλωματική εργασία, περιλαμβάνονται διαδικασίες όπως ο καθαρισμός των δεδομένων από λέξεις με ελάσσονα σημασία (stop words), η αφαίρεση των σημείων στίξης (data cleansing), η προσαρμογή όλων των λέξεων σε πεζά γράμματα καθώς και η διαδικασία αναγωγής μιας λέξης στο πρωταρχική της ρίζα. Παράλληλα, η διαδικασία μετατροπής των δεδομένων ονομάζεται εξαγωγή χαρακτηριστικών (feature extraction) ενώ έχουν αναπτυχθεί αρκετές μέθοδοι οι οποίες μπορούν να εφαρμοστούν για την υλοποίηση αυτής. Πιο συγκεκριμένα, εφαρμόζεται η μέθοδος της μέτρησης διανύσματος (count vectorizer) και του term frequency - inverse document frequency (TF-IDF) που εξάγουν χαρακτηριστικά (features) από τα δεδομένα τα οποία καθίστανται έτοιμα προς χρήση μέσω των παραπάνω αλγορίθμων. Όσον αφορά τα αποτελέσματα, η μεθοδολογία που ακολουθείτε επιβεβαιώνει την αξιοπιστία των μοντέλων μηχανικής μάθησης για την εκμαίευση του συναισθηματικού τόνου από κείμενα με θεματολογία σχετική με τον τομέα των οικονομικών. Στο τέλος της παρούσας διπλωματικής εργασίας παρουσιάζονται σχετικά διαγράμματα με την ανάλυση συναισθήματος που έχουν προκύψει από κείμενα οικονομικού χαρακτήρα σε σχέση με τομείς όπως είναι η αγορά μετοχών (stock market), κρυπτό νομίσματα (crypto market) καθώς επίσης και το παγκόσμιο εμπόριο (commodities & futures) . Από τα διαγράμματα παρατηρείται η επιτυχία της διαδικασίας αφού σε ημερομηνίες παγκόσμιας ύφεσης όπως η περίοδος της πανδημίας covid-19 φαίνεται ραγδαία μείωση του παραγόμενου δείκτη συναισθήματος.en_US
dc.description.sponsorshipΕπιβλέπων καθηγητής: Σαρηγιαννίδης Παναγιώτηςen_US
dc.language.isogren_US
dc.publisherΜαραγκός, Γεώργιοςen_US
dc.subjectΜηχανική Μάθηση, Τεχνητή Νοημοσύνη, Βαθιά Μάθηση, Count Vectorizer, TF-IDF, Ανάλυση Συναισθήματος, Εξαγωγή χαρακτηριστικώνen_US
dc.subjectMachine Learning, Artificial Intelligence, Deep Learning, Count Vectorizer, TF-IDF, Sentiment Analysis, Feature Extractionen_US
dc.titleΔημιουργία υπηρεσίας για την εφαρμογή μεθόδων ανάλυσης συναισθήματος στον τραπεζικό τομέαen_US
dc.title.alternativeService creation for the application of sentiment analysis methods in the banking sectoren_US
dc.typeThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record