Ανάπτυξη ενός μοντέλου βασισμένου στη μηχανική μάθηση για την ανίχνευση απάτης σε χρηματοπιστωτικές συναλλαγές με χρήση ιστορικών δεδομένων
Abstract
Η εργασία αυτή ασχολείται με την ανίχνευση απάτης στις ηλεκτρονικές συναλλαγές μέσω τεχνικών μηχανικής μάθησης, εστιάζοντας στη συγκριτική αξιολόγηση των αλγορίθμων Random Forest και Deep Neural Networks (DNN). Στόχος της μελέτης είναι να διερευνήσει την αποδοτικότητα των αλγορίθμων αυτών, εξετάζοντας την με διάφορες μετρικές, καθώς και την ικανότητά τους να διαχειρίζονται δεδομένα με έντονη ανισορροπία μέσω τεχνικών oversampling, όπως SMOTE, ADASYN, Edited Nearest Neighbours και SMOTE/Tomek. Αρχικά, παρουσιάζονται οι βασικές έννοιες της ανίχνευσης απάτης και ο ρόλος της μηχανικής μάθησης στην αντιμετώπιση τους. Στη συνέχεια, περιγράφεται η μεθοδολογία που ακολουθήθηκε, περιλαμβάνοντας τη συλλογή και την προεπεξεργασία των δεδομένων, την δημιουργία των μοντέλων και τη χρήση τεχνικών εξισορρόπησης δεδομένων για τη βελτίωση της απόδοσης των αλγορίθμων. Τα πειραματικά αποτελέσματα δείχνουν ότι το Random Forest επιτυγχάνει υψηλότερη συνολική απόδοση, διατηρώντας μια ισορροπία μεταξύ precision και recall, ενώ το DNN παρουσιάζει αστάθεια στην απόδοσή του, με υψηλό recall αλλά χαμηλό precision, γεγονός που περιορίζει την πρακτική του εφαρμογή. Συνολικά, η εργασία αναδεικνύει τη σημασία της επιλογής του κατάλληλου αλγορίθμου και των τεχνικών επεξεργασίας δεδομένων για την ανίχνευση απάτης. Τα αποτελέσματα παρέχουν χρήσιμες πληροφορίες για τη βελτίωση των υφιστάμενων συστημάτων ασφαλείας στον χρηματοπιστωτικό τομέα, ενώ προτείνονται κατευθύνσεις για μελλοντική έρευνα, όπως η ενσωμάτωση προηγμένων deep learning τεχνικών, η διερεύνηση της ερμηνευσιμότητας των μοντέλων και η ανάπτυξη hybrid learning προσεγγίσεων.