Αλγόριθμοι μηχανικής μάθησης υπό αβεβαιότητα
Abstract
Ο σκοπός της παρούσας διπλωματικής εργασίας είναι η μελέτη του πως
υλοποιήσεις αλγορίθμων χαμηλής ασυμφωνίας βοηθούν στο πρόβλημα της
αβεβαιότητας σε έναν χώρο δεδομένων και η σύγκριση της απόδοσης τριών κλασικών
γραμμικών μοντέλων παλινδρόμησης, με αλλαγές σε δύο κύριες υπερ-παραμέτρους:
την επιλογή πέντε διαφορετικών αλγορίθμων δειγματοληψίας και την επιλογή διαφορετικού
αριθμού σημείων (500, 1,000 & 2,500). Οι αλγόριθμοι δειγματοληψίας χρησιμοποιούν
τις ακολουθίες αυτές για την παραγωγή των δεδομένων και τα αποτελέσματα
που προκύπτουν σχολιάζονται ως προς τις μετρικές R2, RMSE, MSE και MAE.
Συνολικά στην εργασία αυτή θα εξετάσουμε 45 συνδυασμούς μοντέλων και
υπερ-παραμέτρων, ώστε να αξιολογήσουμε την απόδοση τους στα 579 προβλήματα
που χρησιμοποιήθηκαν. Μελετώντας το σύνολο των αποτελεσμάτων μπορούμε να
συμπεράνουμε με μεγάλη βεβαιότητα ότι η απόδοση των μοντέλων βελτιώνεται με
την αύξηση του αριθμού των σημείων, ενώ σε όλες τις περιπτώσεις η παλινδρόμηση
Lasso φαίνεται να έχει τη μεγαλύτερη διασπορά στις τιμές του R2.