Σύγκριση αλγόριθμων δημιουργίας υποκατάστατων μοντέλων
Abstract
Τα περισσότερα προβλήματα του πραγματικού κόσμου είναι πολύ περίπλοκα
και για να γίνει μια μεμονωμένη προσομοίωση μπορεί να διαρκέσει πολλές ώρες
ακόμα και μέρες για να ολοκληρωθεί. Αυτό έχει ως αποτέλεσμα να καθιστά τις προ-
σομοιώσεις μη προσιτή τεχνική. Ένας τρόπος για να μετριαστεί το συγκεκριμένο
πρόβλημα είναι η χρήση υποκατάστατων μοντέλων τα οποία μιμούνται τη συμπε-
ριφορά του συστήματος όσο το δυνατόν πιο πολύ. Εν αντιθέσει των προσομοιώ-
σεων, τα υποκατάστατα μοντέλα είναι μια υπολογιστικά φθηνή διαδικασία. Στην
παρούσα διπλωματική εργασία δόθηκε έμφαση στα προβλήματα μαύρου κουτιού
όπου τα υποκατάστατα μοντέλα δεν έχουν πρόσβαση στις πραγματικές παρατηρή-
σεις και μπορούν να είναι τόσο καλά όσο το μοντέλο του μαύρου κουτιού. Είναι
πιθανό να γίνουν κακές προβλέψεις. Για αυτόν τον λόγο πρέπει να έχουμε ένα ξε-
χωριστό σύνολο δεδομένων δοκιμών, για να μπορούμε να ελέγξουμε την ακρίβεια
του μοντέλου. Χρησιμοποιήθηκαν εννέα αλγόριθμοι και δύο λογισμικά (TensorFlow,
Alamo) για να ελέγξουμε την ακρίβεια και τα σφάλματα των αλγόριθμων σε διά-
φορα προβλήματα. Συγκεκριμένα χρησιμοποιήθηκε το SMT το οποίο παρέχει διά-
φορους αλγόριθμους υποκατάστατων μοντέλων και είναι ανοιχτού κώδικα. Έπειτα
προστέθηκαν επιπλέον αλγόριθμοι για να συγκρίνουμε την ακρίβεια τους με τις
κλασικές μεθόδους που παρέχει το SMT. Όλοι οι αλγόριθμοι εξετάστηκαν και σε
δεδομένα παλινδρόμησης αλλά και σε δεδομένα κατηγοριοποίησης. Τέλος, με την
βοήθεια του λογισμικού Alamo πραγματοποιήθηκε η σύγκριση των πραγματικών
συναρτήσεων με τις συναρτήσεις όπου προέβλεψε το μοντέλο.