Αλγόριθμοι ενισχυτικής μάθησης για την εύρεση βέλτιστων στρατηγικών σε αγώνες αυτοκινήτου
Abstract
Η ενισχυτική μάθηση είναι μία μορφή της μηχανικής μάθησης στην οποία ένας
πράκτορας εκτελεί ενέργειες πάνω σε ένα περιβάλλον το οποίο εξερευνά και εκ-
μεταλλεύεται τις γνώσεις που αποκτά με απώτερο σκοπό τη βελτιστοποίηση της
επίδρασης των ενεργειών του. Η βελτιστοποίηση των ενεργειών του επιτυγχάνε-
ται με την επαναληπτική εκτέλεσή τους στο περιβάλλον το οποίο κάθε φορά μας
γνωστοποιεί για τα αποτελέσματα που προκάλεσε σε αυτό και κατά πόσο απο-
δοτική ήταν ενέργεια που εκτελέσθηκε. Στην παρούσα διπλωματική εργασία αφού
αναφερθούν οι βασικές έννοιες της μηχανικής μάθησης και περιγράψουμε τη βα-
σική δομή της ενισχυτικής μάθησης, αναφέρουμε πρακτικές μηχανικής μάθησης που
έχουν αναπτύξει ή αναπτύσσουν καθημερινά ερευνητές του μηχανοκίνητου αθλητι-
σμού. Πέρα από αυτά εξηγούμε τη δομή που έχει το πρόγραμμα πάνω στο οποίο
εργαστήκαμε. Στη συνέχεια γίνεται περιγραφή της λειτουργίας του προγράμματος
αυτού, όπου εδώ ο πράκτορας είναι ένας εικονικός μηχανικός στρατηγικής μίας
ομάδας της Formula 1 με σκοπό τη δημιουργία ενός μοντέλου που θα κατατάξει
τον οδηγό στην καλύτερη δυνατή θέση στο τέλος της προσομοίωσης. Συμπληρω-
ματικά εξηγούμε τη δομή και τον τρόπο λειτουργίας της συνάρτησης ανταμοιβής
που προτάθηκε στα πλαίσια της εργασίας. Έπειτα συγκρίνουμε τους μέσους όρους
θέσεων που προκύπτουν για τον κάθε οδηγό, αφού γίνει προσομοίωση του κάθε
αγώνα 10 φορές, στις οποίες ο πράκτορας εκμεταλλεύεται τα μοντέλα που έχουν
δημιουργηθεί από τη συνάρτηση ανταμοιβής των δημιουργών και της συνάρτησης
ανταμοιβής που προτάθηκε ως μέρος της εργασίας.