Ανάπτυξη μοντέλου μηχανικής όρασης για τον έλεγχο τεστ πολλαπλής επιλογής
Abstract
Αυτή η διατριβή διερευνά την εφαρμογή και την εκπαίδευση του YOLOv8 (You Only Look Once) για εργασίες ανίχνευσης αντικειμένων. Καλύπτουμε την προεπεξεργασία των συνόλων δεδομένων χρησιμοποιώντας τεχνικές όπως η θόλωση και η μετατροπή σε κλίμακα του γκρι και η συνδυαστική τους επίδραση στην απόδοση του μοντέλου. Το έγγραφο περιγράφει λεπτομερώς τη διαδικασία εκπαίδευσης χρησιμοποιώντας συγκεκριμένες εντολές και τον σχολιασμό των δεδομένων χρησιμοποιώντας το LabelImg. Εμβαθύνουμε επίσης στη διαμόρφωση των αρχείων YAML που είναι απαραίτητα για την εκπαίδευση του YOLOv8 και εξηγούμε βασικές μετρήσεις αξιολόγησης, όπως η μήτρα σύγχυσης και η ανάλυση παρτίδας εκπαίδευσης. Παρουσιάζεται μια μελέτη περίπτωσης για την αυτοματοποιημένη βαθμολόγηση χρησιμοποιώντας το YOLOv8, με μια λεπτομερή εξήγηση του σχετικού κώδικα Python. Η εργασία αυτή υποστηρίζεται από αναφορές σε σχετική βιβλιογραφία και πρακτικούς οδηγούς.----------------------------------------- This thesis explores the implementation and training of YOLOv8 (You Only Look Once) for object detection tasks. We cover the preprocessing of datasets using techniques such as blurring and grayscale conversion, and their combined effect on model performance. The document details the training process using specific commands and the annotation of data using LabelImg. We also delve into the configuration of YAML files necessary for training YOLOv8 and explain key evaluation metrics such as the confusion matrix and training batch analysis. A case study on automated grading using YOLOv8 is presented, with a thorough explanation of the associated Python code. This work is supported by references to relevant literature and practical guides.