Ανάπτυξη Αλγορίθμων αξιολόγησης ανοικτών δεδομένων για συστήματα IoT βασισμένων σε τεχνικές μηχανικής μάθησης
Abstract
Η ανίχνευση ανωμαλιών παίζει κρίσιμο ρόλο στον εντοπισμό μη φυσιολογικής συμπεριφοράς σε δεδομένα αισθητήρων, επιτρέποντας έγκαιρη παρέμβαση και διατήρηση της ακεραιότητας του συστήματος. Συγκεκριμένα, η διαδικασία επιτρέπει την αναγνώριση διαφορετικής συμπεριφοράς από την προβλεπόμενη. Αυτό είναι ζωτικής σημασίας για πολλές εφαρμογές και συστήματα, καθώς η έγκαιρη ανίχνευση τέτοιων ανωμαλιών επιτρέπει την άμεση παρέμβαση και τη διόρθωση τους, εξασφαλίζοντας τη σταθερότητα και την αξιοπιστία του συστήματος. Σε αυτήν τη μελέτη, εξετάζουμε την επίδοση και την αποτελεσματικότητα διαφόρων τεχνικών ανίχνευσης ανωμαλιών (ταξινομητών) σε δεδομένα αισθητήρων, που βασίζονται στη μηχανική μάθηση όπως οι Μηχανές Διανυσμάτων Υποστήριξης, το Isolation Forest και οι Κ Πλησιέστεροι Γείτονες. Τα δεδομένα τα οποία μελετήθηκαν προήλθαν από δεδομένα αισθητήρων εδάφους, ποιότητας ανακτημένου νερού αλλά και αγρο-μετεωρολογικών σταθμών που είναι εγκατεστημένοι σε πειραματικό αγροτεμάχιο και σε έξοδο βιολογικού καθαρισμού. Η παρούσα μελέτη παρουσιάζει μια σφαιρική ανάλυση που περιλαμβάνει προεπεξεργασία των δεδομένων και αφαίρεση ακραίων τιμών, εκπαίδευση μοντέλων, και αξιολόγηση προβλέψεων. Αρχικά, τα δεδομένα προ επεξεργάζονται και αφαιρούνται οι ακραίες τιμές. Στη συνέχεια, εκπαιδεύονται οι ταξινομητές στα προ-επεξεργασμένα δεδομένα. Τέλος, μέσω των πειραμάτων, οι διάφοροι ταξινομητές συγκρίνονται για τους διάφορους αισθητήρες επιτρέποντας την κατανόηση των προτύπων απόδοσης και των τάσεων μεταξύ των ταξινομητών και των αισθητήρων, τον εντοπισμό συσχετίσεων, παραλλαγών και δυνητικά ακραίων σημείων στις μετρήσεις απόδοσης χρησιμοποιώντας το scatter plot.