Υλοποίηση και συγκριτική μελέτη αλγορίθμων ομαδοποίησης με σκοπό την επίτευξη ανωνυμίας στο διαδίκτυο των πραγμάτων
Abstract
Στη παρούσα διπλωματική εργασία αναλύεται η ανάγκη για τη διασφάλιση της
ιδιωτικότητας και της ανωνυμίας των χρηστών στο Διαδίκτυο των Πραγμάτων (ΙοΤ) και
μελετώνται τέσσερις αλγόριθμοι συσταδοποίησης οι οποίοι συμβάλλουν στη διασφάλιση της
ιδιωτικότητας των δεδομένων.
Χρησιμοποιώντας το προγραμματιστικό εργαλείο της Matlab, υλοποιήθηκαν οι αλγόριθμοι
K-means, DBSCAN (Density Based Spatial Clustering of Applications with Noise) και PADC
(Privacy and Availability Data Clustering), ενώ στα πλαίσια της διπλωματικής εργασίας
αναπτύχθηκε ένα νέο αλγοριθμικό μοντέλο (Utilized Outlier Effect-Density Based Spatial
Clustering of Applications with Noise - UOE-DBSCAN) που συμβάλλει στην παροχή ανωνυμίας
των δεδομένων των χρηστών.
Αρχικά, παρουσιάζεται ο χώρος του Διαδικτύου των Πραγμάτων και περιγράφονται τα
χαρακτηριστικά και οι ιδιότητές του. Αναλύονται τα επίπεδα αρχιτεκτονικής και οι τεχνολογίες που
χρησιμοποιούνται στο Διαδίκτυο των Πραγμάτων και αναφέρονται ορισμένα θέματα ασφάλειας
που υπάρχουν σε αυτό.
Στη συνέχεια, περιγράφονται οι βασικές τεχνικές διασφάλισης της ιδιωτικότητας στο
Διαδίκτυο των Πραγμάτων k-Ανωνυμία, l-diversity, t-closeness και ε-Διαφορική Ιδιωτικότητα.
Στα επόμενα δύο κεφάλαια, γίνεται μια αναλυτική περιγραφή των αλγορίθμων
συσταδοποίησης με τους οποίους αποκρύπτονται τα δεδομένα και η ταυτότητα των χρηστών από
κακόβουλους παρατηρητές. Οι αλγόριθμοι που αναλύονται είναι ο K-means, ο DBSCAN, ο
αλγόριθμος ιεραρχικής συσταδοποίησης και ο PADC. Επίσης, παρουσιάζεται ένα νέο,
προτεινόμενο αλγοριθμικό σχήμα που ονομάζεται UOE-DBSCAN και γίνεται αναφορά στα
ιδιαίτερα χαρακτηριστικά του.
Τέλος, πραγματοποιείται σύγκριση των παραπάνω αλγορίθμων με τον νέο αλγόριθμο ως
προς τις ακόλουθες μετρικές σύγκρισης της αποδοτικότητας: Precision, Recall και F-measure.
This diploma dissertation focuses on privacy and security issues regarding the Internet of
Things (IoT) paradigm and evaluates the performance of four clustering algorithms towards
achieving data anonymization.
By utilizing Matlab, K-means, DBSCAN (Density Based Spatial Clustering of Applications
with Noise) and PADC (Privacy and Availability Data Clustering) algorithms were implemented
while a new algorithmic model (Utilized Outlier Effect-Density Based Spatial Clustering of
Applications with Noise - UOE-DBSCAN) has also been developed as part of the dissertation,
which helps to increase the security of user data.
At first, the Internet of Things paradigm was analyzed based on its specific characteristics.
Then, an architectural point of view was presented, as well as according technologies for IoT
deployment. Moreover, focus was given on existing IoT security issues and vulnerabilities.
Continuing, a description is provided regarding the most well-known privacy-preservation
techniques, namely as k-anonymity, l-diversity, t-closeness and ε-differential privacy.
In the next two chapters, privacy-preserving algorithms are presented and discussed
focusing on identity disclosure and safeguarding user data from cyber-attackers. The evaluation
process considers the following algorithms: K-means, DBSCAN, Hierarchical clustering and PADC
algorithm. Additionally, a novel algorithmic model, UOE-DBSCAN is proposed and described.
Finally, a comparison is provided between the novel algorithm scheme and the other models
in terms of the following metrics regarding performance efficiency: Precision, Recall and F-measure.