Εφαρμογή Τεχνικών Μηχανικής Μάθησης και Εξόρυξης Δεδομένων στην Γεωργία Ακριβείας
Abstract
Η παρούσα μελέτη, συμβαδίζοντας με την ταχεία τεχνολογική πρόοδο, εφαρμόζει τεχνικές
ανάλυσης δεδομένων Γεωργίας Ακριβείας, έχοντας ως στόχο να αξιοποιήσει δεδομένα που
προέρχονται από αισθητήρες τηλεπισκόπησης, οι οποίοι επιτρέπουν την παρατήρηση των
επιφανειακών χαρακτηριστικών της Γης σε υψηλότερη χωρική και φασματική ανάλυση. Για το
σκοπό αυτό εξετάζονται σύγχρονες τεχνικές μηχανικής μάθησης και εξόρυξης δεδομένων με
πεδίο εφαρμογής τη Γεωργία Ακριβείας και την Έξυπνη Γεωργία που συμβαδίζουν με το
ζητούμενο της εποχής, το οποίο σχετίζεται με την αύξηση της απόδοσης της γεωργικής
παραγωγής. Πιο συγκεκριμένα, ο σκοπός της παρούσας διπλωματικής εργασίας είναι η
εφαρμογή τεχνικών μηχανικής μάθησης και εξόρυξης δεδομένων σε δεδομένα γεωργίας
ακριβείας που έχουν συλλεχθεί από πτήσεις μη επανδρωμένων ιπτάμενων οχημάτων σε
καλλιέργειες κρόκου Κοζάνης. Στόχος είναι η παρακολούθηση και αξιοποίηση της
πληροφορίας που προέρχεται από ειδικά επεξεργασμένες εικόνες για την ποιοτική και
ποσοτική ανάλυση της βλάστησης στα χωράφια κρόκου. Το αποτέλεσμα της εφαρμογής των
παραπάνω μεθόδων είναι η εξαγωγή μοντέλων για την πρόβλεψη και τον εντοπισμό (α)
ζιζανίων (αγριόχορτων) , (β)- θηλαστικών (π.χ. ποντίκια) και (γ) βλάστησης.
Η διαδικασία που ακολουθείται για την εξαγωγή των παραπάνω μοντέλων εκτίμησης
περιλαμβάνει αρχικά τη συλλογή επεξεργασμένων εικόνων με χρήση τεχνικών
φωτογραμμετρίας, στη συνέχεια τον υπολογισμό δεικτών βλάστης, όπως ο δείκτης βλάστησης
κανονικοποιημένης διαφοράς (NDVI), και την καταγραφή των εικονοστοιχείων της εικόνας με
την μορφή συνόλου δεδομένων (dataset). Στο επόμενο βήμα πραγματοποιείται η ταξινόμηση
των εικόνων με την μέθοδο της ανάλυσης εικόνας ανά εικονοστοιχείο καθώς και με την
μέθοδο της αντικειμενοστραφούς ανάλυσης εικόνας (OBIA). Στο τελευταίο στάδιο
εκπαιδεύονται αλγόριθμοι μηχανικής μάθησης, όπως οι αλγόριθμοι των Τυχαίων Δασών και
Νευρωνικών Δικτύων στα δεδομένα ώστε να εξαχθούν τα μοντέλα πρόβλεψης των
καλλιεργειών.
Τα αποτελέσματα έδειξαν ότι οι δύο αλγόριθμοι είναι σε θέση να εντοπίσουν τα διάφορα
χαρακτηριστικά που απαρτίζουν ένα χωράφι κρόκου με στόχο να δώσουν μια ολοκληρωμένη
εικόνα για την καλλιέργεια στον γεωργό. Η καλύτερη μέθοδος αποδείχθηκε η μέθοδος ανά
εικονοστοιχείο αφήνοντας αρκετά περιθώρια βελτιώσεις στην μέθοδο ανά αντικείμενο που
εφαρμόστηκε. Αποδοτικότερος αλγόριθμος αποδείχθηκε αυτός των τυχαίων δασών με
ακρίβεια από 88%-100 % στην μέθοδο ανά εικονοστοιχείο και 81%-87% στην μέθοδο ανά
αντικείμενο. Αντίθετα ο αλγόριθμός των νευρωνικών φάνηκε να βρίσκει μεγαλύτερη αδυναμία
και στις δύο μεθόδους με ποσοστά ακρίβειας στην μέθοδο ανά εικονοστοιχείο 87% - 99% και
13% -80%. στην μέθοδο ανά αντικείμενο.
The present study, in line with rapid technological progress, applies Precision Agriculture
data analysis techniques, aiming to utilize data from remote sensing sensors, which allow the
observation of the Earth's surface characteristics in higher spatial and spectral resolution. For
this purpose, modern techniques of machine learning and data mining are examined, in the
field of Precision Agriculture and Smart Agriculture, that keep up with the demand of the time,
and is related to the increase of the efficiency of agricultural production. More specifically, the
purpose of this dissertation is the application of machine learning techniques and data mining
to precision agricultural data collected from unmanned aerial vehicle flights in Kozani Safran
crops. The aim is to monitor and utilize the information derived from specially processed
images for the qualitative and quantitative analysis of vegetation in Safran fields. The result of
the application of the above methods is to export models for the prediction and detection of (a)
weeds , (b) - mammals (e.g. mice) and (c) vegetation of Safran.
The procedure for extracting the above estimation models involves first collecting processed
images using photogrammetric techniques, then calculating shoot indices, such as the
normalized difference vegetation index (NDVI), and recording the pixels of the image as a
whole. data (dataset). In the next step, the images are sorted by the method of image resolution
per pixel as well as by the method of object-oriented image analysis (OBIA). In the last stage,
machine learning algorithms are trained, such as the Random Forests and Artificial Neural
Network in the input data in order to derive crop prediction models.
The results showed that the two algorithms are able to identify the various characteristics
that consists a Safran field in order to give a complete picture of the crop to the farmer. The
best method proved to be the pixel-based method , leaving a lot of space for improvement in
the object-based method applied. The most efficient algorithm proved to be that of random
forests with an accuracy of 88% -100% in the method per pixel and 81% -87% in the method
per object. On the contrary, the neural network algorithm seemed to find greater weakness in
both methods with percentages of accuracy in the method per pixel 87% - 99% and 13% -80%.
in the method per object.