Ανάλυση Τεχνικών προγνωστικής μοντελοποίησης στη διαχείριση χρόνιων ασθενειών
Abstract
Η παρούσα διπλωματική εργασία ασχολείται με την Προγνωστική Μοντελοποίηση
και Ανάλυση (Predictive Analytics) στον τομέα της υγείας. Συγκεκριμένα, η εργασία
προσανατολίζεται στην ανάλυση δεδομένων καρδιακών παθήσεων με κατάλληλες τεχνικές
εξόρυξης δεδομένων ώστε να οδηγήσει στην εξαγωγή μοντέλων πρόβλεψης.
Στο πρώτο σκέλος της εργασίας, γίνεται μία εκτενής παρουσίαση των
χαρακτηριστικών της Προγνωστικής Ανάλυσης και των δυνατοτήτων που παρέχει σε
αρκετούς τομείς της επιστήμης όπως και αυτός της υγείας. Παρουσιάζονται επίσης, μέθοδοι
και τακτικές προσέγγισης ενός προβλήματος αυτού του είδους και προτείνονται
προτυποποιημένοι τρόποι αντιμετώπισης.
Στη συνέχεια, το βάρος της ανάλυσης μετατοπίζεται στο θεωρητικό υπόβαθρο που
απαιτείται από τον αναλυτή ώστε να εξάγει συμπεράσματα από τα δεδομένα του και να
καταφέρει να υλοποιήσει κατάλληλες τεχνικές πρόγνωσης σε αυτά τα δεδομένα. Σημαντικές
έννοιες αναλύονται ώστε να δοθεί στον αναγνώστη μία σφαιρική εικόνα της προσέγγισης
ενός προβλήματος Predictive Analytics.
Τα τελευταία κεφάλαια της εργασίας περιέχουν την υλοποίηση αρκετών σημαντικών
τεχνικών προγνωστικής ανάλυσης, οι οποίες εφαρμόζονται σε ένα ήδη γνωστό και
αναγνωρισμένο σύνολο δεδομένων το οποίο σχετίζεται με τις καρδιακές παθήσεις. Ιδιαίτερη
προσοχή δίνεται στην προσπάθεια κατηγοριοποίησης των χαρακτηριστικών που φέρουν τα
δεδομένα των ασθενών ώστε στο τέλος κάθε τεχνικής να παραχθεί ένα μοντέλο ικανό να
αποδώσει μία πρόβλεψη. Έπειτα, αναλύονται τα αποτελέσματα των αλγορίθμων και
εξάγονται συμπεράσματα από αυτά.
Τέλος, προτάθηκαν ορισμένες μελλοντικές επεκτάσεις οι οποίες είναι
προσανατολισμένες τόσο στον ερευνητικό τομέα αλλά κυρίως στον επιχειρηματικό.
The following thesis deals with Predictive Analytics Techniques in the department of
health. More specifically it involves around the analysis of data about heart conditions with
the proper techniques of data mining that lead to the creation of predictive models.
The first part of the thesis, presents the characteristics of Predictive Analysis and the
potential it provides to many scientific fields, including the health care. It also presents
methods and techniques of approaching this kind of problem providing standardized treatment
techniques.
Moving on, the importance of the analysis shifts to a theoretical level which is
necessary for the researcher in order to export conclusions from the data, and manage to
implement proper prediction techniques on them. Important concepts are analyzed so that the
reader is provided with a holistic view of approaching a Predictive Analytics problem.
The last chapters of the thesis contain the implementation of some important
Predictive Analytics techniques, which are applied to an already known and
certified-recognized database that includes information revolving around heart rate diseases.
Specific importance is given to the attempt of classifying the characteristics provided by the
patient’s data so that finally, having completed each technique, a model capable of delivering
a forecast is produced. The algorithm’s results are analyzed and conclusions are exported.
Finally, some future extensions which are oriented towards the research, but mainly
the business world are proposed.