Χρήση ακολουθιακών προτύπων για ταξινόμηση δομής πρωτεϊνών.
Abstract
Η ταξινόμηση δεδομένων είναι ένα σημαντικό θέμα στον τομέα της εξόρυξης δεδομένων εξαιτίας της ευρείας κλίμακας εφαρμογών που μπορεί να χρησιμοποιηθεί. Υπάρχει ένας μεγάλος αριθμός μεθόδων που έχουν προταθεί για την επίλυση τέτοιου είδους προβλημάτων, οι οποίοι βασίζονται σε γνωστές τεχνικές εξόρυξης δεδομένων όπως τα δέντρα απόφασης ή τα νευρωνικά δίκτυα. Ωστόσο, αυτοί οι τύποι αλγόριθμων ταξινόμησης δεν μπορούν να εφαρμοστούν και να αποδώσουν σε ακολουθιακά δεδομένα όπως πρωτεϊνικές βάσεις δεδομένών που αποτελούνται από ακολουθίες αμινοξέων.\par
Στη Διπλωματική Εργασία μελετήθηκαν καινοτόμες αλγοριθμικές τεχνικές ταξινόμησης μέσω ακολουθιακών προτύπων για την πρόβλεψη της δευτεροταγούς δομής πρωτεϊνών. Συνοπτικά, επιλέχτηκε ένας βασικός αλγόριθμος στο κομματι της εξαγωγής ακολουθιακών προτύπων και αναπτύχθηκε κώδικας για την χρήση αυτών των προτύπων στην πρόβλεψη πρωτεϊνικών δομών σε ένα σύνολο από αλληλουχίες αμινοξέων. Σε ότι αφορά την πρόβλεψη πρωτεϊνικών δομών και την βαθμολόγηση ακολουθιακών προυτύπων υλοποιήθηκε μία πληθώρα καινοτόμων μεθοδολογιών, οι οποίες θεωρητικά και πειραματικά ξεπερνούν τα μειονεκτήματα των υπαρχόντων αλγορίθμων.