Πανεπιστήμιο Αθηνών

Τμήμα Βιολογίας

Τομέας Βιολογίας Κυττάρου & Βιοφυσικής

Δείτε τη σελίδα στα Αγγλικά

Λιακόπουλος, Θ.Δ., Μπάγκος, Π.Γ., Αλεξόπουλος, Ι.Κ. και Χαμόδρακας, Σ.Ι.

Τομέας Βιολογίας Κυττάρου & Βιοφυσικής,

Τμήμα Βιολογίας, Πανεπιστήμιο Αθηνών,

Πανεπιστημιούπολη, Αθήνα 15701, Ελλάδα


Ένα υπολογιστικό εργαλείο στον παγκόσμιο ιστό για την επιλογή βιολογικών ακολουθιών από ένα δεδομένο σύνολο, με ομοιότητα / ομολογία κάτω από ένα επίπεδο καθοριζόμενο από το χρήστη

Τα αντιπροσωπευτικά σύνολα δεδομένων έχουν αποφασιστική σημασία στην ανάλυση βιολογικών ακολουθιών. Χρησιμοποιούνται μεταξύ άλλων στην ανάπτυξη νέων αλγορίθμων πρόγνωσης, στον έλεγχο της αξιοπιστίας υπαρχόντων αλγορίθμων και στην εξαγωγή στατιστικών συμπερασμάτων βάσει της αμινοξικής ή νουκλεοτιδικής σύστασης. Υπάρχει η απαίτηση τα σύνολα δεδομένων αυτά να μην περιλαμβάνουν ακολουθίες περισσότερο όμοιες από ένα προκαθορισμένο επίπεδο. Έχουμε αναπτύξει μια εφαρμογή στον παγκόσμιο ιστό (WWW) η οποία χρησιμοποιεί ως είσοδο ένα αρχικό σύνολο Ν ακολουθιών και παράγει ένα σύνολο το οποίο ικανοποιεί ένα καθορισμένο από το χρήστη όριο ομοιότητας. Αρχικά, ο αλγόριθμος εκτελεί όλες τις στοιχίσεις BLAST κατά ζεύγη των ακολουθιών του αρχικού συνόλου και δημιουργεί έναν NxN πίνακα αποστάσεων, όπως αυτές καθορίζονται από τα επί τοις % ποσοστά ομοιότητας Κατά το επόμενο βήμα, ο αλγόριθμος απορρίπτει την ακολουθία με τις περισσότερες γειτονικές, έτσι ώστε αυτή να μην προσμετρηθεί ως γειτονική καμίας άλλης ακολουθίας κατά τα επόμενα βήματα. Στη συνέχεια επανακαθορίζεται ο αριθμός των γειτονικών της κάθε ακολουθίας και επαναλαμβάνεται το προηγούμενο βήμα μέχρις ότου, οι εναπομείνασες πρωτεΐνες να μην έχουν γειτονικές. Ο χρήστης έχει τη δυνατότητα να καθορίσει το όριο ομοιότητας και το ελάχιστο μήκος κάλυψης των στοιχίσεων. Ακολουθίες με ομοιότητα κάτω του ορίου ή με στοίχιση μικρότερης κάλυψης από το ελάχιστο μήκος δε θεωρούνται γειτονικές.