Ομιλία στην τελετή απονομής των βραβείων του Ιδρύματος Nέμιτσας 2018 Αναστασία Αϊλαμάκη, 4 Οκτωβρίου 2018

Κύριε Πρόεδρε της Κυπριακής Δημοκρατίας,

Κύριε Πρόεδρε της Βουλής,

Κυρίες και Κύριοι,

Όταν ήμουν μαθήτρια, ήμουν ευτυχής μόνο όταν έλυνα μαθηματικά προβλήματα. Τα μαθηματικά ήταν κάτι περισσότερο από ένα σύνολο τύπων και συναρτήσεων για μένα: ήταν μια γλώσσα μέσω της οποίας μπορούσα να εκφραστώ και ένας κόσμος που συμφωνούσε μαζί μου. Ώσπου μυήθηκα στην υπολογιστική σκέψη.

Η επιστήμη των υπολογιστών είναι η απλούστευση και επίλυση δύσκολων προβλημάτων μέσω της επιστημονικής αφαίρεσης. Η μαγική αυτή διεργασία υλοποιείται με μεγαλοφυή μηχανική. Με προσέλκυσαν διάφορες πτυχές της επιστήμης των υπολογιστών – δίκτυα αρχιτεκτονική υλικού, διαχείριση δεδομένων, και δεν χρησιμοποίησα σοβαρά μαθηματικά και για χρονικό διάστημα. Τελικά κατέληξα στη διαχείριση δεδομένων όπου βρήκα πληθώρα πνευματικών και τεχνολογικών προκλήσεων.

Σήμερα, ακούμε πολλά για τα δεδομένα – κυρίως σε σχέση με το μέγεθός τους (“big data”). Στις επιχειρήσεις, στις υπηρεσίες και στο εμπόριο, στην επιστήμη και την εκπαίδευση, τα δεδομένα συλλέγονται τόσο επιθετικά ώστε τα μεγέθη δεδομένων είναι συντριπτικά (ακούμε για “κατακλυσμό δεδομένων”).

‘Ομως, τι είναι δεδομένα;

Στο σπίτι της γιαγιάς μου στην Ακρόπολη της Λευκωσίας, ο αδερφός μου και εγώ περάσαμε το μεγαλύτερο μέρος των παιδικών και εφηβικών μας καλοκαιριών διαβάζοντας τα λιγοστά βιβλία και συμμετέχοντας στη τη ζωή της οικογένειάς μας. Η γιαγιά μου, η Κύρια Αναστασία όπως την έλεγε με σεβασμό ο μανάβης της γειτονιάς, μας ετοίμαζε τραχανά, σιεφταλιά και μαχαλλεπί ενώ εμείς παίζαμε στον ηλιακό ή και τσακωνόμασταν για το ποιος θα πρωτοκαθήσει στις θρυλικές κουνιστές καρέκλες. Δεν υπήρχε στη ζωή μας η έννοια των υπολογιστών ή διαδικτύου. Αν χρειαζόμασταν πληροφορίες, ανοίγαμε ένα βιβλίο ή ρωτούσαμε άλλους ανθρώπους.

Μέσα από την αναζήτηση στον παγκόσμιο ιστό, σήμερα μπορούμε να κάνουμε την ερώτησή μας σαν να ρωτάμε κάποιον άνθρωπο αλλά στην ουσία ρωτάμε όλο τον κόσμο. Αν κάποιος στον κόσμο έχει σκεφτεί να παράσχει την απάντηση θα το βρούμε. Διάσημοι σεφ έχουν τις συνταγές τους διαθέσιμες στο διαδίκτυο. Οι αεροπορικές εταιρείες έχουν λεπτομερή χρονοδιαγράμματα στα χέρια μας, ενώ τα καταστήματα διαθέτουν όλα τα προϊόντα τους για αγορά και παράδοση στην πόρτα μας.

Επομένως, τα δεδομένα είναι πληροφορία.

Όταν έψαχνα για δουλειά το 1995, ο διαδικτυακός ιστός έκανε τα πρώτα του βήματα στην Ευρώπη. Ωστόσο, οι πληροφορίες ήταν ακόμα δύσκολο να βρεθούν, καθώς το περιεχόμενο του ιστού δεν ήταν τόσο πλούσιο όσο είναι σήμερα. Σήμερα έχουμε περισσότερα δεδομένα διαθέσιμα και μπορούμε ασφαλώς να λάβουμε περισσότερες πληροφορίες, αλλά είναι αρκετή η απλή αναζήτηση; Ρωτήστε μια ερώτηση που κανείς άλλος δεν σκέφτηκε να ρωτήσει: Π.χ. Οι ηθοποιοί του Χόλιγουντ που υποστηρίζουν ο Ομπάμα; Ή, είναι το αστέρι που είδα με το τηλεσκόπιο χθες το βράδυ το ίδιο με αυτό που είδα την περασμένη εβδομάδα; Ή, ποια πανεπιστήμια των ΗΠΑ ενθαρρύνουν τις γυναίκες να σπουδάσουν την επιστήμη των υπολογιστών;

Για να λάβουμε μια απάντηση για αυτές τις ερωτήσεις, πρέπει να ανακτήσουμε τα επιμέρους δεδομένα που χρειαζόμαστε και στη συνέχεια να τα συνδυάσουμε χειροκίνητα. Για παράδειγμα, για να βρούμε τους οπαδούς του Ομπάμα που είναι ηθοποιοί του Χόλιγουντ, πρέπει να βρούμε μια λίστα με τους ηθοποιούς του Χόλιγουντ και μια άλλη με τους υποστηρικτών του Ομπάμα και να βρούμε τα κοινά ονόματα αυτών των δύο λιστών. Ο,τιδήποτε δεν αποθηκεύεται ρητά ως δεδομένo χρειάζεται περαιτέρω εργασία για να παραχθεί­ — η τακτική αναζήτηση δεν μπορεί να το προσφέρει αυτό. Για το συνδυασμό και το φιλτράρισμα δεδομένων σε απαντήσεις χρησιμοποιούμε συστήματα διαχείρισης δεδομένων. Αυτά τα συστήματα λογισμικού υλοποιούν διάφορα εργαλεία φιλτραρίσματος, τα οποία στη συνέχεια συνδυάζονται μεταξύ τους μέσω μιας διαδικασίας βελτιστοποίησης, προκειμένου να απαντήσουν στις όποιες ερωτήσεις.

Το λογισμικό διαχείρισης δεδομένων υποστηρίζει σήμερα τις αποφάσεις σε όλες τις σημερινές επιχειρήσεις. Διαβάζει όλα τα δεδομένα που έχουν συγκεντρωθεί εγκαίρως και έτσι προετοιμάζεται να απαντήσει σε όλες τις πιθανές ερωτήσεις. Η γνώση που παράγεται από την απάντηση στις ερωτήσεις οδηγεί στις αποφάσεις για τη σωστή λειτουργία της επιχείρισης. Έτσι λειτουργεί και η επιστήμη: εμείς προετοιμάζουμε όλα τα δεδομένα από παρατηρήσεις (π.χ., στην αστρονομία) και την προσομοίωση (π.χ. για πρόβλεψη σεισμών) και στη συνέχεια οι επιστήμονες θέτουν ερωτήσεις που συνδυάζουν όλα αυτά τα δεδομένα, αποδεικνύοντας ή διαψεύοντας υποθέσεις, και ανακαλύπτουν νέες επιστημονικές αλήθειες.

Ως εκ τούτου, οι πληροφορίες είναι η γνώση που προέρχεται από την επεξεργασία των δεδομένων μας. Αλλά, τι είναι τα δεδομένα;

Τα δεδομένα είναι οτιδήποτε μπορούμε να αποθηκεύσουμε και να επεξεργαστούμε αργότερα για να παράγουμε πληροφορία.

Στο δεύτερο έτος του διδακτορικού μου στο UW-Madison, δημοσίευσα μια μελέτη που έριξε την προσοχή του αείμνηστου Jim Gray, που είναι το πιο μεγάλο όνομα σε διαχείριση δεδομένων μέχρι σήμερα (μεταξύ άλλων καινοτομιών του, όρισε τις συναλλαγές όπως τις γνωρίζουμε από τις τραπεζικές διεργασίες ή τα ψώνια μας). Εργάστηκα δίπλα του κατά τη διάρκεια ενός κρύου καλοκαιριού στο Σαν Φρανσίσκο το 1999 (αν και, μετά από τρία χρόνια στο Ουισκόνσιν, δεν ήταν ο πιο κρύος χειμώνας που είχα περάσει ποτέ – συγγνώμη, Mark Twain). Βοηθήσαμε τους αστρονόμους από την Sloan Digital Sky Survey να οργανώσουν τα δεδομένα τους στο σύστημα βάσης δεδομένων του Microsoft SQL Server και στη συνέχεια να χρησιμοποιήσουν τη γλώσσα προγραμματισμού του συστήματος για να θέσουν ερωτήσεις όπως “βρες τους ταχύτερους γαλαξίες στους τελευταίους έξι μήνες”. Το τηλεσκόπιο SDSS σαρώνει τον ουρανό και αποθηκεύει πληροφορία για εκατομμύρια αντικείμενα σε βάσεις δεδομένων. Πάνω από δέκα χρόνια αργότερα, το νέο Μεγάλο Συσκοπευτικό Τηλεσκόπιο (LSST) ερευνά τα βάθη του ουρανού και ανιχνεύει πάνω από 100 δισεκατομμύρια αντικείμενα το χρόνο. Σε ένα χρόνο αυτό το τηλεσκόπιο παράγει 10 φορές περισσότερα αστρονομικά δεδομένα από ό,τι έχουμε μαζέψει στα τελευταία 400 χρόνια συνολικά. Πώς μπορούμε να τα αποθηκεύσουμε όλα αυτά;

Όταν ήρθα στην Ελβετία, επισκέφτηκα και συνεργάστηκα με επιστήμονες του Ευρωπαϊκού Οργανισμού Πυρηνικών Ερευνών (CERN). Παράγουν καθημερινά τεράστια ποσά δεδομένων χρησιμοποιώντας το μεγαλύτερο μικροσκόπιο στη Γη: τον Επιταχυντή Σωματιδίων (LHC). Ο LHC τρέχει με διασταυρώσεις δέσμης πρωτονίων-πρωτονίων καταγράφοντας σαράντα εκατομμύρια συμβάντα ανά δευτερόλεπτο. Αυτά μειώνονται σε περίπου 500 συμβάντα ανά δευτερόλεπτο τα οποία αποθηκεύονται “μόνιμα” και επεξεργάζονται πλήρως για περαιτέρω ανάλυση. Φυσικά, το φιλτράρισμα γίνεται προσεκτικά ώστε να μην πεταχτούν χρήσιμα δεδομένα – αλλά ποιος ξέρει τι μπορεί να αποδειχθεί χρήσιμο στο μέλλον; Θα ήταν λοιπόν επιθυμητό να μπορούσαμε να κρατήσουμε περισσότερες πληροφορίες.

Το πρόβλημα είναι πανταχού παρόν: δεν μπορούμε να αποθηκεύσουμε όλα τα δεδομένα που παράγουμε. Επιπλέον, οι επιχειρήσεις σήμερα χρησιμοποιούν μόνο το 10-12% όλων των δεδομένων που συλλέγουν και διατηρούν. Πετάμε τα δεδομένα, επειδή δεν διαθέτουμε τους πόρους που απαιτούνται για να τα αποθηκεύσουμε όλα και επενδύουμε στην αποθήκευση δεδομένων που όμως δεν θα χρησιμοποιήσουμε ποτέ γιατί η τεχνολογία που έχουμε δεν είναι αρκετά αποτελεσματική: τα συστήματα διαχείρισης δεδομένων μας βασίζονται στην επένδυση σε όλα τα δεδομένα, ενδιαφέροντα ή όχι, και στην πρόβλεψη των ερωτήσεων, ώστε να προετοιμάσουμε τα εργαλεία επεξεργασίας — και τα δύο είναι αδύνατα σήμερα. Παρόλο που τα δεδομένα μπορεί να είναι προβλέψιμα καθώς παράγονται από μηχανές, είναι πάρα πολλά για να ξέρουμε ποια θα είναι χρήσιμα και για ποια όχι. Ακόμα χειρότερα, δεν μπορούμε να γνωρίζουμε ποιες ερωτήσεις θα θέσουν οι ερευνητές, καθώς οι πιθανές ερωτήσεις είναι ατελείωτες και το ανθρώπινο μυαλό είναι απρόβλεπτο. Ως αποτέλεσμα, τα εργαλεία διαχείρισης δεδομένων είναι πραγματικά δύσκολο να χρησιμοποιηθούν με τις τεράστιες ποσότητες δεδομένων σήμερα: δημιουργήσαμε δοξασμένες μηχανές αναζήτησης.

Στα 20 χρόνια που εργάζομαι ως καθηγήτρια διαχείρισης δεδομένων, είχα λαμπρούς φοιτητές και επιστημονικούς συνεργάτες. Μαζί, χτίζουμε τεχνολογίες για την προσαρμογή των συστημάτων διαχείρισης δεδομένων σε νέες υπολογιστικές πλατφόρμες και για απαιτητικές επιστημονικές εφαρμογές. Από το 2010, έχουμε εφεύρει ένα νέο μοντέλο διαχείρισης δεδομένων το οποίο σηματοδοτεί τη νέα γενιά συστημάτων. Τα νέα συστήματά μας δεν χρειάζονται καμία γνώση δεδομένων – επομένως, δεν διατίθενται πόροι για την προετοιμασία τους για ερωτήσεις. Αντί να κατασκευάζουμε εργαλεία και να φορτώνουμε τα δεδομένα σε βάσεις από πριν, ορίζουμε μαθηματικά τα δεδομένα και τις λειτουργίες αλλά δεν υπολογίζουμε τίποτα. Μόνο όταν έρθουν οι ερωτήσεις, αντλούμε τα απαραίτητα δεδομένα και ταυτόχρονα παράγουμε αυτόματα το λογισμικό που απαιτείται για την παραγωγή απαντήσεων. Η τεχνολογία μας βασίζεται σε λεπτομερή μαθηματική μοντελοποίηση των δεδομένων, η οποία δεν χρησιμοποιεί καθόλου πόρους και τεχνολογία παραγωγής κώδικα, και επιτρέπει τη δημιουργία των εργαλείων μόνο όταν γνωρίζουμε τι πρέπει να γίνει. Το αποτέλεσμα είναι εξαιρετικά γρήγορη και φθηνή επεξεργασία δεδομένων χωρίς να σπαταλάμε υπολογιστικούς και χωρικούς πόρους.

Άρα, τα δεδομένα είναι οτιδήποτε μπορεί να οριστεί μαθηματικά.

Όταν ήμουν 27 ετών, ήθελα να αλλάξω τη ζωή μου. Σκεφτόμουν να πάω στις ΗΠΑ για διδακτορικό (αν και δεν ήξερα ακριβώς τι είναι το διδακτορικό), αλλά ήξερα ότι θα χρειαστούν αρκετά χρόνια – εκείνες τις μέρες, στα 27 δεν λεγόμουν ακριβώς “νέα”. Σε αυτό το σημαντικό σταυροδρόμι της ζωής μου, κάλεσα την νούννα μου, μια εκπληκτική γυναίκα που αναγκάστηκε να εγκαταλείψει το όνειρό της για διδακτορικό για να μεγαλώσει μια οικογένεια. Το επεδίωξε όμως – με επιτυχία – είκοσι χρόνια αργότερα. Μου είπε να φύγω αμέσως για την Αμερική και να κάνω το διδακτορικό μου. Της είπα, “ναι, αλλά όταν θα τελειώσω θα είμαι τριάντα δύο χρονών!” Και απάντησε: “Αγαπητή μου, αυτό θα συμβεί ούτως ή άλλως, και είναι στο χέρι σου γίνεις τριάντα δύο χρόνων με διδακτορικό ή χωρίς διδακτορικό”. Η οικογένειά μου με έστειλε στις ΗΠΑ με εισιτήριο μιας κατεύθυνσης και την αγάπη τους, και αυτή την αγάπη την έχω πάντα μαζί μου.

Είμαι ευγνώμων στους πολλούς ανθρώπους στη ζωή μου που με βοήθησαν να κυνηγήσω τα τρελά μου όνειρα, στην Κύπρο όπου γεννήθηκα και στην Ελλάδα όπου μεγάλωσα, και στο Ίδρυμα Νέμιτσας για την υποστήριξη και για την τιμή που μου κάνετε σήμερα δίνοντάς μου αυτό το βραβείο. Σας ευχαριστώ, από τα βάθη της καρδιάς μου.