Ιστορικά μηνύματα και έγγραφα που παραμένουν ακατανόητα εξαιτίας περίπλοκων κωδίκων βρίσκονται κρυμμένα σε βιβλιοθήκες και αρχεία σε ολόκληρο τον κόσμο. Σήμερα, η τεχνητή νοημοσύνη δίνει στους ιστορικούς τη δυνατότητα να «σπάσουν» αυτούς τους μυστηριώδεις κώδικες και να αποκαλύψουν χαμένα μυστικά του παρελθόντος.
Βαθιά στα αρχεία της Βιβλιοθήκης του Βατικανού, ένα μυστηριώδες χειρόγραφο βιβλίο, γραμμένο με παράξενα σύμβολα, παρέμενε αδιάβαστο για περισσότερα από 400 χρόνια. Οι κρυπτικές του σελίδες φαίνεται πως έκρυβαν μυστικές θεραπείες «για παθήσεις του ανθρώπινου σώματος», σύμφωνα με ορισμένες φράσεις που ήταν χαραγμένες στο εσωτερικό του εξωφύλλου. Την εποχή εκείνη, τέτοιες θεραπευτικές πρακτικές κρατούνταν μυστικές, καθώς μπορούσαν να προκαλέσουν υποψίες ή ακόμη και κατηγορίες για μαγεία.
Το χειρόγραφο είναι γνωστό ως «Κώδικας Μποργκ» και αποτελείται από 408 σελίδες, οι οποίες είναι σχεδόν ακατανόητες, σύμφωνα με το BBC. Το κείμενο είχε κωδικοποιηθεί χρησιμοποιώντας 34 άγνωστα σύμβολα, μαζί με λίγα λατινικά γράμματα και μια πρώτη σελίδα γραμμένη στα αραβικά. Δεν υπήρχε κανένα γνωστό «κλειδί» που να αποκαλύπτει το κρυπτογραφημένο περιεχόμενο, ενώ αρκετές σελίδες είχαν υποστεί φθορές λόγω ηλικίας, γεγονός που έκανε την αποκρυπτογράφηση ακόμη πιο δύσκολη.
Με τη βοήθεια της μηχανικής μάθησης, μιας μορφής τεχνητής νοημοσύνης, οι ερευνητές κατάφεραν τελικά να αποκωδικοποιήσουν το χειρόγραφο. Ανακάλυψαν ότι το κείμενο περιείχε χιλιάδες παράξενες θεραπείες, όπως η κατανάλωση αρκετών ποτηριών ποιοτικού κόκκινου κρασιού ή η ζύμωση μοσχοκάρυδου μέσα σε ζύμη για την αντιμετώπιση της δυσεντερίας.
Η Μπεάτα Μεγκιέζι, καθηγήτρια Υπολογιστικής Γλωσσολογίας στο πανεπιστήμιο της Στοκχόλμης στη Σουηδία και μέλος της ομάδας που αποκωδικοποίησε το κείμενο, περιέγραψε τη διαδικασία ως μια μορφή ντετεκτιβικής έρευνας, όπου κάθε σύμβολο, μοτίβο και μερική λύση μπορεί να φέρει τους ερευνητές πιο κοντά σε χαμένα μυστικά και σε έναν ξεχασμένο ιστορικό κόσμο. Όπως εξήγησε, ακόμη και με τη βοήθεια της τεχνητής νοημοσύνης, η αποκρυπτογράφηση ήταν εξαιρετικά επίπονη.
Σήμερα, η Μεγκιέζι και οι συνεργάτες της ηγούνται προσπαθειών που αξιοποιούν την ισχύ της AI για την αποκωδικοποίηση ιστορικών κρυπτογραφημένων κειμένων, με στόχο να αποκαλυφθούν τεράστιοι όγκοι πληροφοριών από το παρελθόν που μέχρι σήμερα θεωρούνταν αδύνατο να διαβαστούν.
Σύμφωνα με ορισμένες εκτιμήσεις, περίπου το 1% του υλικού που βρίσκεται σε αρχεία και βιβλιοθήκες ανά τον κόσμο είναι πλήρως ή μερικώς κρυπτογραφημένο. Μερικοί από τους αρχαιότερους γνωστούς κώδικες χρονολογούνται από την Αρχαία Ελλάδα και τη Ρώμη.
Κρυμμένα μυστικά, ψεύτικα σύμβολα και άγνωστες γλώσσες
Τα κρυπτογραφημένα ιστορικά έγγραφα κρύβουν διπλωματικές πληροφορίες, τελετουργίες μυστικών εταιρειών, ιατρικές γνώσεις, ερωτικές σχέσεις αλλά και καθημερινές λεπτομέρειες που οι άνθρωποι επιθυμούσαν να κρατήσουν μυστικές. Πρόκειται για πληροφορίες που απουσιάζουν σήμερα από τις ιστορικές αφηγήσεις. Σε ορισμένες περιπτώσεις, η αποκωδικοποίηση τέτοιων εγγράφων μπορεί να αλλάξει όσα γνωρίζουμε για σημαντικά ιστορικά πρόσωπα ή ακόμη και για ολόκληρες ιστορικές περιόδους.
Ένα πρόσφατο παράδειγμα ήταν μια συλλογή κωδικοποιημένων επιστολών που αποδείχθηκε ότι είχαν γραφτεί από τη Μαρία, Βασίλισσα της Σκωτίας, κατά τη μακρά φυλάκισή της στην Αγγλία. Οι επιστολές αποκάλυψαν τη συμμετοχή της σε σχέδια για την ανάκτηση του θρόνου της, καθώς και τη δύσκολη σχέση της με τον γιο της, Ιάκωβο ΣΤ΄ της Σκωτίας, μετέπειτα βασιλιά Ιάκωβο Α΄ της Αγγλίας.
Ορισμένοι ιστορικοί κώδικες είναι σχετικά απλοί. Ο Κώδικας Μποργκ, για παράδειγμα, χρησιμοποιεί μια μέθοδο αντικατάστασης, όπου κάθε σύμβολο αντιστοιχεί σε ένα λατινικό γράμμα. Άλλοι, όμως, είναι πολύ πιο περίπλοκοι. Σε κάποιες περιπτώσεις, οι ερευνητές δεν γνωρίζουν καν ποια ήταν η αρχική γλώσσα του κειμένου. Συχνά προστίθενται άχρηστα σύμβολα ως παραπλανητικά στοιχεία, ενώ σε άλλες περιπτώσεις πολλά διαφορετικά σύμβολα μπορεί να αντιπροσωπεύουν το ίδιο γράμμα.
Η διαδικασία αυτή απαιτεί τεράστιο όγκο εργασίας και συνεχείς δοκιμές. Η Σεσίλ Πιερό, κρυπτολόγος στο Γαλλικό Εθνικό Ινστιτούτο Έρευνας στην Πληροφορική και την Αυτοματοποίηση στη Νανσί της Γαλλίας, και οι συνεργάτες της χρειάστηκαν έξι μήνες για να αποκωδικοποιήσουν σταδιακά μια επιστολή 500 ετών του Καρόλου Ε΄, αυτοκράτορα της Αγίας Ρωμαϊκής Αυτοκρατορίας και βασιλιά της Ισπανίας. Η επιστολή είχε γραφτεί χρησιμοποιώντας 120 διαφορετικά κρυπτογραφικά σύμβολα σε μόλις τρεις σελίδες.
Η αποκρυπτογραφημένη επιστολή αποκάλυψε ότι ο Κάρολος Ε΄, ένας από τους ισχυρότερους άνδρες της εποχής του, ζούσε υπό τον φόβο μιας συνωμοσίας δολοφονίας εναντίον του. Ο βασιλιάς φοβόταν ότι ένας Ιταλός μισθοφόρος πολέμαρχος, που υπηρετούσε τον βασιλιά της Γαλλίας Φραγκίσκο Α΄, σχεδίαζε να τον δολοφονήσει.
Πριν ακόμη ξεκινήσει η αποκρυπτογράφηση, οι ερευνητές πρέπει να μετατρέψουν το χειρόγραφο σε ψηφιακή μορφή, ώστε να μπορέσει να αναλυθεί από ειδικό λογισμικό. Η κακή γραφή και η φθορά του μελανιού κάνουν αυτή τη διαδικασία ιδιαίτερα δύσκολη. Η Πιερό εξήγησε ότι συνήθως χρειάζεται μία ολόκληρη ημέρα μόνο για να μεταγράψει μια δισέλιδη επιστολή με άγνωστα σύμβολα.
Η τεχνητή νοημοσύνη επιταχύνει την αποκρυπτογράφηση
Η τεχνητή νοημοσύνη αρχίζει πλέον να επιταχύνει σημαντικά αυτή τη διαδικασία. Η Μισέλ Βάλντισπιουλ, καθηγήτρια Γερμανικής Γλωσσολογίας στο πανεπιστήμιο του Όσλο στη Νορβηγία, και οι συνεργάτες της χρησιμοποίησαν πρόσφατα μια διαδικτυακή πλατφόρμα AI με την ονομασία «Transkribus» για να μεταγράψουν μια μυστική επιστολή που είχε γράψει ο ευγενής Σιγκισμούντ Χόισνερ φον Βάντερσλεμπεν προς τον Σουηδό Μέγα Καγκελάριο Άξελ Όξενστιερνα το 1637, στο αποκορύφωμα του Τριακονταετούς Πολέμου.
Το εργαλείο έχει εκπαιδευτεί σε πολλές γλώσσες, γραφές και στυλ χειρογράφων που καλύπτουν αρκετούς αιώνες. Αφού ανέβει στο σύστημα η εικόνα ενός εγγράφου, η AI εντοπίζει τα μπλοκ κειμένου και τις γραμμές, προτού σαρώσει το κείμενο χαρακτήρα προς χαρακτήρα και το μετατρέψει σε ψηφιακή μορφή.
Παρότι χρειάστηκαν ορισμένες χειροκίνητες διορθώσεις, το εργαλείο λειτούργησε αρκετά καλά στην περίπτωση της επιστολής του φον Βάντερσλεμπεν, επειδή το κείμενο ήταν μόνο μερικώς κρυπτογραφημένο με αριθμούς χωρισμένους με τελείες και γραμμένους με καθαρά κενά μεταξύ τους. Άλλα τμήματα δεν ήταν κωδικοποιημένα και είχαν γραφτεί σε γερμανική γραφή του 17ου αιώνα.
Ωστόσο, οι υπάρχουσες πλατφόρμες AI δυσκολεύονται συχνά όταν τα χειρόγραφα περιέχουν ασυνήθιστους χαρακτήρες, όπως επινοημένα σύμβολα, αστρολογικά σημάδια ή αριθμούς γραμμένους με ανορθόδοξο τρόπο. Για τον λόγο αυτό, η Μεγκιέζι, η Βάλντισπιουλ και οι συνεργάτες τους αναπτύσσουν το δικό τους εργαλείο τεχνητής νοημοσύνης στο πλαίσιο του διεθνούς προγράμματος «Descrypt», με στόχο τη μετατροπή ιστορικών χειρογράφων με άγνωστα σύμβολα σε αναγνώσιμα ψηφιακά έγγραφα.
Αφού μεταγραφεί ένα μυστικό έγγραφο, ξεκινά η πραγματική αποκρυπτογράφηση. Σήμερα, οι κρυπτολόγοι χρησιμοποιούν ειδικά σχεδιασμένο λογισμικό που αξιοποιεί αλγορίθμους για να εντοπίσει ποιο είδος κώδικα χρησιμοποιήθηκε και να τον «σπάσει». Οι απλοί κώδικες συχνά αποκρυπτογραφούνται μέσω της ανάλυσης της συχνότητας εμφάνισης των συμβόλων και της αντιστοίχισής τους με γράμματα που εμφανίζονται με την ίδια συχνότητα σε μια γλώσσα.
Στα αγγλικά, για παράδειγμα, το γράμμα Ε εμφανίζεται συχνότερα, ενώ τα Ζ, Q και Χ είναι από τα πιο σπάνια. Στην επιστολή του φον Βάντερσλεμπεν από τα μέτωπα του Τριακονταετούς Πολέμου, χρησιμοποιούνταν έως και οκτώ διαφορετικά σύμβολα για το γράμμα Ε. Αυτό σήμαινε ότι χρειάστηκαν συνεχείς δοκιμές και η γνώση παλαιών γερμανικών της Βάλντισπιουλ για να αποκαλυφθεί σταδιακά ο κώδικας.
Πίσω από την κρυπτογράφηση κρύβονταν προειδοποιήσεις του φον Βάντερσλεμπεν σχετικά με την απειλή που αποτελούσαν παρατάξεις των προτεσταντών συμμάχων της Σουηδίας στον πόλεμο. Στην επιστολή ανέφερε ότι είχε αναγκαστεί να πραγματοποιήσει στρατηγικές υποχωρήσεις, αφού ενημερώθηκε για συνωμοσία μεταξύ συμμάχων του, συμπεριλαμβανομένου του λόρδου Φραντς Χάινριχ της Σαξονίας.
Η AI και οι «άλυτοι» ιστορικοί κώδικες
Η ομάδα της Μεγκιέζι εξετάζει πλέον πώς η τεχνητή νοημοσύνη θα μπορούσε να παρακάμψει πλήρως το στάδιο της μεταγραφής, αναλύοντας απευθείας φωτογραφίες σελίδων για να αποκρυπτογραφεί μυστικά μηνύματα. Οι ερευνητές δοκίμασαν πρόσφατα το σύστημα σε ένα χειρόγραφο 105 σελίδων που είχαν ήδη αποκωδικοποιήσει, γνωστό ως «Κώδικας Κοπιάλε», το οποίο περιγράφει τα τελετουργικά, τους κανόνες και τις ιδέες μιας γερμανικής μυστικής εταιρείας του 18ου αιώνα.
Εκπαιδεύοντας την AI πρώτα σε γενικά δείγματα γραφής και στη συνέχεια σε εικόνες συγκεκριμένων γραμμών του κώδικα μαζί με το αντίστοιχο αποκρυπτογραφημένο γερμανικό κείμενο, το σύστημα κατάφερε να αποκωδικοποιήσει με ακρίβεια τμήματα που δεν είχε «δει» προηγουμένως.
Η μέθοδος αυτή θα μπορούσε να αποδειχθεί ιδιαίτερα χρήσιμη σε περιπτώσεις όπου η γλώσσα ενός κώδικα είναι άγνωστη. Όπως δήλωσε η Μεγκιέζι, ο απώτερος στόχος είναι να συνδυαστούν η μεταγραφή και η αποκρυπτογράφηση σε ένα και μόνο βήμα.
Η Βάλντισπιουλ και οι συνεργάτες της αναζητούν παράλληλα παλαιά κρυπτογραφημένα κείμενα σε ιστορικά αρχεία, προκειμένου να δημιουργήσουν μια βάση δεδομένων που θα επιτρέψει τη συλλογή επαρκών στοιχείων για την εκπαίδευση AI ικανής να «σπάει» κώδικες. Μεταξύ των ευρημάτων τους βρίσκονται 400 μυστηριώδεις καρτ ποστάλ γραμμένες με κρυπτογραφική γραφή από τα τέλη του 18ου έως τις αρχές του 19ου αιώνα. Τα λίγα αποσπάσματα που έχουν αποκωδικοποιηθεί μέχρι στιγμής δείχνουν ότι ορισμένες από αυτές ήταν ερωτικές επιστολές στα γερμανικά.
Η ομάδα της Μεγκιέζι έχει επίσης δημιουργήσει ένα εργαλείο τύπου chatbot που συνδυάζει μεταγραφή και αποκρυπτογράφηση σε ένα βήμα. Το σύστημα αξιοποιεί αλγορίθμους αποκρυπτογράφησης εκπαιδευμένους σε ζεύγη κρυπτογραφικών χαρακτήρων και του κειμένου που αντιπροσωπεύουν, ενώ παράλληλα χρησιμοποιεί μεγάλα γλωσσικά μοντέλα εκπαιδευμένα σε ιστορικά κείμενα διαφορετικών περιόδων για να προσφέρει ενδείξεις σχετικά με έναν κώδικα.
Το εργαλείο ενσωματώνει επίσης αλγορίθμους αναγνώρισης εικόνας που έχουν εκπαιδευτεί σε σχολιασμένα χειρόγραφα, ενώ μπορεί να βελτιώνεται συνεχώς μέσω διορθώσεων από ειδικούς που το χρησιμοποιούν.
Στόχος είναι τόσο οι ερευνητές όσο και το κοινό να μπορούν να δίνουν στο chatbot ένα ιστορικό κρυπτογραφημένο κείμενο και εκείνο να αποκαλύπτει το περιεχόμενό του.
Όταν οι ερευνητές δοκίμασαν το AI chatbot στον Κώδικα Μποργκ, διαπίστωσαν ότι μπορούσε να μεταφράσει και να αποκωδικοποιήσει ένα απόσπασμα 500 συμβόλων μέσα σε περίπου 29 λεπτά. Το σύστημα παρείχε ακόμη και αγγλική μετάφραση, ενώ κατέγραφε τη διαδικασία και εξηγούσε γιατί η λύση θεωρείται αξιόπιστη. Αυτό θεωρείται κρίσιμο ώστε να αποφεύγονται φαινόμενα όπου η τεχνητή νοημοσύνη «εφευρίσκει» ερμηνείες.
Η ομάδα δοκίμασε επίσης πρόσφατα το σύστημα σε δύο ακόμη κώδικες που είχαν αποκωδικοποιηθεί στο παρελθόν και οι οποίοι αντιπροσώπευαν διαφορετικές χρονικές περιόδους, γλώσσες και επίπεδα πολυπλοκότητας. Το εργαλείο κατάφερε να τους αποκρυπτογραφήσει γρήγορα, δείχνοντας ότι μπορεί να αντιμετωπίσει διαφορετικούς τύπους ιστορικών κρυπτογραφήσεων.
Σύμφωνα με τη Μεγκιέζι, η τεχνητή νοημοσύνη βοηθά κυρίως στην κλίμακα, την ταχύτητα, την αναγνώριση μοτίβων και τον συνδυασμό πολλών εργασιών ταυτόχρονα.
Τέτοια εργαλεία τεχνητής νοημοσύνης ενδέχεται να αποδειχθούν καθοριστικά για την αποκωδικοποίηση ιστορικών κωδίκων που μέχρι σήμερα παραμένουν άλυτοι. Παράλληλα, μπορούν να βοηθήσουν και στην κατανόηση αρχαίων κειμένων γραμμένων σε αλφάβητα που πλέον κανείς δεν μπορεί να διαβάσει.
Ο Δίσκος της Φαιστού από την Κρήτη, ηλικίας περίπου 4.000 ετών, παραμένει ακόμη ανεξιχνίαστος, όπως και η πρώιμη ελληνική γραφή «Γραμμική Β». Η Μεγκιέζι δήλωσε ότι αυτό που την ενθουσιάζει περισσότερο δεν είναι μόνο η πιθανότητα επίλυσης ενός συγκεκριμένου ιστορικού γρίφου, αλλά η δημιουργία μεθόδων που θα μπορούν να βοηθήσουν ερευνητές σε πολλές διαφορετικές περιπτώσεις.

Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου
ΤΑ ΣΧΟΛΙΑ ΑΝΑΡΤΩΝΤΑΙ ME ΜΙΚΡΗ ΚΑΘΥΣΤΕΡΗΣΗ ΚΑΙ ΚΑΤΟΠΙΝ ΕΛΕΓΧΟΥ