ΗΦΑΙΣΤΟΣ : ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Σε αναζήτηση αντικαταστάτη του «ελέγχου Τούρινγκ»

7 Μαΐ 2017

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Σε αναζήτηση αντικαταστάτη του «ελέγχου Τούρινγκ»

Το 1950, ο Αλαν Τούρινγκ διατύπωσε ένα νοητικό πείραμα, που από τότε θεωρείται ως ο τελικός έλεγχος, το υπέρτατο τεστ για την τεχνητή νοημοσύνη. Το αποκάλεσε «παιχνίδι μίμησης», αλλά οι περισσότεροι το γνωρίζουν ως τεστ Τούρινγκ. Προβλέποντας αυτά που σήμερα ονομάζουμε chat bots - προγράμματα ηλεκτρονικών υπολογιστών που εμφανίζονται στο διαδίκτυο ως άνθρωποι - ο Τούρινγκ φαντάστηκε ένα διαγωνισμό, στον οποίο μια μηχανή προσπαθεί να εξαπατήσει τον άνθρωπο που συνδιαλέγεται μαζί της (απομακρυσμένα μέσω υπολογιστή), ότι τάχα είναι και αυτή άνθρωπος, απαντώντας σε ερωτήσεις για την ποίηση, ή κάνοντας επίτηδες λάθος σε αριθμητικές πράξεις. Σήμερα, ο έλεγχος Τούρινγκ είναι το μέτρο για το αν ένα λογισμικό εμφανίζει (τεχνητή) νοημοσύνη, που δεν μπορεί να ξεχωρίσει κανείς από τη φυσική νοημοσύνη. Ομως, ήδη υπάρχουν μηχανές που μπορούν να ξεγελάσουν τους ανθρώπους, έστω για μικρά χρονικά διαστήματα και απ' την άλλη μεριά είναι εμφανές ότι δεν πρόκειται για συστήματα τεχνητής νοημοσύνης. Γι' αυτό αρκετοί επιστήμονες θεωρούν ότι πρέπει να αλλάξει το κριτήριο που σκέφτηκε ο Τούρινγκ.

Ευγένιος

Το πρόβλημα είναι ότι το τεστ Τούρινγκ μπορεί να ξεγελαστεί εύκολα. Κάποιος (υπολογιστής) μπορεί να το περάσει, αποφεύγοντας να δώσει απαντήσεις ή προσποιούμενος άγνοια. Οπως και ο ίδιος ο Τούρινγκ πρόβλεψε εν μέρει, το κόλπο για να περάσεις το τεστ του δεν είναι να απαντήσεις σωστά τις ερωτήσεις, αλλά κυρίως να μην απαντήσεις στις ερωτήσεις, υπεκφεύγοντας.
Το 2014, ένα chat bot, που εμφανιζόταν στο διαδίκτυο ως Ευγένιος Γκούστμαν, υποτίθεται ότι πέρασε το τεστ Τούρινγκ, προσποιούμενο ότι ήταν ένα σαρκαστικό 13χρονο από την Οδησσό, που ποτέ δεν απαντούσε ευθέως στις ερωτήσεις. Μερικοί κριτές ξεγελάστηκαν (περίπου το ένα τρίτο, ποσοστό ικανό για να θεωρηθεί σχεδόν νίκη). Βέβαια, οι κριτές είχαν στη διάθεσή τους μόλις μερικά λεπτά για να κάνουν ερωτήσεις. Αν είχαν περισσότερο χρόνο θα είχαν καταλάβει την απάτη. Ο Ευγένιος δεν ήξερε και δεν καταλάβαινε στην πραγματικότητα σχεδόν τίποτα.
Οποιοσδήποτε έχει προσπαθήσει να προγραμματίσει έναν υπολογιστή, ώστε να καταλαβαίνει μία ανθρώπινη γλώσσα, έχει γρήγορα συνειδητοποιήσει ότι σχεδόν κάθε πρόταση εμπεριέχει διφορούμενα στοιχεία και μερικές φορές περισσότερα από ένα. Ο εγκέφαλός μας είναι τόσο καλός στο να καταλαβαίνει τη γλώσσα, που συνήθως δεν το παρατηρούμε. Για παράδειγμα η πρόταση: «Το κουτί διαπέρασε το τραπέζι επειδή ήταν φτιαγμένο από πολυουρεθάνη» περιέχει την ασάφεια ως προς τι είναι φτιαγμένο από πολυουρεθάνη: το τραπέζι ή το κουτί; Οποιοσδήποτε άνθρωπος θα καταλάβει ότι αναφορά γίνεται στο τραπέζι, αλλά αυτό απαιτεί συνδυασμό γνώσεων της επιστήμης των υλικών (ή την απλή αντίληψη για τη σκληρότητα και ανθεκτικότητα κάθε υλικού που έχει οποιοσδήποτε άνθρωπος) και καλής κατανόησης της γλώσσας. Αυτός ο συνδυασμός προς το παρόν δεν είναι εφικτός από τις μηχανές.

Κοινή λογική

Αρκετοί επιστήμονες προσπαθούν να σχεδιάσουν έναν νέο έλεγχο, ένα τεστ Τούρινγκ του 21ου αιώνα. Ενα απ' αυτά είναι το «σχήμα Βίνογκραντ» (από το όνομα του πρωτοπόρου της τεχνητής νοημοσύνης Τέρι Βίνογκραντ), μια απλή αλλά διατυπωμένη με ασάφεια ερώτηση. Η απάντηση σε αυτήν την ερώτηση απαιτεί «κοινή λογική», σχετικά με τον τρόπο που οι διάφοροι δρώντες παράγοντες, τα αντικείμενα και τα πολιτιστικά στοιχεία αλληλοεπηρεάζονται στον πραγματικό κόσμο. Το σχήμα Βίνογκραντ μπορεί να διακρίνει την πραγματική κατανόηση από τις προσομοιώσεις της, εξασφαλίζει ότι δεν μπορεί να απαντηθεί με οποιαδήποτε αναζήτηση πληροφοριών στο διαδίκτυο, αλλά το διαθέσιμο φάσμα ερωτήσεων είναι σχετικά μικρό. Η δυσκολία του είναι μεγάλη, όπως απέδειξε και η δοκιμή 4 συστημάτων το 2016, στα οποία τέθηκε ένα σύνολο από 60 σχήματα Βίνογκραντ. Το σύστημα που κέρδισε απάντησε σωστά μόλις στο 58% των ερωτήσεων, πολύ κάτω από το 90%, που θεωρείται ...προβιβάσιμος βαθμός.
Ενα άλλο τεστ που προτείνεται προβλέπει την υποβολή των υποψήφιων συστημάτων τεχνητής νοημοσύνης στα ίδια γραπτά διαγωνίσματα που υποβάλλονται οι μαθητές στην πρωτοβάθμια και δευτεροβάθμια εκπαίδευση. Η μέθοδος αυτή ελέγχει την ικανότητα των μηχανών να συσχετίζουν γεγονότα με καινοτόμους τρόπους, μέσω της σημασιακής κατανόησης. Πλεονεκτεί ως προς το ότι υπάρχει πληθώρα έτοιμων τεστ, αλλά δεν είναι ασφαλής ως προς τις αναζητήσεις απαντήσεων στο διαδίκτυο. Είναι αρκετά δύσκολος έλεγχος, όπως έδειξε η βαθμολογία 7,5 με άριστα το 10, σε διαγώνισμα τετάρτης δημοτικού, ενός συστήματος με το όνομα «Αρίστο», του Ινστιτούτου Αλεν για την Τεχνητή Νοημοσύνη. Κανένα σύστημα δεν έχει πάρει πάνω από 6 σε διαγώνισμα της δευτέρας γυμνασίου.

Πολύπλευρος έλεγχος

Ενας τρίτος προτεινόμενος αντικαταστάτης του τεστ Τούρινγκ είναι η δοκιμή υποψήφιας τεχνητής νοημοσύνης που έχει ενσωματωθεί σε ρομπότ, ώστε να μπορεί να χειριστεί φυσικά αντικείμενα για να κατασκευάσει κάποιο αντικείμενο από μικρότερα δομικά στοιχεία, π.χ. να συναρμολογήσει ένα έπιπλο, να κατασκευάσει έναν τοίχο από τουβλάκια, ή ένα σπίτι κ.ο.κ. Ο έλεγχος αυτός ενσωματώνει διάφορες όψεις της νοημοσύνης και συγκεκριμένα την αντίληψη και την ικανότητα δράσης και είναι μάλλον ασφαλές από αναζητήσεις στο διαδίκτυο, καθώς δεν είναι αναρτημένες σ' αυτό οδηγίες συναρμολόγησης για οτιδήποτε μπορεί να φανταστεί κάποιος. Στα αρνητικά του, ότι είναι δύσκολο να πραγματοποιηθεί στην πράξη, ενώ η πραγματοποίησή του σε περιβάλλον εικονικής πραγματικότητας πάντα θα ενείχε τη δυνατότητα ενστάσεων ότι το περιβάλλον αυτό δεν εξομοιώνει 100% το φυσικό περιβάλλον με τις ενοχλητικές λεπτομέρειές του (π.χ. ριπές ανέμου, γλιστρήματα εργαλείων κ.τ.λ.).
Σύμφωνα με ένα τέταρτο εναλλακτικό τεστ, η τεχνητή νοημοσύνη καλείται να δώσει περίληψη των λεγομένων σε ένα ψηφιακό αρχείο ήχου, να διηγηθεί τι συμβαίνει στις σκηνές που περιλαμβάνει ένα ψηφιακό αρχείο βίντεο, να μεταφράσει τη φυσική γλώσσα σε πραγματικό χρόνο και να πραγματοποιήσει μια σειρά από άλλες εργασίες. Οι έλεγχοι αυτοί μπορούν να αυτοματοποιηθούν ώστε να γίνονται χωρίς ανθρώπινη παρέμβαση και χωρίς ανθρώπινη αξιολόγηση του αποτελέσματος, εξασφαλίζοντας αντικειμενικότητα. Ομως οι κριτές θα ήταν πολύ δύσκολο να επιβεβαιώσουν ότι οι αλγόριθμοι του τεστ έβαλαν σωστό βαθμό σε συστήματα τεχνητής νοημοσύνης, που λειτουργούν σαν «μαύρα κουτιά», χωρίς να είναι απολύτως σαφές πώς κατέληξαν στις συγκεκριμένες απαντήσεις.
Δεν είναι λίγοι οι επιστήμονες που θεωρούν ότι ένα μοναδικό τεστ δεν είναι αρκετό και ότι χρειάζονται πολλαπλοί έλεγχοι. Οπως δεν υπάρχει μόνο ένα τεστ για την αθλητική ικανότητα ενός ανθρώπου, έτσι δεν υπάρχει και μόνο ένα τεστ για την ανθρώπινη νοημοσύνη (που εκδηλώνεται με διαφορετικές μορφές), άρα και για την τεχνητή νοημοσύνη, που θέλει να περάσει ως φυσική νοημοσύνη, πρέπει να υπάρχει μια συστοιχία ελέγχων. Το ενδιαφέρον δεν είναι μόνο θεωρητικό, καθώς π.χ. ένα ρομπότ που θα περνούσε την «κατασκευαστική πρόκληση», θα μπορούσε να στήνει καταυλισμούς σε περιπτώσεις φυσικών καταστροφών, ή να οικοδομεί καταλύματα σε άλλους πλανήτες. Μια μηχανή που θα περνούσε τον έλεγχο του σχήματος Βίνογκραντ και ένα τεστ σχολικής βιολογίας, ίσως μπορούσε να ενσωματώσει όλη την τεράστια βιβλιογραφία της ιατρικής του ανθρώπου και να προτείνει νέες θεραπείες για τον καρκίνο ή να περιγράψει όλες τις πλευρές της λειτουργίας του εγκεφάλου, έστω κι αν δεν θα είχε ιδέα για το τι σημαίνει πραγματικά να έχεις καρκίνο ή για το τι σημαίνει να έχεις εγκέφαλο...

Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγή: Scientific American

ΗΦΑΙΣΤΟΣ

7 Μαΐ 2017

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Σε αναζήτηση αντικαταστάτη του «ελέγχου Τούρινγκ»

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

Τα εβδομήντα δύο χρόνια ενός καινούριου πολιτισμού

TOP READ

ΚΟΜΕΠ