21 Απρ 2018

Τι μπορούμε να μάθουμε από αυτοδίδακτα ρομπότ





Το ρομπότ iCub.
Το ρομπότ iCub.
Στην ταινία επιστημονικής φαντασίας «Chappie» του 2015, ένας μηχανικός θέλει να κατασκευάσει μια μηχανή, που να σκέφτεται και να νιώθει. Γράφει, λοιπόν, ένα πρόγραμμα Τεχνητής Νοημοσύνης (ΤΝ), που μαθαίνει, όπως μαθαίνουν τα παιδιά. Το ρομπότ στο οποίο ενσωματώνει την ΤΝ ξεκινά με σχεδόν κενή νοητική κατάσταση. Παρατηρώντας το περιβάλλον του και πειραματιζόμενο με αυτό, αποκτά γενικές γνώσεις, την ικανότητα ομιλίας και σύνθετες δεξιότητες. Η ταινία δεν είναι και τόσο ...φαντασίας, αν σκεφτεί κανείς ότι κάτι ανάλογο και με ανάλογη τεχνική προσπαθούν να πετύχουν πολλά εργαστήρια και εταιρείες στον κόσμο.
Στην πραγματικότητα, ήδη αρκετές μηχανές ξεπερνούν τις ικανότητες του ανθρώπου σε συγκεκριμένες δραστηριότητες, όπως το παίξιμο παιχνιδιών, σαν το Jeopardy, το σκάκι και το πολύπλοκο κινέζικο παιχνίδι Go. Τον περασμένο Οκτώβρη, η βρετανική εταιρεία «DeepMind» αποκάλυψε το σύστημα AlphaGo Zero, την πιο τελειοποιημένη εκδοχή ΤΝ για το παιχνίδι Go. Σε αντίθεση με τον προκάτοχό της, το AlphaGo, που είχε γίνει ο καλύτερος παίχτης μελετώντας τεράστιο αριθμό παρτίδων μεταξύ ανθρώπων, το AlphaGo Zero συγκέντρωσε την απαραίτητη εμπειρία αυτόνομα, παίζοντας με τον εαυτό του. Τουλάχιστον μέχρι τη μέρα της ανακοίνωσης της DeepMind, η νέα ΤΝ μπορούσε να αποκτήσει δεξιότητες μόνο σε αντικείμενα με ξεκάθαρους κανόνες, όπως τα παιχνίδια.
Αλληλεπίδραση με το περιβάλλον
Αντίθετα με τις έως τώρα ΤΝ, τα παιδιά των ανθρώπων από τη βρεφική ηλικία αναπτύσσονται νοητικά, εξερευνώντας το περιβάλλον τους και πειραματιζόμενα με την κίνηση και την ομιλία. Μαζεύουν δεδομένα από μόνα τους, προσαρμόζονται σε νέες καταστάσεις και εφαρμόζουν δεξιότητες που απέκτησαν σε κάποιον τομέα, οπουδήποτε αλλού μπορούν αυτές να βρουν εφαρμογή.
Από την αρχή του 21ου αιώνα, ρομποτιστές, νευροεπιστήμονες και ψυχολόγοι αναζητούν τρόπους για να κατασκευάσουν μηχανές που θα μιμούνται αυτήν την αυθόρμητη ανάπτυξη. Οι συνεργασίες τους έχουν οδηγήσει σε ανδροειδή, που μπορούν να μετακινήσουν αντικείμενα, να αποκτήσουν βασικές γλωσσικές και αριθμητικές ικανότητες, ακόμη και να δείξουν κάποια σημάδια κοινωνικής συμπεριφοράς. Κάποιοι ψυχολόγοι θεωρούν ότι μέσω των συστημάτων ΤΝ μπορούν να κατανοήσουν καλύτερα τον τρόπο που μαθαίνουν τα παιδιά. Είναι όμως γενικοί νόμοι της μάθησης αυτά τα χαρακτηριστικά που δείχνουν τα συγκεκριμένα συστήματα ΤΝ, ή είναι απλώς ιδιορρυθμίες των συστημάτων αυτών, ή ίσως προβολές προτύπων της ανθρώπινης μάθησης πάνω τους;
Ο εγκέφαλος του ανθρώπου προσπαθεί συνεχώς να προβλέψει το μέλλον και όταν διαπιστώνει αποκλίσεις, τροποποιεί τις προσδοκίες του για να ταιριάξουν με την πραγματικότητα. Σύμφωνα με νευροεπιστήμονες, τα υψηλότερου επιπέδου κέντρα επεξεργασίας στον εγκέφαλο τροποποιούν τα μοντέλα που αναπτύσσουν, με κριτήριο τα σήματα που λαμβάνουν από τα χαμηλότερου επιπέδου κέντρα επεξεργασίας των σημάτων αυτών. Ορισμένοι θεωρούν ότι υπάρχει και ανατροφοδότηση από τα ανώτερου στα κατώτερου επιπέδου κέντρα επεξεργασίας, με αποτέλεσμα να επηρεάζονται οι αισθήσεις, όπως συμβαίνει στις οφθαλμαπάτες.
Η αλληλεπίδραση των σημάτων προς τα πάνω με τα σήματα προς τα κάτω, δημιουργεί ένα λάθος πρόβλεψης: Τη διαφορά ανάμεσα σε αυτό που περιμένουμε και σε αυτό που πραγματικά βιώνουμε. Ενα σήμα μεταφέρει αυτήν τη διαφορά στα ανώτερα κέντρα επεξεργασίας, ώστε να διορθώσουν την πρόβλεψή τους και ο ατέρμονος κύκλος συνεχίζεται, ελαχιστοποιώντας τη διαφορά ανάμεσα στην πρόβλεψη και το βίωμα.
Η σημασία του σώματος
Μια θεμελιώδης διαφορά ανάμεσα στον άνθρωπο και τα σημερινά συστήματα ΤΝ είναι ότι διαθέτουμε σώμα με το οποίο μπορούμε να μετακινηθούμε στο περιβάλλον και να επενεργήσουμε πάνω του. Τα βρέφη και τα μικρά παιδιά αναπτύσσονται νοητικά, δοκιμάζοντας τις κινήσεις των χεριών, των ποδιών, των δακτύλων τους, περιεργαζόμενα καθετί το οποίο φτάνουν. Το πώς με πολύ μικρή καθοδήγηση καταφέρνουν αυτόνομα αυτήν την αρχική φάση ανάπτυξης είναι κλειδί τόσο για τη δουλειά των αναπτυξιακών ψυχολόγων, όσο και των ρομποτιστών. Η συνεργασία τους φέρνει απρόσμενες διαπιστώσεις και στα δύο επιστημονικά πεδία.
Ηδη από το τέλος της δεκαετίας του 1990, ρομποτιστές είχαν παρατηρήσει ότι ρομπότ με νευρωνικά δίκτυα βασισμένα στη διαδικασία πρόβλεψης - διόρθωσης μπορούσαν να αποκτήσουν στοιχειώδεις δεξιότητες πλοήγησης μεταξύ εμποδίων, μίμησης κινήσεων των χεριών και ανταπόκρισης σε απλές προφορικές εντολές. Το 2015, ρομποτιστές και αναπτυξιακοί ψυχολόγοι στο πανεπιστήμιο του Πλίμουθ έδειξαν πόσο κρίσιμη είναι η ύπαρξη του σώματος για την απόκτηση γνώσης. «Το σχήμα του σώματος του ρομπότ και τα πράγματα που μπορεί να κάνει με αυτό επηρεάζουν τις εμπειρίες που έχει και τι μπορεί να μάθει από αυτές», λέει η Λίντα Σμιθ, μια από τους ερευνητές. Στα πειράματά τους χρησιμοποίησαν κυρίως το iCub, ένα ανθρωπόμορφο ρομπότ ύψους ενός μέτρου, που κατασκευάστηκε από το Ιταλικό Ινστιτούτο Τεχνολογίας για ερευνητικούς σκοπούς και από κατασκευής δεν έχει προγραμματισμένη καμία λειτουργία.
Αισθησιοκινητική ανάπτυξη
Στα πειράματα με το iCub, οι ερευνητές διαπίστωσαν ότι το νευρωνικό δίκτυο, που του έβαλαν, του έδωσε τη δυνατότητα να μαθαίνει συσχετίσεις ανάμεσα σε λέξεις και αντικείμενα και αυτό να το πετυχαίνει καλύτερα, όταν πρόφεραν την ονομασία του αντικειμένου δείχνοντάς το στο ρομπότ στην ίδια θέση στο χώρο γύρω του. Η ΤΝ μάθαινε καλύτερα συσχετίζοντας τις κινήσεις που έπρεπε να κάνει το ανδροειδές, ώστε να δει το αντικείμενο. Οταν οι επιστήμονες έκαναν το ίδιο πείραμα με μωρά 16 μηνών, παρατήρησαν το ίδιο φαινόμενο. Συγκεκριμένες στάσεις βοηθούσαν τα μωρά να συσχετίσουν καλύτερα τις λέξεις με τα αντικείμενα. Οι ερευνητές διαπίστωσαν ακόμη ότι τα ρομπότ τους μάθαιναν πιο εύκολα τις βασικές ικανότητες αρίθμησης, όταν η συσχέτιση των αριθμών γινόταν με τα δάχτυλά τους, παρά όταν τους επιδεικνυόταν διαφορετικός αριθμός αντικειμένων.
Η περιέργεια για το άγνωστο και το ασυνήθιστο επίσης βοηθά τα παιδιά να μάθουν. Ο Πιερ Ιβ Ουντεγιέ, του γαλλικού εθνικού ινστιτούτου επιστήμης υπολογιστών, θεωρεί ότι τα παιδιά αναζητούν ενστικτωδώς τα αντικείμενα του περιβάλλοντος που προσφέρουν τις μεγαλύτερες δυνατότητες για μάθηση. Για να δοκιμάσει τη θεωρία του, στράφηκε σε ρομποτικά συστήματα, στα οποία έδωσε ένα χαρακτηριστικό εσωτερικού κινήτρου: Την επιβράβευση για τη μείωση του λάθους πρόβλεψης (για μια ΤΝ επιβράβευση μπορεί να είναι η αύξηση αριθμητικής ποσότητας, την οποία έχει προγραμματιστεί να μεγιστοποιεί μέσω των πράξεών της). Την ΤΝ την έβαλε στα μικρά ρομποτικά σκυλάκια AIBO της «Sony», διαπιστώνοντας ότι σύντομα απέκτησαν βασικές δεξιότητες, όπως το να πιάνουν αντικείμενα και να αλληλεπιδρούν φωνητικά μεταξύ τους, χωρίς να τους έχει προγραμματιστεί καμία από αυτές τις λειτουργίες. Μάλιστα, παρότι τα ρομποτάκια πέρασαν από τις ίδιες φάσεις εκπαίδευσης, οι τυχαίες μικροδιαφορές στο περιβάλλον, τα οδήγησαν να αποκτήσουν διαφορετικές γνώσεις, όπως συμβαίνει και στα ομοζυγωτικά δίδυμα.
Σε άλλο πείραμα με το iCub, ερευνητές στην Ιαπωνία έδειξαν ότι χωρίς να προγραμματίσουν στο ρομπότ κάποια τάση κοινωνικοποίησης, το κίνητρο της μείωσης του λάθους πρόβλεψης, το έκανε να προσπαθήσει να «βοηθήσει» τον πειραματιστή, όταν εκείνος έκανε σκόπιμα λάθος σε μια κίνηση, που είχε ήδη μάθει να κάνει το ρομπότ. Αν ο πειραματιστής έκανε πως δεν μπορούσε να μετακινήσει ένα παιχνίδι - φορτηγάκι στην κατάλληλη θέση, το iCub συχνά το μετακινούσε το ίδιο. Σύμφωνα με την επικεφαλής του πειράματος, Γιούκι Ναγκάι, «ένα μωρό δεν χρειάζεται να έχει την πρόθεση να βοηθήσει άλλους ανθρώπους», το κίνητρο της ελαχιστοποίησης του λάθους πρόβλεψης είναι από μόνο του αρκετό για να εκκινήσει στοιχειώδεις κοινωνικές ικανότητες.

Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγή: «Scientific American»

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

TOP READ