Μηχανές με οπτική αντίληψη ισάξια ή καλύτερη του ανθρώπου
Αν
κάποιος σας έδειχνε ένα γράμμα κάποιου άγνωστου σε σας αλφαβήτου και
σας ζητούσε να το αντιγράψετε σε ένα χαρτί, το πιθανότερο είναι ότι θα
το κάνατε με ευκολία. Ενας υπολογιστής, όμως, θα αντιμετώπιζε μεγάλη
δυσκολία (σ.σ. δεν αναφερόμαστε σε φωτογραφική αναπαραγωγή του
γράμματος), ακόμη κι αν ήταν εξοπλισμένος με την τελευταία λέξη των
αλγορίθμων βαθιάς μηχανικής μάθησης, όπως αυτοί που χρησιμοποιεί γνωστή
μηχανή αναζήτησης στο διαδίκτυο για την αυτόματη ταξινόμηση των
φωτογραφιών. Αυτά τα συστήματα βαθιάς μηχανικής μάθησης απαιτούν
εκπαίδευση με μεγάλα σύνολα δεδομένων ακόμη και για να κάνουν
στοιχειώδεις διακρίσεις μεταξύ των φωτογραφιών. Κάτι τέτοιο δεν είναι
πρόβλημα για μηχανές στο ταχυδρομείο που ταξινομούν τις επιστολές κατά
ταχυδρομικό κώδικα. Αλλά για πιο λεπτά προβλήματα, όπως η άμεση
μετάφραση από τη μια γλώσσα στην άλλη, μια προσέγγιση που θα επέτρεπε
την εκπαίδευση του συστήματος με λιγοστά παραδείγματα θα ήταν πιο
αποτελεσματική.
Οι υπολογιστές είναι σήμερα σε θέση να κάνουν αυτό το άλμα, χάρη σε ένα πλαίσιο μηχανικής μάθησης που ονομάζεται Bayesian Program Learning (BPL). Ο χαρακτηρισμός Bayesian αναφέρεται στο είδος πιθανολογικής συλλογιστικής, που επιτρέπει τη βελτίωση αβέβαιων εικασιών στη βάση νέων δεδομένων. Ομάδες ερευνητών στο πανεπιστήμιο της Νέας Υόρκης στο MIT και στο πανεπιστήμιο του Τορόντο έδειξαν ότι ένας υπολογιστής που χρησιμοποιεί την BPL έχει καλύτερη επίδοση από τους ανθρώπους στην αναγνώριση και ανακατασκευή μη οικείων χειρόγραφων συνόλων χαρακτήρων, βασιζόμενων σε ένα και μόνο παράδειγμα.
Η προσέγγιση BPL στη μηχανική μάθηση είναι θεμελιωδώς διαφορετική από τη βαθιά μάθηση, που σε γενικές γραμμές προσπαθεί να αντιγράψει τις βασικές ικανότητες αναγνώρισης μοτίβων, που διαθέτει ο ανθρώπινος εγκέφαλος. Αντίθετα η BPL εμπνέεται από την ικανότητα του ανθρώπινου εγκεφάλου να συνάγει ένα σύνολο δράσεων, που θα μπορούσαν να παράγουν το μοτίβο, που δίνεται προς αντιγραφή. Για παράδειγμα μπορεί να αναγνωρίσει ότι το γράμμα Α είναι δυνατό να κατασκευαστεί από δύο γραμμές υπό γωνία, που συνενώνονται στο πάνω μέρος και μια οριζόντια γραμμή στη μέση. Ο υπολογιστής αναπαριστά το Α συνθέτοντας ένα απλό πρόγραμμα, που δημιουργεί παραδείγματα αυτού του γράμματος, φτιάχνοντας διαφορετικές και όλο και πιο καλές παραλλαγές του κάθε φορά, που τρέχει το πρόγραμμα. Οι διαδικασίες BPL επιτρέπουν στο λογισμικό να αντιμετωπίσει την αβεβαιότητα της κατασκευής άγνωστων γραμμάτων, από μικρότερα οικεία τμήματα (όπως η οριζόντια γραμμή στο Α).
Αυτός ο τρόπος μάθησης είναι πιο ευέλικτος και αποτελεσματικός και οι ίδιες διαδικασίες που χρησιμοποιεί το λογισμικό BPL για την αποδόμηση και στη συνέχεια ανακατασκευή ενός αγνώστου γράμματος, ίσως θα μπορούσαν στο μέλλον να οδηγήσουν σε τεχνητή νοημοσύνη ικανή να συμπεράνει μοτίβα αιτίου - αποτελέσματος σε σύνθετα φαινόμενα (όπως η ροή ενός ποταμού) και στη συνέχεια να τα χρησιμοποιήσει σε εντελώς διαφορετικά συστήματα. Οι άνθρωποι συχνά χρησιμοποιούν αυτό το είδος της «πλάγιας σκέψης», που αποτελεί βασικό στοιχείο της ανθρώπινης νοημοσύνης. Ακριβώς αυτή την ικανότητα επιδιώκουν να δώσουν στα μηχανήματα οι ερευνητές, όπως δηλώνει ο Μπρέντεν Λέικ, του πανεπιστημίου της Νέας Υόρκης.
Οι υπολογιστές είναι σήμερα σε θέση να κάνουν αυτό το άλμα, χάρη σε ένα πλαίσιο μηχανικής μάθησης που ονομάζεται Bayesian Program Learning (BPL). Ο χαρακτηρισμός Bayesian αναφέρεται στο είδος πιθανολογικής συλλογιστικής, που επιτρέπει τη βελτίωση αβέβαιων εικασιών στη βάση νέων δεδομένων. Ομάδες ερευνητών στο πανεπιστήμιο της Νέας Υόρκης στο MIT και στο πανεπιστήμιο του Τορόντο έδειξαν ότι ένας υπολογιστής που χρησιμοποιεί την BPL έχει καλύτερη επίδοση από τους ανθρώπους στην αναγνώριση και ανακατασκευή μη οικείων χειρόγραφων συνόλων χαρακτήρων, βασιζόμενων σε ένα και μόνο παράδειγμα.
Η προσέγγιση BPL στη μηχανική μάθηση είναι θεμελιωδώς διαφορετική από τη βαθιά μάθηση, που σε γενικές γραμμές προσπαθεί να αντιγράψει τις βασικές ικανότητες αναγνώρισης μοτίβων, που διαθέτει ο ανθρώπινος εγκέφαλος. Αντίθετα η BPL εμπνέεται από την ικανότητα του ανθρώπινου εγκεφάλου να συνάγει ένα σύνολο δράσεων, που θα μπορούσαν να παράγουν το μοτίβο, που δίνεται προς αντιγραφή. Για παράδειγμα μπορεί να αναγνωρίσει ότι το γράμμα Α είναι δυνατό να κατασκευαστεί από δύο γραμμές υπό γωνία, που συνενώνονται στο πάνω μέρος και μια οριζόντια γραμμή στη μέση. Ο υπολογιστής αναπαριστά το Α συνθέτοντας ένα απλό πρόγραμμα, που δημιουργεί παραδείγματα αυτού του γράμματος, φτιάχνοντας διαφορετικές και όλο και πιο καλές παραλλαγές του κάθε φορά, που τρέχει το πρόγραμμα. Οι διαδικασίες BPL επιτρέπουν στο λογισμικό να αντιμετωπίσει την αβεβαιότητα της κατασκευής άγνωστων γραμμάτων, από μικρότερα οικεία τμήματα (όπως η οριζόντια γραμμή στο Α).
Αυτός ο τρόπος μάθησης είναι πιο ευέλικτος και αποτελεσματικός και οι ίδιες διαδικασίες που χρησιμοποιεί το λογισμικό BPL για την αποδόμηση και στη συνέχεια ανακατασκευή ενός αγνώστου γράμματος, ίσως θα μπορούσαν στο μέλλον να οδηγήσουν σε τεχνητή νοημοσύνη ικανή να συμπεράνει μοτίβα αιτίου - αποτελέσματος σε σύνθετα φαινόμενα (όπως η ροή ενός ποταμού) και στη συνέχεια να τα χρησιμοποιήσει σε εντελώς διαφορετικά συστήματα. Οι άνθρωποι συχνά χρησιμοποιούν αυτό το είδος της «πλάγιας σκέψης», που αποτελεί βασικό στοιχείο της ανθρώπινης νοημοσύνης. Ακριβώς αυτή την ικανότητα επιδιώκουν να δώσουν στα μηχανήματα οι ερευνητές, όπως δηλώνει ο Μπρέντεν Λέικ, του πανεπιστημίου της Νέας Υόρκης.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου