https://bodybydarwin.com
Slider Image

Ο συνεργατικός αλγόριθμος επιτρέπει στην αυτόνομη ομάδα ρομπότ να έρχεται και να μαθαίνει ο ένας από τον άλλο

2021

Την περασμένη εβδομάδα, το MIT ανακοίνωσε μια συναρπαστική, αλλά κάπως συγκεχυμένη ανακάλυψη - έναν νέο αλγόριθμο, που ονομάζεται AMPS, που μετατρέπει τις ομάδες ρομπότ σε καλύτερους μαθητές. Επιτρέπει στα αυτόνομα συστήματα να συγκρίνουν γρήγορα σημειώσεις σχετικά με το τι έχουν παρατηρήσει στα αντίστοιχα ταξίδια τους και να καταλήξουν σε μια συνδυασμένη κοσμοθεωρία.

Αν φαίνεται ότι έχω ήδη υποκύψει στους χειρότερους πειρασμούς της ρομποτικής κάλυψης - της ανάγκης να ανθρωπομορφώσουν τα μηχανήματα και να καθαρίσω ένα διακριτό ερευνητικό επίτευγμα σε μια ευκολότερη εύπεπτη, ευρέως προσβάσιμη καταιγίδα με μένα. Αν και οι συγγραφείς του δεν το αποκαλούν μια σημαντική ανακάλυψη, αυτός ο αλγόριθμος φαίνεται να είναι ακριβώς αυτός.

Το AMPS, το οποίο είναι σύντομο για την Κατά προσέγγιση Συγχώνευση των Posteriors για τη Συμμετρία (αναφορά στη Bayesian στατιστική ανάλυση), θα παρουσιαστεί στη Διάσκεψη για την Αβεβαιότητα Τεχνητής Νοημοσύνης τον Ιούλιο. Ο αλγόριθμος αντιμετωπίζει ένα εξαιρετικά συγκεκριμένο πρόβλημα ρομποτικής. Για να λειτουργεί ένα μηχάνημα σε ένα δεδομένο περιβάλλον, πρέπει να ορίζει σημασιολογικές ετικέτες όπου είναι δυνατόν. Αυτές είναι, στην πραγματικότητα, γνωστικές συντομεύσεις. Έτσι, ένα ορθογώνιο τμήμα του τοίχου με μεντεσέδες και μια λαβή δεν είναι πάντα ένα γρίφο, το οποίο πρέπει να λυθεί από το μηδέν κάθε φορά που συναντάται. Είναι μια πόρτα, η οποία μπορεί να ανοίξει ή να κλείσει. Και σύνολα σημασιολογικών ετικετών μπορούν να προστεθούν σε μεγαλύτερες ετικέτες. Μια πόρτα (ετικέτα) που ανοίγει σε ένα δωμάτιο με μεγάλο κεντρικό τραπέζι (άλλη ετικέτα) και ένα μάτσο καρέκλες (περισσότερες ετικέτες), μπορεί να είναι μια αίθουσα συνεδριάσεων.

Αυτό το είδος αχαλίνωτης επισήμανσης είναι εξίσου σημαντικό για αυτόνομους bots όπως και για τους ανθρώπους. Η διαφορά, ωστόσο, είναι ότι οι άνθρωποι είναι γενικά πιο περιορισμένοι με τη δημιουργία της ετικέτας και την αναγνώρισή τους. "Εμείς, ως άνθρωποι, έχουμε ένα αρκετά καλά καθορισμένο λεξιλόγιο για τα πράγματα, " λέει ο Jonathan How, καθηγητής αεροναυτικής και αστροναυτικής στο MIT. «Γνωρίζουμε πώς να επισημάνουμε τα πράγματα με συνεπή παγκόσμιο τρόπο ή να τα παραλάβουμε διαβάζοντας άλλα πράγματα στο περιβάλλον μας». Έτσι, αν κάποιος εισέλθει σε μια αίθουσα συνεδριάσεων χωρίς καρέκλες σε αυτό, δεν ξυπνά ξαφνικά αισθάνεται άσχημα στο χρόνο και στο χώρο. Είμαστε έξυπνοι έτσι.

Τα ρομπότ, συγκριτικά, μπορεί να είναι μάλλον χαζή. Ή άκαμπτο, τουλάχιστον. Μια αίθουσα συνεδριάσεων χωρίς καρέκλα θα μπορούσε να θεωρηθεί ως χώρος αποθήκευσής της και να φέρει ετικέτα για πάντα, πολύ καιρό μετά το πάρτι γενεθλίων και τα καθίσματα επιστρέφονται. Μακριά από τον ανθρωπομορφισμό τους, αυτή η γνωστική ακαταστασία είναι μια υπενθύμιση του πόσο απάνθρωπα ρομπότ είναι. Και μπορούν να προκύψουν περισσότερα προβλήματα όταν τα μηχανήματα προσπαθούν να μοιράζονται σύνολα δεδομένων και συνδυάζουν τις εμπειρίες τους με μια μεγαλύτερη συλλογή περιβαλλοντικών ετικετών. Εάν ένα bot έχει δηλώσει μια περιοχή ως αίθουσα συνεδριάσεων και το άλλο bot το έχει επισημάνει ως αποθήκη, πώς συμβιβάζουν την ασυμφωνία; Όπου οι άνθρωποι μπορούσαν να ταξινομήσουν τη διαφωνία χρησιμοποιώντας τα μεγάλα στόματά μας και ακόμα μεγαλύτερους εγκεφάλους, τα ρομπότ έχουν κολλήσει με τις αδυσώπητες, αδιάβλητες ετικέτες τους.

Ο αλγόριθμος AMPS υπόσχεται να σπάσει αυτά τα αδιέξοδα, επιτρέποντας στα ρομπότ να επανεξετάσουν τη σημασία των διαφόρων ετικετών. Είναι κάτι περισσότερο από το πού βρίσκονται τα πράγματα, είναι αυτά που είναι, από τι αποτελούνται, λέει πώς. Για παράδειγμα, πόσο σημαντικό είναι για μια αίθουσα συνεδριάσεων να έχουν καρέκλες; Και αν ένα ρομπότ έχει ήδη εντοπίσει αυτό που θεωρεί μια αποθήκη, γεμάτη με κιβώτια, ντουλάπια και ράφια, θα υπήρχε πραγματικά μια άλλη αποθήκη τόσο κοντά σε αυτήν (χωρίς κανένα από αυτά τα γνωρίσματα); Σύμφωνα με τον How, ο οποίος δημιούργησε τον αλγόριθμο με τον μεταπτυχιακό φοιτητή του Trevor Campbell, το τέχνασμα είναι να επιτρέψει στις μηχανές διασύνδεσης να δημιουργήσουν νέες προτεραιότητες για τις ετικέτες τους, ανοικοδομώντας την κοσμοθεωρία τους. Επιτρέποντας αίθουσες συνεδριάσεων που μπορεί να έχουν ή δεν έχουν καρέκλες σε αυτά και αναδιατάσσοντας τις ετικέτες τους ώστε να λαμβάνουν υπόψη διαφορετικές εμπειρίες, τα ρομπότ μπορούν να επιτύχουν αυτό που ο How και ο Campbell αναφέρονται ως σημασιολογική συμμετρία.

Αυτή είναι μια λύση σε ένα πρόβλημα το οποίο, για να είμαι ειλικρινής, δεν αποτελεί ακόμα ένα πρόβλημα. Τα αυτόνομα συστήματα είναι σχετικά σπάνια εκτός από τα καλά καθορισμένα, προσεκτικά επισημασμένα όρια των εγκαταστάσεων παραγωγής, και εκείνα που έχουν σχεδιαστεί για να μάθουν είναι ακόμα πιο σπάνια. Όμως, καθώς τα ρομπότ με αυτο-καθοδήγηση γίνονται πιο συνηθισμένα, και τα περιβάλλοντα και οι συμπεριφορές που πρέπει να περιηγούνται είναι πιο ποικίλες, η συνεργατική μάθηση μπορεί να είναι ένα σημαντικό πλεονέκτημα. Αυτά είναι σχετικά με την κατασκευή ρομπότ που δεν ρίχνουν συνεχώς τα χέρια τους στον αέρα, λέγοντας: Αυτό δεν είναι ένα από τα τελικά πράγματα που ορίσατε. Δεν ξέρω τι να κάνω τώρα, λέει ο How.

Το AMPS, με άλλα λόγια, είναι για μελλοντικές γενιές αυτόνομων μηχανών, όπως τα αυτοκίνητα ρομπότ, που αναπόφευκτα θα βρεθούν σε καταστάσεις όπου οι προγραμματιστές δεν είχαν την πρόβλεψη ή το εύρος ζώνης για να τους προετοιμάσουν. Ορισμένες πόλεις, για παράδειγμα, μπορούν να γίνουν ελεύθερες για όλους όταν ο ήλιος δύσει, αναγκάζοντας τα οχήματα να περάσουν μέσα από μια σταθερή ροή εμψυχωμένων ανθρώπων. Ένα προστατευμένο, προαστιακό αυτοκίνητο ρομπότ που βλέπει μόνο τους πεζούς που περιμένουν υπομονετικά στις διασταυρώσεις θα μπορούσε να κάνει ό, τι ρομπότ κάνουν συχνά σε νέες, ανεξήγητες καταστάσεις και να αλέσει να σταματήσει. Εν τω μεταξύ, ένα αυτοκίνητο χωρίς οδηγό που βασίζεται σε πόλεις μπορεί να έχει περισσότερη εμπειρία με αυτό το νυχτερινό μπράβο της περιστασιακής αξιολόγησης κινδύνου και χαμηλής ταχύτητας. Εάν τα δύο αυτά bots σταματήσουν στο ίδιο φανάρι και είναι σε θέση να μοιραστούν αποτελεσματικά τα δεδομένα τους, μπορεί να συμβιβάσουν τις διαφορετικές παρατηρήσεις τους. Το προαστιακό μοντέλο θα μπορούσε να ξεσπάσει από το στολίδι του (ή να αποφύγει να πέσει σε ένα στην πρώτη θέση) και να προχωρήσει με ένα επαρκές μίγμα προσοχής και αποφασιστικότητας. Το ρομπότ αστραπιαίας πόλης δεν ωφελείται αναγκαστικά από την εκμάθηση του τρόπου συμπεριφοράς των ανθρώπων σε χώρους όπου η κυριαρχία αυτοκινήτων βασιλεύει υπέρτατη, αλλά ίσως παίρνει ένα κόλπο ή δύο που σχετίζονται με τυφλούς δρόμους ή αδέσποτα που εκσφενδονίζουν τη λωρίδα διάσπασης.

Η συνεργατική μάθηση θα μπορούσε να επιτευχθεί με άλλα μέσα, όπως οι μηχανές αγκίστρωσης μέχρι ένα εκτεταμένο δίκτυο, όπου τα ολόκληρα κέντρα εξυπηρετητών μπορούν να μετατρέψουν τις ετικέτες σε σύγκρουση και να ενημερώσουν τα ρομπότ ανάλογα με τις ανάγκες. Το πλεονέκτημα του AMPS είναι η ικανότητά του να εργάζεται όπου η συνεχής πρόσβαση στο δίκτυο δεν αποτελεί επιλογή, είτε πρόκειται για χωματόδρομο είτε για χωματόδρομο, στην αυστραλιανή άμπωτη ή σε έναν κρατήρα που βγήκε από την επιφάνεια του Άρη, η οποία επικεντρώνεται στην επικοινωνία ρομπότ-ρομπότ, χωρίς την πολυτέλεια των ισχυρών συστημάτων back-end, αυξάνει ουσιαστικά την αυτονομία των αυτόνομων μηχανών και δημιουργεί μια βάση για την ουσιαστική μάθηση. "Σκεφτόμαστε αυτό στο πλαίσιο της διά βίου μάθησης λέει πώς. "Αυτό σημαίνει ότι ένα ρομπότ θα μπορούσε να βρεθεί κάπου για ένα χρόνο που λειτουργεί από μόνο του και δεν χρειάζεται να επιστρέφει και να υποβάλλει ερωτήσεις. Τα ρομπότ μπορούν να περιπλανηθούν, όπως κάνουν οι άνθρωποι, να αλληλεπιδρούν μεμονωμένα ή σε ζεύγη, να βρίσκουν τρόπους να μάθουν ο ένας από τον άλλον. "

Είναι πολύ νωρίς για να μάθουμε αν ο αλγόριθμος AMPS θα κάνει το δρόμο του σε αυτόνομα αυτοκίνητα. Αλλά, όπως επισημαίνει, τα οχήματα χωρίς οδηγό αποτελούν μία από τις βασικές ανησυχίες του Εργαστηρίου Πληροφοριακών Συστημάτων και Συστημάτων Αποφάσεων (το ερευνητικό κέντρο του MIT με το οποίο συνεργάζεται). Μια πιο βραχυπρόθεσμη εφαρμογή μπορεί να είναι σε ρομπότ που βασίζονται σε εξερεύνηση ή παρατηρήσεις. Λαμβάνοντας υπόψη ότι το έργο αυτό χρηματοδοτήθηκε από το Γραφείο Ναυτικών Ερευνών, ένα στρατιωτικό σύστημα με ικανότητα για ομαδική εργασία φαίνεται τελείως εφικτό. Μακροπρόθεσμα, όμως, η συνεργατική μάθηση είναι μεγαλύτερη από οποιαδήποτε κλάση ρομπότ. Η υπόσχεση είναι η δημιουργία περισσότερων βόμβων με αυτοπεποίθηση, οι οποίοι δεν πρέπει να περπατούν μέσα από κάθε εργασία και να τροφοδοτούν με κουτάλι κάθε σχετικό κομμάτι δεδομένων. Επειδή αν παραδοθούμε στην ανάγκη να ανθρωπομορφώσουμε τα ρομπότ - και είναι δύσκολο να μην - οι αυτόνομοι είναι μόλις στα πόδια τους και μόνο περιστασιακά από τις πάνες.

Τα πλανητάρια φαίνεται παλιά σχολείο, αλλά έχουν ένα εκπληκτικά ζωηρό μέλλον

Τα πλανητάρια φαίνεται παλιά σχολείο, αλλά έχουν ένα εκπληκτικά ζωηρό μέλλον

Τα φρούτα και τα λαχανικά θα μπορούσαν να σας σώσουν τη ζωή, αλλά όχι από κάποια ασθένεια.

Τα φρούτα και τα λαχανικά θα μπορούσαν να σας σώσουν τη ζωή, αλλά όχι από κάποια ασθένεια.

Ένα νέο μικροσκόπιο χρησιμοποιεί φως για να "κόψει" μέσω δειγμάτων ιστών και να βρει καρκίνο

Ένα νέο μικροσκόπιο χρησιμοποιεί φως για να "κόψει" μέσω δειγμάτων ιστών και να βρει καρκίνο