Ρομπότ μαθαίνουν να μαγειρεύουν βλέποντας βίντεο στο YouTube
Ερευνητές του Πανεπιστημίου του Μέριλαντ αναφέρουν ότι ανέπτυξαν συστήματα ρομποτικής που παρακολουθούν βίντεο μαγειρικής στο YouTube και μαθαίνουν τις λεπτές κινήσεις που απαιτούνται για το χειρισμό εργαλείων κουζίνας.
«Επιλέξαμε βίντεο μαγειρικής επειδή όλοι το έχουν κάνει και όλοι το καταλαβαίνουν» λέει ο Γιάννης Αλοίμονος, διευθυντής του πανεπιστημιακού Εργαστηρίου Μηχανικής Όρασης.
«Η μαγειρική είναι περίπλοκη όσον αφορά το χειρισμό των εργαλείων, τα βήματα που απαιτούνται και την επιλογή των κατάλληλων εργαλείων. Αν θέλεις να κόψεις ένα αγγούρι, για παράδειγμα, πρέπει να πιάσεις το μαχαίρι, να το φέρεις στη σωστή θέση, να κόψεις και να εξετάσεις τα αποτελέσματα για να βεβαιωθείς ότι το έκανες σωστά» εξηγεί ο ερευνητής.
Για την ανάπτυξη των ρομποτικών μαγείρων, η ομάδα του Αλοίμονου χρειάστηκε να συνδυάσει μεθόδους από τρεις επιμέρους ερευνητικούς τομείς: την τεχνητή νοημοσύνη (υπολογιστές που λαμβάνουν αποφάσεις), τη μηχανική όραση (λογισμικό που αναγνωρίζει σχήματα, κινήσεις, αντικείμενα) και την αναγνώριση φυσικής ομιλίας (κατανόηση προφορικών εντολών).
Η βασική πρόκληση ήταν η ανάπτυξη μιας τακτικής που θα επέτρεπε στα ρομπότ να επεξεργάζονται τα επιμέρους βήματα μιας διαδικασίας παρακολουθώντας σε πραγματικό χρόνο βίντεο με διαφορετική ποιότητα εικόνας. Κάθε επιμέρους βήμα αντιστοιχίζεται με έναν «κανόνα» που ορίζει μια συγκεκριμένη συμπεριφορά, και το ρομπότ αποφασίζει πώς θα συνδέσει στη σωστή σειρά αυτές τις συμπεριφορές.
Ο Αλοίμονος παρομοιάζει αυτές τις επιμέρους ενέργειες με τις λέξεις μιας πρότασης. Όταν το ρομπότ αναπτύξει το δικό του «λεξιλόγιο» ενεργειών μπορεί πλέον να τις συνδέει έτσι ώστε να επιτυγχάνει το επιθυμητό αποτέλεσμα.
Αυτή είναι εξάλλου η διαφορά της νέας τακτικής σε σχέση με προηγούμενες προσπάθειες. «Άλλοι ερευνητές έχουν επιχειρήσει να αντιγράψουν τις απαιτούμενες κινήσεις. Εμείς, αντίθετα, προσπαθούμε να αντιγράψουμε τους στόχους» επισημαίνει ο ερευνητής.
Η νέα τακτική δοκιμάζεται κυρίως στο ρομπότ Baxter, ένα βιομηχανικό ρομπότ που παρουσιάστηκε το 2012 και μπορεί να διδάσκεται κινήσεις από ανθρώπινους χειριστές.
Το λογισμικό που ανέπτυξαν οι ερευνητές βασίζεται σε νευρωνικά δίκτυα, προγράμματα που μιμούνται τις συνδέσεις των νευρώνων στον ανθρώπινο εγκέφαλο για να διδάσκονται από τις εμπειρίες τους. Τα νευρωνικά δίκτυα δεν είναι μεν νέα ιδέα, έχουν όμως μεγάλες απαιτήσεις σε επεξεργαστική ισχύ και μόλις πρόσφατα άρχισαν να χρησιμοποιούνται ευρέως. Παρόμοια νευρωνικά δίκτυα αναλαμβάνουν τη λειτουργία αναγνώρισης φωνής στα σύγχρονα smartphone και τη λειτουργία αναγνώρισης προσώπων στο Facebook και άλλες υπηρεσίες.
Σύμφωνα με τον Αλοίμονο, ρομπότ αυτής της νέας τεχνολογίας θα προσφέρουν «ένα νέο επίπεδο αυτοματοποίησης, το οποίο θα είναι η επόμενη βιομηχανική επανάσταση».
Η αλήθεια βέβαια είναι ότι τα ρομπότ του καθηγητή δεν είναι ακόμα έτοιμα να αναλάβουν την προετοιμασία του δείπνου.
Η μελέτη θα παρουσιαστεί σε συνέδριο της Ένωσης για την Πρόοδο της Τεχνητής Νοημοσύνης που θα πραγματοποιηθεί στις 29 Φεβρουαρίου στο Όστιν του Τέξας.
Το κείμενο της παρουσίασης είναι διαθέσιμο στο δικτυακό τόπο του Πανεπιστημίου του Μέριλαντ.
Επιμέλεια: Βαγγέλης Πρατικάκης
Newsroom ΔΟΛ
Σχόλια Facebook