Τρίτη, 7 Ιουνίου 2016

Πώς μαθαίνουμε στους υπολογιστές να καταλαβαίνουν εικόνες; [TED Video]

Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα επιστημονικό πεδίο της τεχνητής νοημοσύνης το οποίο επιχειρεί να αναπαράγει αλγοριθμικά την αίσθηση της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή ρομπότ. Στη συνέχεια μπορείτε να παρακολουθήσετε μία ενδιαφέρουσα ομιλία από την ειδικό στον τομέα της υπολογιστικής όρασης Φέι-Φέι Λι.

https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=el

Στην ομιλία αυτή η Φέι-Φέι Λι αναφέρει ότι η ομάδα της αντί να εστιάζει μόνο σε ολοένα και καλύτερους αλγόριθμους είχε την ιδέα να δώσει στους αλγόριθμους το είδος των εκπαιδευτικών δεδομένων που ένα παιδί αποκτά μέσω εμπειρίας τόσο σε ποσότητα όσο και σε ποιότητα. Έτσι δημιουργήθηκε to 2007 η βάση δεδομένων ImageNet η οποία περιλαμβάνει 15 εκατομμύρια φωτογραφίες που ανήκουν σε 22.000 κατηγορίες αντικειμένων.

Στη συνέχεια με χρήση συνελικτικών νευρωνικών δικτύων (convolutional neural networks) δημιουργήθηκε ένα μοντέλο αναγνώρισης αντικειμένων που αποτελείται από 24 εκατομμύρια κόμβους,140 εκατομμύρια παραμέτρους και 15 δισεκατομμύρια συνδέσεις. Το μοντέλο αυτό φαίνεται να έχει ικανοποιητικά αποτελέσματα αν και υπάρχουν ακόμα πολλά βήματα που πρέπει να γίνουν.


0 σχόλια:

Δημοσίευση σχολίου