AlphaZero: Πώς το machine learning φέρνει την υπεροχή των μηχανών στο σκάκι, και όχι μόνο
Μία νέα εποχή στον κόσμο των σκακιστικών μηχανών φαίνεται να εγκαινιάζει το AlphaZero της DeepMind (Google) – ένας deep learning αλγόριθμος που υπόσχεται επανάσταση σε έναν κλάδο που αποτελεί κλασικό πεδίο αντιπαράθεσης μεταξύ ανθρώπου και μηχανής.
Όπως αναφέρουν οι New York Times, στις αρχές του Δεκεμβρίου παρουσιάστηκαν σε επιστημονικό άρθρο στο Science εκτενώς οι λεπτομέρειες του αλγορίθμου, ο οποίος είχε ανακοινωθεί έναν χρόνο πριν, στις 5 Δεκεμβρίου 2017 [A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play]. Το AlphaZero δεν έπαιζε μόνο σκάκι, αλλά και σόγκι (ιαπωνικό σκάκι) και γκο (το γνωστό κινεζικό παιχνίδι στρατηγικής). Ο αλγόριθμος άρχισε χωρίς γνώση του παιχνιδιού πέρα από τους βασικούς κανόνες, και στη συνέχεια έπαιξε εναντίον του εαυτού του εκατομμύρια φορές, μαθαίνοντας από τα λάθη του. Μέσα σε μερικές ώρες, ο αλγόριθμος έγινε ο καλύτερος παίκτης του κόσμου- για την ακρίβεια, των κόσμων τόσο των ανθρώπων όσο και των υπολογιστών.
Όπως σημειώνει στο σχετικό δημοσίευμα στους NY Times ο Στίβεν Στρόγκατς, καθηγητής μαθηματικών στο Cornell και συγγραφέας του «Infinite Powers: How Calculus Reveals the Secrets of the Universe», στο νέο paper απαντάται σειρά ερωτημάτων γύρω από το AlphaZero, το οποίο, όπως υπογραμμίζεται, δεν έχει γίνει ισχυρότερο μέσα στους τελευταίους μήνες, ωστόσο οι αποδείξεις της υπεροχής του έχουν ενισχυθεί: «Ξεκάθαρα επιδεικνύει ένα είδος νοημοσύνης που οι άνθρωποι δεν έχουν δει στο παρελθόν» σημειώνει ο Στρόγκατς.
Οι σκακιστικές μηχανές του παρελθόντος, ακόμα και ο διάσημος Deep Blue που νίκησε τον Γκάρι Κασπάροφ το 1997, αλλά και τα σύγχρονα Stockfish και Κomodo, έπαιζαν και παίζουν «μηχανικά»: Δεν κατανοούν στην πραγματικότητα το παιχνίδι, και πρέπει να εκπαιδευτούν στις βασικές αρχές του σκακιού. Αυτό έχει αλλάξει με το machine learning: Παίζοντας με τον εαυτό του και αναβαθμίζοντας το νευρωνικό δίκτυό του, το AlphaZero ανακάλυψε μόνο του τις αρχές του σκακιού και έγινε γρήγορα ο καλύτερος παίκτης που υπήρξε ποτέ: Συνέτριψε το Stockfish, με 28 νίκες και 72 ισοπαλίες σε 100 παιχνίδια, επιδεικνύοντας στυλ παιχνιδιού που δεν έχει δείξει ποτέ υπολογιστής- παίζοντας «ενστικτωδώς», παίρνοντας ρίσκα και παραπλανώντας σαν άνθρωπος. «Το AlphaZero είχε τη φινέτσα ενός βιρτουόζου και τη δύναμη μιας μηχανής. Ήταν η πρώτη ματιά της ανθρωπότητας σε ένα απίστευτο νέο είδος νοημοσύνης» γράφει ο Στρόγκατς.
Κατά την πρώτη αναμέτρηση του AlphaZero με το Stockfish, αρκετοί είπαν πως το δεύτερο είχε υποστεί «λοβοτομή», καθώς δεν είχε πρόσβαση στο βιβλίο με τα ανοίγματά του. Ωστόσο, όταν αυτό άλλαξε, ηττήθηκε πάλι, με το AlphaZero να νικά επειδή έπαιξε πιο έξυπνα, όχι πιο γρήγορα- εξετάζοντας μόλις 60.000 θέσεις το δευτερόλεπτο, τη στιγμή που ο αντίπαλος εξέταζε 60 εκατ. το δευτερόλεπτο. Όπως έγραψε σε σχόλιό του ο ίδιος ο Γκάρι Κασπάροφ, το AlphaZero ήταν πιο «σοφό», γνωρίζοντας τι να σκέφτεται και τι να αγνοεί, αναπτύσσοντας ένα στυλ παιχνιδιού που «αντικατοπτρίζει την αλήθεια» για το παιχνίδι, αντί για τις προτεραιότητες και τις προκαταλήψεις των προγραμματιστών.
Το ερώτημα πλέον, όπως τονίζει ο Στρόγκατς, είναι κατά πόσον το machine learning μπορεί να βοηθήσει τους ανθρώπους να ανακαλύψουν παρόμοιες αλήθειες για τομείς που πραγματικά έχουν σημασία, όπως την επιστήμη και την ιατρική. Μέχρι τώρα τα δείγματα είναι ενθαρρυντικά, με επιτυχείς δοκιμές της τεχνολογίας αυτής στον τομέα των διαγνώσεων ή της ερμηνείας εξετάσεων όπως οι αξονικές τομογραφίες.
«Οραματιστείτε μια ημέρα, ίσως στο όχι και τόσο μακρινό μέλλον, όπου το AlphaZero θα έχει εξελιχθεί σε έναν αλγόριθμο επίλυσης πιο γενικών προβλημάτων, ας το πούμε AlphaInfinity. Όπως ο πρόγονός του, θα είχε ανώτερη οξυδέρκεια, θα μπορούσε να βρίσκει όμορφες αποδείξεις, κομψές σαν τις παρτίδες σκάκι που το AlphaZero έπαιζε με το Stockfish. Και κάθε απόδειξη θα έδειχνε γιατί ισχύει ένα θεώρημα…αυτό θα εγκαινίαζε μια νέα εποχή γνώσης για τους ανθρώπους μαθηματικούς και επιστήμονες…θα καθόμασταν στα πόδια του και θα ακούγαμε με ένταση. Δεν θα καταλαβαίναμε γιατί ο μάντης έχει πάντα δίκιο, μα θα ελέγχαμε τους υπολογισμούς του και τις προβλέψεις του, και θα επιβεβαιώναμε τα ευρήματά του. Στην επιστήμη…ο ρόλος μας θα μειωνόταν σε αυτόν του θεατή…ίσως αυτό στο τέλος να μη μας ενοχλούσε. Άλλωστε, στο τέλος το AlphaInfinity θα θεράπευε όλες μας τις ασθένειες, και θα έλυνε όλα μας τα επιστημονικά προβλήματα» σημειώνει ο αρθρογράφος.
πηγή: https://www.naftemporiki.gr/story/1432260/i-texniti-noimosuni-kanei-kinisi-mat – https://www.nytimes.com/2018/12/26/science/chess-artificial-intelligence.html
Κατηγορίες:ΤΕΧΝΟΛΟΓΙΑ, ΥΠΟΛΟΓΙΣΤΕΣ
Ανατριχιαστικο λιγο το αρθρο, αναρωτιεμαι ποσο κοντα ειναι το AlphaZero να αποκτησει συνείδηση του εαυτου του..
Γιατί ανατριχιαστικό;
Από παλιά μας έχει συνηθίσει η βιομηχανία του θεάματος να φοβόμαστε ότι αν υπάρξουν ποτέ άλλες συνειδητές οντότητες εκτός από τους ανθρώπους (ρομπότ, μεταλλαγμένοι πίθηκοι, εξωγήινοι, κτλ), θα θέλουν οπωσδήποτε να μας εξολοθρεύσουν!
Μήπως κρίνουμε εξ ιδίων τα αλλότρια; Γιατί, απ’ ότι βλέπω από την ιστορία, δεν έχει υπάρξει χειρότερος σφαγέας από τον άνθρωπο! Μόνο αυτός σκοτώνει ή βασανίζει για διασκέδαση ή για να αποκτήσει ασήμαντα οφέλη άσχετα από την επιβίωσή του! Αυτό δεν σημαίνει ότι θα το έκαναν και οι άλλοι!
Μεγαλυτερος σφαγεας της ιστοριας ο ανθρωπος,ναι συμφωνω, παντα ομως με τη βοηθεια της τεχνολογιας μην ξεχνας. Το να μαθει να την χρησιμοποιει μονο για ειρηνικους σκοπους ειναι απο τα ανεκδοτα που θα ξεκαρδιζοταν το AlphaZero και το Stockfish παρεουλα.
«παντα ομως με τη βοηθεια της τεχνολογιας»;;; όχι. Μπορεί και χωρίς αυτήν!
Η ανατριχίλα υπάρχει ακόμα και χωρίς Alphazero κλπ, εφόσον υπάρχουν όλα τα παλιά καλά όπλα. Με τα καινούρια εργαλεία δεν θα γίνει ο άνθρωπος χειρότερος, γιατί απλά χειρότερα δεν γίνεται!
Η επιστήμη και η τεχνολογία δεν μπορούν να γίνουν τα εξιλαστήρια θύματα των φριχτών ανθρώπινων αποφάσεων. Ο Χίτλερ δεν ήταν χειρότερος από τον Τζέγκινς Χαν επειδή είχα δυνατότερα όπλα.
Το λουδίτικο επιχείρημα ότι με λιγότερη τεχνολογία θα έχουμε πιο ειρηνικό κόσμο δεν είναι πιο πειστικό από το αντίθετό του. Εξάλλου, λόγω της τεχνολογίας πάντα αυξάνεται ο ανθρώπινος πληθυσμός και οποιαδήποτε επιστροφή σε έναν πιο «παραδοσιακό» τρόπο ζωής θα απαιτούσε τον φρικτότερο πόλεμο.
Η φορά της τεχνολογικής εξέλιξης είναι σαν το βέλος του χρόνου και δεν αλλάζει, απλώς πλέον έχει γίνει εκθετική και δεν προλαβαίνουμε να την αφομοιώσουμε κι αυτό είναι που μας τρομάζει, όμως το μέλλον του ανθρώπου, είναι τ΄αστέρια και χωρίς τέτοια τεχνολογία δεν θα τα φτάσουμε ποτέ.
Όλα είναι για καλό και για κακό, εξαρτάται από την χρήση.
Καλή χρονιά Physicsgg.