Του Aaron Brown

Οι πιο διάσημες πρώιμες επιτυχίες της τεχνητής νοημοσύνης ήταν οι υπολογιστές που νίκησαν ανθρώπινους πρωταθλητές σε παιχνίδια όπως το σκάκι.

Σήμερα όλοι παίζουμε παιχνίδια εναντίον της τεχνητής νοημοσύνης. Η τιμή που σας προσφέρεται για ένα προϊόν στην Amazon, η πιθανότητα να γίνει αποδεκτή η έκπτωση για το γραφείο στο σπίτι σας από την εφορία, το αν θα κληθείτε για καθήκοντα ενόρκου, οι ιατρικές θεραπείες που θα λάβετε -αυτά και πολλά άλλα είναι αποτελέσματα διαγωνισμών εναντίον της τεχνητής νοημοσύνης.

Μια νέα μελέτη με τίτλο «Outbidding and Outbluffing Elite Humans: Mastering Liar’s Poker via Self-Play and Reinforcement Learning» (Υπερθεματίζοντας και ξεγελώντας τους ελίτ ανθρώπους: Κατακτώντας το Liar’s Poker μέσω παιχνιδιού και ενισχυτικής μάθησης) εφαρμόζει μια πρωτοποριακή τεχνική τεχνητής νοημοσύνης στο παιχνίδι Liar’s Poker, δοκιμάζοντάς την εναντίον μερικών από τους καλύτερους ανθρώπινους παίκτες που είναι επίσης επιτυχημένοι χρηματοοικονομικοί επενδυτές (Γνωστοποίηση: Γνωρίζω τους συγγραφείς και εμφανίζομαι στη μελέτη).

Το Liar’s Poker είναι το παιχνίδι τζόγου με υψηλά στοιχήματα που συνδέεται στενά με τις άγριες αίθουσες συναλλαγών της δεκαετίας του 1980 και των αρχών της δεκαετίας του 1990, το οποίο αποθανατίστηκε από το ομώνυμο best-seller βιβλίο του Michael Lewis.

Συχνά θεωρείται το παιχνίδι που εξαρτάται περισσότερο από τις δεξιότητες που απαιτούνται για να κερδίσει κανείς χρήματα από τις συναλλαγές στις χρηματοπιστωτικές αγορές. Το Liar’s Poker μπορεί επίσης να είναι ένα καλό μοντέλο για τους καθημερινούς μας διαγωνισμούς με την τεχνητή νοημοσύνη.

Το παιχνίδι παίζεται χρησιμοποιώντας τους σειριακούς αριθμούς των χαρτονομισμάτων του δολαρίου. Κάθε παίκτης έχει ένα χαρτονόμισμα, το οποίο έχει οκτώ ψηφία από το 0 έως το 9. Οι παίκτες κάνουν προσφορές, για παράδειγμα «Επτά 5» -που σημαίνει ότι υπάρχουν τουλάχιστον επτά 5 μεταξύ των σειριακών αριθμών σε όλα τα χαρτονομίσματα των παικτών.

Κάθε προσφορά πρέπει να είναι υψηλότερη από την προηγούμενη -είτε ένας υψηλότερος αριθμός (για παράδειγμα «οκτώ 3») είτε ο ίδιος αριθμός με ένα υψηλότερο ψηφίο («επτά 9»). Αντί να κάνει προσφορά, ένας παίκτης μπορεί να αμφισβητήσει την προηγούμενη προσφορά.

Ο γύρος τελειώνει όταν μια προσφορά αμφισβητηθεί από όλους τους άλλους παίκτες. Εάν η προσφορά του παίκτη είναι σωστή, όλοι οι άλλοι παίκτες πληρώνουν ένα ποντάρισμα -ας πούμε 100 δολάρια ο καθένας, αν και μερικές φορές χρησιμοποιούνται πολύ υψηλότερα πονταρίσματα, συμπεριλαμβανομένου του περίφημου χεριού των 10 εκατομμυρίων δολαρίων που απορρίφθηκε στο περιστατικό που αναφέρεται στον τίτλο του βιβλίου του Lewis -στον πλειοδότη.

Διαφορετικά, ο πλειοδότης πληρώνει το ίδιο ποντάρισμα σε κάθε έναν από τους αμφισβητίες. Υπήρχαν πολλοί ειδικοί κανόνες και παραλλαγές που εμφανίζονταν και εξαφανίζονταν μεταξύ των διαφορετικών αιθουσών συναλλαγών.

Η παράλληλη σχέση με τις χρηματοοικονομικές συναλλαγές είναι σαφής: κάθε συμμετέχων στην αγορά διαθέτει ορισμένες ιδιωτικές πληροφορίες και οι έμποροι στοιχηματίζουν στη συγκέντρωση όλων αυτών των πληροφοριών.

Οι έμποροι παρατηρούν τις προσφορές των άλλων μέχρι κάποιος να κάνει μια προσφορά υψηλότερη από οποιονδήποτε άλλο έμπορο, οπότε και ο έμπορος αυτός εκτελεί τη συναλλαγή. Κερδίζουν αν η συγκέντρωση των γνώσεων όλων των εμπόρων δικαιολογεί την τιμή. Χάνουν αν δεν τη δικαιολογεί.

Υπάρχουν επίσης παραλληλισμοί με τους καθημερινούς διαγωνισμούς με την τεχνητή νοημοσύνη. Ξέρετε τι θέλετε από την Amazon και τι είστε διατεθειμένοι να πληρώσετε, ενώ η Amazon ξέρει τι είναι διαθέσιμο και ποιο είναι το κόστος χονδρικής.

Ο καθένας από εσάς παρατηρεί τις ενέργειες του άλλου για να μαντέψει τις πληροφορίες του. Κερδίζετε αν πάρετε το καλύτερο προϊόν στην ελάχιστη διαθέσιμη τιμή. Η Amazon κερδίζει αν συλλέξει το μέγιστο ποσό που ήσασταν διατεθειμένοι να πληρώσετε για το προϊόν που είναι φθηνότερο στην προμήθεια.

Το άρθρο ρωτούσε αν η τεχνητή νοημοσύνη θα μπορούσε να νικήσει τους καλύτερους παίκτες του Liar's Poker. Αν μπορούσε, δεν υπάρχει μεγάλη ελπίδα για εμάς τους υπόλοιπους, ειδικά επειδή στους περισσότερους διαγωνισμούς μας με την τεχνητή νοημοσύνη, ο υπολογιστής γνωρίζει τους κανόνες και εμείς όχι.

Στην πραγματικότητα, συχνά δεν συνειδητοποιούμε καν ότι παίζουμε ένα παιχνίδι. Απλά πρέπει να ελπίζουμε ότι η τεχνητή νοημοσύνη ξέρει τι είναι καλύτερο για εμάς.

Η τεχνητή νοημοσύνη, με το όνομα Solly, έπαιξε 120 αγώνες σε περιβάλλον πολλαπλών παικτών εναντίον ανθρώπων. Τα αποτελέσματα δεν υποστηρίζουν την υπόθεση ότι ο Solly είναι χειρότερος από τους ελίτ ανθρώπους σε στατιστικά σημαντικό επίπεδο.

Δεν είναι σαφές ότι ο Solly είναι καλύτερος -αυτό θα απαιτούσε περισσότερα δεδομένα- αλλά είναι τουλάχιστον αρκετά κοντά στους καλύτερους ανθρώπους ώστε να κυριαρχεί έναντι των ερασιτεχνών παικτών. Επίσης, η τεχνητή νοημοσύνη βελτιώνεται ραγδαία, ενώ οι ελίτ παίκτες είναι πιθανό να βρίσκονται κοντά στην καλύτερη δυνατή ανθρώπινη απόδοση.

Μπορώ να προσφέρω μια πιθανή ακτίδα ελπίδας. Ως ένας από τους ανθρώπους που επιλέχθηκαν για να παίξουν με τον Solly, διαπίστωσα ότι έπαιζε πολύ διαφορετικά από τους κορυφαίους ανθρώπους.

Για παράδειγμα, οι καλοί ανθρώπινοι παίκτες επικεντρώνονται στο να αναγκάζουν τους άλλους να πάρουν δύσκολες αποφάσεις. Ο Solly ήταν πιο παθητικός και συχνά έπαιρνε σχεδόν άσκοπες προσωρινές αποφάσεις. Στον Solly άρεσε να ωθεί τους ανθρώπους να κάνουν προσφορές που θα μπορούσε να αμφισβητήσει, καθιστώντας τον ευάλωτο σε αμφισβητήσεις.

Ελπίζω -δεν μπορώ να πω ότι ξέρω- ότι η απόδοσή του ενισχύθηκε από την άγνοιά μου για τη στρατηγική του και ότι με περισσότερους αγώνες θα μπορούσα να βρω τρόπους να εκμεταλλευτώ τις αντιδράσεις του. Φυσικά, ο Solly μπορεί να πει το ίδιο για μένα.

Η άλλη πιθανή λύση είναι να έχουμε όλοι τη δική μας τεχνητή νοημοσύνη για να νικήσουμε την τεχνητή νοημοσύνη των άλλων. Οι μέρες που οι άνθρωποι συναλλάσσονταν απευθείας με την Amazon, τις κυβερνητικές γραφειοκρατίες και τις εταιρείες ιατρικής ασφάλισης μπορεί να είναι μετρημένες.

Επομένως, είτε βελτιώστε τις δεξιότητές σας στο Liar's Poker και προσπαθήστε να νικήσετε την τεχνητή νοημοσύνη -όπως ο John Henry που συναγωνίστηκε το ατμοκίνητο τρυπάνι- είτε αρχίστε να ψάχνετε για ισχυρή τεχνητή νοημοσύνη που θα πολεμήσει για εσάς.

*Ο Aaron Brown είναι πρώην επικεφαλής έρευνας χρηματοπιστωτικών αγορών στην AQR Capital Management. Είναι επίσης ενεργός επενδυτής σε κρυπτονομίσματα και έχει επενδύσεις επιχειρηματικού κεφαλαίου και συμβουλευτικές σχέσεις με εταιρείες κρυπτονομισμάτων.

Πηγή: skai.gr

Διαβάστε τις Ειδήσεις σήμερα και ενημερωθείτε για τα πρόσφατα νέα.

Ακολουθήστε το Skai.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.