2020: Rise of the Machines

"Let's build your own Dreams Together"

2020: Rise of the Machines
door James Grosjean Reken me tot de Netflix-drones die van The Queen's Gambit (2020) hielden, maar ik ben altijd een schaakliefhebber geweest. Tijdens mijn studententijd heb ik waarschijnlijk duizend chocoladecroissants gegeten terwijl ik zag hoe de eigenzinnige, magnifieke Murray Turnbull (ook bekend als 'The Chess Master') het opneemt tegen alle bezoekers op het stadsplein - […]

door James Grosjean Reken me tot de Netflix-drones die van The Queen's Gambit (2020) hielden, maar ik ben altijd een schaakliefhebber geweest. Tijdens mijn studententijd heb ik waarschijnlijk duizend chocoladecroissants gegeten terwijl ik zag hoe de eigenzinnige, magnifieke Murray Turnbull (ook bekend als 'The Chess Master') het opneemt tegen alle bezoekers op het stadsplein - '$ 2, restitutie als je wint of gelijkspel.' Het was voor mij een eer om een ​​foto te maken van de grote Karpov, omlijst door het glas in lood van Memorial Hall, toen hij een simul van 40 borden op de campus deed. Ik maakte deel uit van de studentenpers toen Kasparov zijn toen controversiële uitspraak deed dat een computer grootkampioen zou zijn voordat een vrouw dat zou zijn. Ik bewaarde het debat over Kasparovs mogelijke vrouwenhaat voor een ander forum en een andere dag, en ik vatte zijn verklaring op als slechts een projectie gebaseerd op empirische observatie van de schaakgemeenschap. De participatie van vrouwen is altijd laag geweest en niet zinvol toenemend, terwijl de computers al sterk waren en snel sterker werden. De machines zullen een nieuwe gelijkheid inluiden - waar alle geslachten verpletterd worden als mieren. De stelling van Zermelo vertelt ons dat een spel met volledige informatie (beide spelers kunnen alle stukken op het schaakbord zien), dat eindig is (het spel ZAL eindigen na een aantal zetten), een oplossing heeft, en dat als beide partijen dit spelen optimale oplossing, dan heeft elk spel hetzelfde resultaat. Schaken is zo gecompliceerd dat we niet zeker weten wat het resultaat zou zijn, maar we denken dat wit elke keer zou winnen, in welk geval er geen zwart antwoord is dat de uitkomst kan veranderen. Het spel van Connect Four valt ook onder de stelling van Zermelo, en de analyse heeft uitgewezen dat in dat spel de stiekeme zus altijd wint als ze als eerste gaat en optimaal speelt. Als je een AP bent die QGambit leuk vond, en honger hebt naar meer inhoud tijdens deze oneindige pandemie, dan is je volgende opdracht om AlphaGo te bekijken, een documentaire over de opkomst van computers in het oude spel Go, dat ingewikkelder is dan schaak. Geen grapje, deze film is een tranentrekker voor mensen die in dit vakgebied geïnteresseerd zijn en het intense emotionele drama van de kampioen van de mensheid, Lee Sedol, waarderen - het beste dat het ooit heeft gedaan. De film legt Sedol's leed, moed, genialiteit en dan nederigheid vast, aangezien hij beseft dat deze wedstrijd tegen de machine niet alleen een spel is, maar het ontstaan ​​van een nieuwe wereldorde. Sedol was geen programmeur en wist niet wat hij te wachten stond, maar als expert in zijn vak voelde hij op het bord het meedogenloze, ondoordringbare gewicht van zijn tegenstander. Nadat je van AlphaGo hebt genoten, raad ik je aan (eigenlijk raadt Google aan) dat je een deel van de pokermatch tussen de old-school Dan Negreanu en de moderne computerkloon Doug Polk bekijkt. De beste speler op aarde is de machine, dus een slim mens als Polk bootst de strategie van de machine na. Aanpassen of sterven. Ik heb eens een korte gedachtewisseling gehad met Howard Lederer. Ik vroeg hem naar bots op de pokersites. Hij verwierp het probleem door te zeggen: “Poker is niet zoals schaken. Poker is een spel met onvolledige informatie. Computers zijn daar niet goed in. " Ik kon niet zeggen of hij een naïeve idioot was of een oplichter voor Full Tilt Poker. Hoe dan ook, ik wilde dat gesprek vijftien jaar geleden niet voortzetten. Maar nu zijn we hier, in 2021, en is het tijd om dat gesprek voort te zetten, door die eerste misvatting over de GTO-computers (speltheorie optimaal) te weerleggen, en alle andere overlappende misvattingen die de pokerdinosaurussen en zelfverklaarde pokerspelers zijn wanhopig vasthoudend aan: Fallacy # 1: Computers zijn niet goed in games met onvolledige informatie. Dit is gewoon onwetend. Het is waar dat de stelling van Zermelo niet van toepassing is op spellen als poker. Voor poker zijn er ANDERE stellingen die in feite zeggen dat er een oplossing voor het spel is, en een computeroplossing zal over het algemeen 'gemengde strategieën' omvatten, wat betekent dat er een willekeurige component in de strategie zit (zoals het aanroepen van schaar met waarschijnlijkheid 1/3 ). Computers zijn redelijk goed, beter dan mensen, in het berekenen van verwachtingen over probabilistische uitkomsten, vooral wanneer de kansverdelingen precies bekend zijn, zoals bij kaartspellen. De computer weet bijvoorbeeld precies wat de kans is om een ​​backdoor Flush te trekken en welke pot odds hij nodig heeft om jagen te rechtvaardigen. Hoewel poker onvolledige informatie bevat, is heads-up no limit poker een eenvoudiger spel dan Go, ook al bevat Go volledige informatie (algemeen bekende informatie). Fallacy # 2: De superioriteit van de computer komt doordat ik elke hand die ik heb gespeeld kan onthouden en zich daarop kan aanpassen. Terwijl een "uitbuitende bot" inderdaad uw eerdere spel analyseert en zich aanpast aan waargenomen zwakheden, is een standaard GTO-bot (die we vroeger een "Nash-bot" noemden) het pokerequivalent van BS bij blackjack. De GTO-strategie verandert niet, ongeacht hoe u eerdere handen speelde. Het heeft die informatie niet nodig, en het kan me niet schelen. Fallacy # 3: De GTO-oplossing is alleen "correct" als je tegen een andere GTO-bot speelt, want dat is wat werd aangenomen toen de bot werd ontwikkeld - de bot "leerde" door tegen zichzelf te spelen. Dit is fout. "De bot die tegen zichzelf speelde om poker te leren" is een verkeerde karakterisering van het ontwikkelingsproces. De media hype zijn clickbait om elk resultaat in computergebruik als een generatiedoorbraak te laten klinken, met een beroep op HAL en Skynet. Een GTO-bot weet niets van poker. Het afleiden van de GTO-strategie is een rekenoefening, mogelijk gemaakt door de enorme hoeveelheid geheugen en CPU-snelheid die beschikbaar is in de huidige computers en de ontwikkeling van een efficiënt algoritme om de berekening uit te voeren ("spijtminimalisatie"). We hebben het algoritme nooit beschreven als 'machine learning' of 'AI' - we noemden het gewoon 'heuvelklimmen' of 'maximalisatie' of 'optimalisatie'. Bij elke stap van het iteratieve algoritme heeft de computer de huidige strategie voor elke stoel aan tafel in ontwikkeling, en deze huidige strategie kan in de volksmond worden omschreven als 'zichzelf', zoals in: 'PokerSnowie speelt tegen zichzelf'. Maar het is eigenlijk gewoon een iteratie op het pad van het beklimmen van de heuvel om op de top samen te komen - een optimale strategie voor poker. Dat optimum gaat niet uit van een bepaalde tegenstander. Er zijn andere manieren waarop we de oplossing hadden kunnen berekenen (hoewel misschien niet zo snel), en het zou net zo geldig zijn. Deze GTO-strategie is "The Book" voor poker, en het zou nooit in het nadeel zijn, ongeacht de tegenstander. Er is geen strategie die er een voorsprong op kan krijgen. Fallacy # 4: De GTO-bot gaat ervan uit dat ik op een bepaalde manier speel, maar ik mis het door mijn off-suit 72 uit positie te spelen. Mis. De GTO-bot neemt niets aan over hoe je speelt. Het kan me niet schelen. Het is onverslaanbaar tegen ELKE tegengestelde strategie. Stel je voor dat je een aanstaande strijd tegen Floyd Mayweather hebt, en je zegt: “Floyd verwacht dat ik in een onberispelijke fysieke conditie zal verschijnen. Hij gaat ervan uit dat ik de komende zes maanden hard ga trainen. Ik zal hem voor de gek houden - ik kijk gewoon Netflix en eet de komende zes maanden donuts. " Floyd heeft geen idee hoeveel je gaat trainen. Hij weet dat als hij zelf in perfecte vorm verschijnt, geen enkele tegenstander een voordeel tegen hem kan krijgen. Is het logisch om te zeggen: “De bot gaat ervan uit dat ik goed zal spelen? Ik mis de bot door slecht poker te spelen! " Ja, je hebt ze zeker laten zien! Fallacy # 5: Ik ontdekte een zwakte - als ik zo en zo heb, vanuit die en die positie, dan zou de bot X moeten doen, maar het doet Y. Fout. De bot heeft geen zwakte. Je kijkt naar een bepaalde hand die je vasthoudt en een bepaald resultaat, maar op basis van de waarschijnlijkheid dat je in dat scenario zit, en alle mogelijke handen die je zou kunnen vasthouden vanuit het oogpunt van de bot, is het spel correct en kun je Ik vind daar geen gat. Het is erg gevaarlijk om alleen naar een toneelstuk te kijken. De bot maakt bewegingen om zijn range in evenwicht te brengen, zodat je niet kunt beitelen in andere situaties, of als er andere kaarten op de river komen. Als je het niet ziet, zit de fout in je eigen pokerdenken, niet in die van de bot. Fallacy # 6: Als ik het een tijdje speel, zal ik uitzoeken hoe het speelt en een zwak punt vinden. Mis. Er is geen zwakte. In feite zouden we de strategie van de bot kunnen publiceren, en het zou geen enkel verschil maken. Als ik je vertel dat ik Scissors, Rock en Paper ga spelen met een kans van 1/3 op elk, dan geeft het feit dat je mijn strategie kent je geen mogelijkheid om een ​​voorsprong te nemen. Er is geen achilleshiel. Fallacy # 7: De Heads-Up Limit-bots die in casino's werden geïntroduceerd, waren zeer goed te verslaan, dus waarschijnlijk zijn GTO-bots dat ook. Dit is geen zinvolle vergelijking. Sommige casinobots kregen de opdracht om hun A-spel niet te spelen, omdat het te sterk was tegen gemiddelde mensen. Als het casino de bot instelt om zijn B-spel te spelen, om bijvoorbeeld een voordeel van 5% te behalen tegen de meeste spelers, dan zou een echt goed mens geld hebben kunnen verdienen tegen die GTSO-bot (speltheorie suboptimale bot). Maar dat is een ander probleem. Het maakt me niet uit wie je bent: als je heads-up speelt tegen PokerSnowie, verlies je. Fallacy # 8: GTO-bots kunnen zwakke spelers verslaan, maar de bots zullen problemen krijgen met toptegenstanders zoals Phil Ivey of Dan Negreanu. Mis. Het mooie van een GTO-bot is dat het niet uitmaakt wie de tegenstander is. In het beste geval zou iemand zelfs met de bot kunnen spelen. Een ring van GTO-bots zou als een gootsteen zijn, waarbij het geld met de klok mee de knop najaagt en het midden van de tafel leegloopt vanwege de hark. Een praktisch probleem dat echte profs hadden, was beslissen wanneer hun vaardigheid voldoende was om naar de volgende hogere inzetten te gaan, waar de spelers vermoedelijk sterker waren. Maar nu kan een speler die de GTO-strategie nabootst, aan elke tafel ter wereld plaatsnemen, bij elke inzet, en hoeft hij zich geen zorgen te maken dat hij de vis is. In het beste geval zou het spel gelijk zijn (buiten de rake), en in de praktijk levert een GTO-strategie een aanzienlijk voordeel op tegen iedereen die je in het wild tegenkomt. Fallacy # 9: Dan Negreanu is een oude pokerprof met N bracelets, dus hij zal computerneten verpletteren zoals Doug Polk die de nuances van echt poker niet begrijpt. Als een man als Polk gewoon 'de hitlijsten' uit zijn hoofd leert en de GTO-strategie nabootst, hoeft hij helemaal niets te begrijpen. Hij hoeft niet te weten wat het woord "nuance" betekent. Pokerervaring van pro's zoals Negreanu is wat hen in staat stelde om het beste spel te vinden in scenario's die ingewikkeld waren. Die ervaring is achterhaald nu de computers net hebben berekend wat de juiste plays zijn. Misschien stelde de ervaring van een speler hem in 1950 in staat vast te stellen dat 14 v T raken beter was dan staan. Toen de Four Horsemen eenmaal de BS-chart hadden berekend, werd die blackjack-ervaring irrelevant. Het Boek maakt ervaring overbodig. Nu is Doug Polk geen GTO-bot. Hij is een topprof die GTO-strategieën toepast. Negreanu's enige kans om Polk te verslaan is dus als Polk's emulatie van GTO niet nauwkeurig is, en als de holes groot genoeg zijn voor Negreanu om ze te vinden en te exploiteren. Ik betwijfel het. Een andere longshot zou zijn als ze live spelen, en als Polk fysieke aanwijzingen heeft die informatie over zijn gesloten kaarten weggeven, en als Negreanu hem op die manier kan lezen. Of als Polk tilt-problemen heeft en van GTO begint af te wijken als hij een slechte reeks kaarten heeft. Niet aannemelijk. Of misschien is het spel zo kort dat Negreanu geluk heeft in een kleine steekproef. Na tegen AlphaGo te hebben gespeeld, verhoogde Lee Sedol zijn spel en begon iedereen te verpletteren (niet dat hij dat nog niet had gedaan), maar trok zich toen terug uit het spel! Hij gaf toe dat hij was verslagen (wat een concept!), En dat geen mens ooit de beste speler op aarde, AlphaGo, zou uitdagen. We zullen zien of Negreanu dezelfde openbaring zal hebben. Een recente tweet doet me afvragen, omdat Negreanu een botspel in twijfel leek te trekken en suggereerde dat er een dunne lijn is tussen genialiteit en donkishness. Ik denk dat hij nog steeds hoopt dat er een fout zit in de GTO-strategie. Die is er niet. Laatst hoorde ik dat Negreanu zijn achterstand in de wedstrijd aan het inhalen was, en er is enige aanwijzing dat een van de redenen is dat, tot zijn eer, Negreanu oefent met PokerSnowie en zich aanpast! Als Negreanu snel de GTO-strategie kan leren, dan zou hij het speelveld kunnen egaliseren, wat een geweldige prestatie zou zijn. De enige manier waarop een dinosaurus kan overleven, is door te evolueren. We zien het in 2021. [Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]
บ่อน คาสิโน สล็อต คาสิโน ออนไลน์ เกมรอยัล คาสิโน คาสิโน ฟรีเครดิต 2020 เกม คาสิโน ปอยเปต

Leave a Reply

Your email address will not be published. Required fields are marked *