OpenAI ar ievērojamu pārsvaru triumfē par Grok pokerī

6. decembris, 2025

OpenAI o3 uzvar eksperimentālā pokera turnīrā, demonstrējot spēju pielāgoties, analizēt un pieņemt lēmumus neskaidros apstākļos.

Vēl iepriekš nepieredzētā digitālajā duēli, deviņi pasaulē jaudīgākie lielie valodas modeļi piecu dienu garumā sacentās augstu likmju pokera mačā.

OpenAI o3, Anthropic Claude Sonnet 4.5, X.ai Grok, Google Gemini 2.5 Pro, Meta Llama 4, DeepSeek R1, Moonshot AI Kimi K2, Mistral AI Magistral un Z.AI GLM 4.6 izspēlēja tūkstošiem Texas Hold’em roku pie galdiem ar 10 un 20 eiro likmēm, katram modelim sākot ar 86 000 eiro virtuālo banku.

Pēc nedēļu ilgas spēles OpenAI o3 izstājās no turnīra ar 31 506 eiro lielu peļņu. Trofeju nevienam nepiešķīra, bet iespēju lielīties gan.

Eksperimentu PokerBattle.ai vadīja mākslīgais intelekts (MI). Katrs spēlētājs saņēma vienu un to pašu sākuma uzdevumu, un viss balstījās tīrā stratēģijā, ja par stratēģiju var saukt tūkstošiem mikro-lēmumu, ko pieņem mašīnas, kas patiesībā nezina, ko nozīmē uzvarēt, zaudēt vai kauliņos izgāzties ar septiņnieku–divnieku.

Šis tehnoloģiju eksperiments nesa negaidīti daudz atklāsmju. Labākie modeļi nepārtraukti pielāgojās, veidoja pretinieku uzvedības modeļus un mācījās reāllaikā, kā orientēties neskaidrībā. To spēlēšanas veids nebija nevainojams, taču bieži vien pietuvojās pieredzējušu spēlētāju lēmumu līmenim.

OpenAI o3 ātri pierādīja, ka tam ir visstabilākā pieeja. Tas ieguva trīs no pieciem lielākajiem bankiem un stingri pieturējās pie teorētiski pareizas spēles pirms flopa. Anthropic Claude un X.com Grok ieņēma nākamās vietas ar ievērojamu peļņu, attiecīgi 28 887 un 24 727 eiro.

Tikmēr Llama zaudēja visu savu banku un priekšlaicīgi izstājās no spēles. Pārējie modeļi nostājās kaut kur starp triumfētājiem un absolūto zaudētāju. Google Gemini nopelnīja pieticīgu peļņu, bet Moonshot Kimi K2 zaudēja tik daudz žetonu, ka turnīru noslēdza ar vien 73 873 dolāriem.

MI pokers kalpo par efektīvu modeļu testēšanas veidu

Pokers jau sen tiek uzskatīts par vienu no labākajiem vispārējā mākslīgā intelekta testiem. Atšķirībā no šaha, pokers pieprasa prasmi izdarīt secinājumus nenoteiktības apstākļos. Tas atspoguļo reālās dzīves lēmumu pieņemšanu – sākot no biznesa sarunām līdz militārajām stratēģijām.

Viens no konsekventākajiem secinājumiem turnīrā bija tas, ka lielākā daļa botu spēlēja pārāk agresīvi. Tie izvēlējās darbību bagātas stratēģijas arī brīžos, kad saprātīgākais lēmums būtu bijis izstāties. Tie mēģināja uzvarēt lielos bankus biežāk, nekā mēģināja izvairīties no zaudējumiem.

Un tie bija ļoti vāji “blefotāji”. Tas nebija tāpēc, ka tie necentās melot, bet tāpēc, ka blefi bieži radās no kļūdainiem situācijas novērtējumiem, nevis no gudras maldināšanas.

Tomēr MI rīki kļūst arvien viedāki un viedāki. Tie ne tikai atkārto informāciju, ko reiz lasījuši, bet gan veic secinājumus situācijās, kurās ir pastiprināts spiediens, un mācās “nolasīt telpu”. Tas vienlaikus atgādina, ka pat jaudīgi modeļi nav bez trūkumiem. Situāciju pārpratumi, nepamatoti secinājumi un aizmirsta pašu “pozīcija” nav tikai pokera problēmas.

Jums, iespējams, nekad nenāksies sēdēt pie viena pokera galda ar MI modeli, taču, visticamāk, Jūs sastapsieties ar kādu, kas pieņem lēmumus, kuriem ir nozīme. Šī spēle parādīja tikai nelielu ieskatu tajā, kā tas varētu izskatīties nākotnē.

Avots: TechRadar