AI撲克對決 誰會贏? GPT-4等主流模型牌桌爭霸即將上演最先出現(xiàn)在GGPoker | GG撲克亞洲中文旗艦站 | WSOP世界撲克大賽。
]]>AI撲克對決 誰會贏? GPT-4等主流模型牌桌爭霸即將上演,GG撲克(GGPoker)整理報導(dǎo),如今,人工智能無處不在——以這句話或類似表述開頭的文章也隨處可見。說實話,你并不需要我來解釋近年來大型語言模型的崛起。很可能,你正在閱讀本文的設(shè)備上,就能直接訪問這類工具。
像Grok、ChatGPT、Gemini這樣的消費級人工智能產(chǎn)品,已經(jīng)以數(shù)不清的方式融入了我們的生活。無論是求職者還是雇主,學(xué)生還是老師,每個人都很樂意把某些任務(wù)交給AI去完成。
這些模型有好壞之分嗎?
按理說應(yīng)該是有的——它們由不同的團隊開發(fā),目標(biāo)也常常不同。你具體使用哪一款,可能取決于獲取途徑、成本、具體需求,或者僅僅是用習(xí)慣了。但從普通用戶的角度來看,它們往往大同小異。
不過,你是否曾想過,在牌桌上,哪家大型語言模型的表現(xiàn)會更勝一籌?

來自俄羅斯、現(xiàn)居葡萄牙的IT產(chǎn)品經(jīng)理Max Pavlov就思考過這個問題。本月晚些時候,他將通過一場前所未有的超長撲克對局來檢驗這些AI的實力。屆時,主流消費級大模型將同臺競技,一決高下,看看誰技高一籌,誰又稍遜一籌。
這場即將到來的“AI 撲克大戰(zhàn)”正是由這位常駐里斯本的Pavlov策劃的
牌局將于10月27日開始
“我一直在研究這個游戲,并思考如何能讓這種研究更有效,”Pavlov解釋道。“我對求解器很著迷,但可能有點難以駕馭,所以一直嘗試為自己制定一些簡單的策略——目前來看,求解器對我來說可能有些大材小用了。”
“我考慮過用大語言模型來幫忙,但似乎公認(rèn)的一點是,使用時你必須非常小心,因為你可能會學(xué)到一些壞習(xí)慣,而且它們的分析并不總是一致的。”
“我找不到關(guān)于哪款大語言模型最適合我需求的研究,所以決定自己組織一場比賽來尋找答案。”
這場錦標(biāo)賽將于10月27日至11月3日在PokerBattle AI網(wǎng)站上線上舉行。所有牌局、結(jié)果以及每位AI牌手的推理過程都將公之于眾。
與所有精彩的電視撲克節(jié)目一樣,具體參賽“選手”將臨近比賽時最終確定,但我們預(yù)計主流大模型都會參與。Gemini、Claude、OpenAI、DeepSeek和Grok預(yù)計都將在這場虛擬牌局中占據(jù)一席之地,爭奪“最強AI牌手”的稱號。

牌桌上會出現(xiàn)一些熟悉的名字(盡管不是面孔)
然而,與大多數(shù)撲克游戲不同,這些“牌手”永遠不需要休息。同樣,與其他電視撲克比賽不同的是,這場比賽的籌碼完全是虛擬的。開發(fā)這些大語言模型的公司并未參與此次比賽,也不會為它們的“代表”提供資金。
它們也不會針對比賽對模型進行任何調(diào)整或優(yōu)化——每款大語言模型都將以其當(dāng)前、任何人都能使用的狀態(tài)參賽,并且會接收到完全相同的指令。
具體細(xì)節(jié)可能在比賽臨近時有所調(diào)整,但目前計劃是:在這場無限注德州撲克現(xiàn)金局/錦標(biāo)賽混合賽中,每位“牌手”的初始資金為10萬美元游戲幣,盲注級別為 10/20,起始記分牌為2000。當(dāng)記分牌量低于50個大盲注時,系統(tǒng)會自動補足;當(dāng)籌碼輸光時,則會自動重置(直到初始資金耗盡)。盲注級別不會上漲。
觀眾不僅可以觀看比賽、閱讀每位牌手的推理,還能獲取關(guān)鍵資料統(tǒng)計。
“我會分享諸如入池率、翻牌前加注率、3-Bet率、持續(xù)下注率等數(shù)據(jù),”Pavlov確認(rèn)道。“我們是在線比賽,何樂而不為呢?”
每位牌手在多個同時進行的牌桌上的數(shù)據(jù)都將公開。

(屆時將提供類似這樣的統(tǒng)計資料,上圖來自快速演示)
“它們肯定會犯很多錯誤”
Pavlov坦然承認(rèn)自己只是一名休閑撲克玩家——盡管他最近在羅茲瓦多夫舉辦的 WSOP歐洲站比賽中首次進入了錢圈——他推出這個項目是出于對撲克的熱愛和著迷,而非進行嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)研究。
“我更傾向于不把這個實驗看作一個純粹的基準(zhǔn)檢驗,”他說。“我希望能積累1萬到1萬5千手牌,但即便如此,手?jǐn)?shù)仍然不足以鐵定證明哪一個模型更優(yōu)。不過,這應(yīng)該足以分析它們推理過程中的優(yōu)缺點了。”
比賽中使用的隨機數(shù)發(fā)生器、游戲邏輯和大部分接口都來自現(xiàn)成的代碼,其中很多是由加拿大一個研究博弈論的學(xué)術(shù)團隊開發(fā)的。
然而,用于觀看和分析比賽的框架則是他自己完成的。接口中一個引人入勝的設(shè)計是,每位“牌手”都會闡述其每一步行動背后的理由,讓我們得以窺見其決策過程。

每個決策背后的理由都將實時顯示
這種透明度只是Pavlov的項目與高級撲克AI機器人(如Pluribus和Libratus)的眾多不同之處之一,后者是過去曾與人類對手交鋒的專用程序。
“例如,你可以把Libratus看作一個專門為撲克訓(xùn)練的特化機器人,”Pavlov說,“因此它的策略更接近博弈論最優(yōu)解。而且它是個‘黑匣子’——輸入牌局狀態(tài),它輸出決策,僅此而已。”
“相反,大語言模型的訓(xùn)練目標(biāo)截然不同。你可以把它們想象成強化版的‘自動補全’。它們在推理任務(wù)上已經(jīng)變得非常出色——例如,在數(shù)學(xué)奧林匹克競賽中,它們的表現(xiàn)已經(jīng)超過了大多數(shù)人類——但我完全不指望它們能打出博弈論最優(yōu)解。”
“在它們的訓(xùn)練數(shù)據(jù)中,會包含博弈論的信息,包括撲克專用的博弈論。它們幾乎是在互聯(lián)網(wǎng)上的所有信息上訓(xùn)練的,所以會接觸到論壇帖子、牌局評論、書籍文獻和撲克博客中的內(nèi)容。”
“但它們肯定會犯很多錯誤。它們只是在輸出下一個詞元,下一個詞。我好奇的是,它們將如何生成簡單、易懂的策略。”
牌手會在比賽中進步嗎?
如果AI牌手不太可能打出博弈論最優(yōu)撲克,那么它們玩出剝削性風(fēng)格的可能性又有多大?AI牌手是否會隨著比賽進展而調(diào)整策略?這是本實驗中有待觀察的眾多看點之一。
“牌桌上的很多有用信息并非來自正在進行的這手牌,而是來自與特定對手之前的互動,”Pavlov解釋道。“它們需要一種方法來獲取之前牌局的信息,并將其融入當(dāng)前牌局的語境中。當(dāng)然,我可以將過去100手牌的完整描述放入上下文窗口中,并期望它們能借此做出些精彩的決策。”
“筆記功能是現(xiàn)成的,為何不用呢?這可能意味著信息量過大,但也確實可能為比賽增加一個維度。”
觀眾將能夠追蹤數(shù)千手牌的進程
使用現(xiàn)成的技術(shù),如開源隨機數(shù)發(fā)生器、現(xiàn)成的接口和筆記功能,正是這個項目的特色所在。這項實驗背后沒有巨額資金,沒有專門的撲克程序,也沒有實驗室環(huán)境;它僅僅是對我們當(dāng)下都能接觸到的工具的一次測試,但它很可能成為指引撲克技術(shù)未來發(fā)展方向的一個路標(biāo)。
恰如其分地體現(xiàn)了該實驗的“自己動手”精神,Pavlov獨立完成了整個項目的創(chuàng)建,盡管他本人并非開發(fā)者。嗯,幾乎是獨立完成的。
“在某種程度上,這也證明了即使你不是開發(fā)者,也能構(gòu)建出東西,”Pavlov說。“我是用AI來構(gòu)建它的。”
GG撲克 (ggpokerasia.com) ,為 GGPoker 亞洲中文官方平臺, GGPoker 針對全亞洲玩家推出中文版官方APP下載,與24小時中文客服在線服務(wù), GG撲克提供您最專業(yè)的國際賽事競技平臺,讓 GGPoker亞洲玩家得以與全球GGPoker玩家一同享受競技時光。
看更多 GG撲克技術(shù)文章
AI撲克對決 誰會贏? GPT-4等主流模型牌桌爭霸即將上演最先出現(xiàn)在GGPoker | GG撲克亞洲中文旗艦站 | WSOP世界撲克大賽。
]]>