GTO แนวคิดเกี่ยวกับการเล่นที่เหมาะสมที่สุด

โป๊กเกอร์พัฒนาไปอย่างรวดเร็วภายในไม่กี่ปีที่ผ่านมา จนกระทั่งแหล่งข้อมูลด้านกลยุทธ์ต่างๆที่มี ไม่ว่าจะเป็นหนังสือ วิดีโอ หรือ เนื้อหาดิจิตอลทั้งหลาย เริ่มจะล้าสมัยไปเรื่อยๆ

การเปลี่ยนแปลงที่ชัดเจนที่สุดคือการที่ผู้เล่น old-school (สมัยเก่า) เคยทำเงินได้หลายล้านจากการเล่นแบบเน้นโจมตีจุดอ่อนคู่แข่ง (หรือที่เรียกว่าการเล่นแบบ exploit) ขณะที่ผู้เล่นเกือบทั้งหมดที่ทำเงินล้านได้ในตอนนี้ จะใช้หลักการเล่นโป๊กเกอร์แบบทฤษฎีเกม (หรือ game theory) โดยมีการผสมการเล่นแบบ exploit เข้าไปบ้าง เพื่อยกระบบเกมการเล่นไปอีกขั้น

ในบทความนี้ เราจะพูดกันถึง

  • พื้นฐานของทฤษฎีเกมกับโป๊กเกอร์
  • ทำไมเราจึงควรใช้กลยุทธ์ที่ได้รับอิทธิพลจากทฤษฎีเกม
  • ตัวอย่างจาก Doug Polk ที่ชี้ให้เห็นความสำคัญของทฤษฎีเกม
  • ข้อดี 4 เรื่องจากการใช้กลยุทธ์ที่ได้รับอิทธิพลจากทฤษฎีเกม

มาเริ่มกันเลย!

ทฤษฎีเกมกับโป๊กเกอร์

John Nash ได้พัฒนาแนวคิดทฤษฎีเกมขึ้นมาเป็นสาขาหนึ่งของวิชาคณิตศาสตร์ ที่ม.ปรินซตัน ในช่วงปี 1950 ขณะที่โป๊กเกอร์ได้รับความนิยมมากขึ้นเรื่อยๆในช่วง 15 ปีที่ผ่านมา ผู้เล่นก็มีการพัฒนาขึ้นอย่างรวดเร็ว จนถึงจุดที่เป็นเรื่องยากที่จะเอาชนะเกมนี้ได้อย่างสม่ำเสมอ โดยไม่มีความรู้เรื่องทฤษฎีเกมในมุมความรู้ของเรา

ความเข้าใจทางคณิตศาสตร์ทำให้ความซับซ้อนของโป๊กเกอร์ทวีความลึกยิ่งขึ้น ตั้งแต่เรื่องของ hand ที่เหมาะจะ open จากแต่ละตำแหน่ง ไปจนถึงการ check ที่ river เมื่อมี small pot ที่ดูเหมือนจะไม่สำคัญ แต่ทุกการตัดสินใจล้วนส่งผลต่ออัตรากำไรของเรา ในฐานะนักเล่นโป๊กเกอร์ทั้งสิ้น

สิ่งนี้สามารถวัดได้จากค่า “ผลตอบแทนคาดหวังระยะยาว” (Expected Value : EV) ถ้าการตัดสินใจนั้นทำให้ได้กำไร เราจะเรียกว่าเป็นการตัดสินใจที่ +EV แต่ถ้าขาดทุน เราจะเรียก -EV

ตัวอย่างที่เป็นเรื่องพื้นฐานที่สุดในการใช้กลยุทธ์แบบสมดุลในทางทฤษฎี คือเมื่อผู้เล่นใช้ open-rasing range 

รูปล่างนี้คือตัวอย่างของ opening range ทั่วไปสำหรับผู้เล่นตำแหน่ง UTG (เริ่มเล่นคนแรก)

poker game theory optimal utg strategy

ชัดเจนว่า การ raise ทุก hand ที่ strong มากๆ ในตำแหน่ง UTG เป็นการเล่นที่ได้กำไรอยู่แล้ว แต่ถ้าเราเล่นเฉพาะ hand พวกนั้นอย่างเดียว ก็จะทำให้เราถูกเดาทางง่ายเกินไป การ raise กับ hand ที่มีโอกาสได้กำไรน้อยลงมาหน่อย อย่างเช่น 9♠8♠ หรือ 6♥6♣ จะสร้างสมดุลให้กับ opening range ของเรา ซึ่งจะช่วยให้เราเป็นผู้เล่นที่เล่นด้วยยากขึ้น การเล่นแบบนี้ยังสามารถทำให้เราติด hand ที่ strong มากๆ เมื่อ flop ออกมาเป็นไพ่ต่ำๆกลางๆ อย่างเช่น 7 ♠ 6 ♠ 5 ♥

ทำไมถึงต้องใช้กลยุทธ์โป๊กเกอร์ GTO (Game Theory Optimal : กลยุทธ์การเล่นที่เหมาะสมที่สุดตามทฤษฎีเกม)?

เราอาจจะสงสัยว่า ทำไมการใช้กลยุทธ์ที่ได้รับอิทธิพลจากทฤษฎีเกมถึงเป็นเรื่องที่สำคัญ ในเมื่อส่วนใหญ่แล้วเราจะได้เงินจากการ exploit ผู้เล่นที่ weak กว่า หรือผู้เล่นที่ไม่ค่อยใส่ใจในการเล่นเพียงพอ

มีเหตุผลที่สำคัญอยู่ 2 ข้อ คือ :

  • ด้วยการใช้กลยุทธ์แบบ GTO ด้วยการเล่นให้สมดุล เราจะยังได้กำไรในระยะยาวอยู่ดี ไม่ว่าเราจะเจอผู้เล่นที่มีทักษะสูงขนาดไหนก็ตาม
  • การปรับตัวเพื่อที่จะตอบโต้คู่แข่งของเราจะทำได้ง่ายขึ้น ถ้าเรามีกลยุทธ์ที่เป็นฐานตรงกลางว่าจะปรับไปทางไหน (จะอธิบายเพิ่มเติมอีกครั้ง)

ช่วงเวลาที่เรามารีวิว hand ของตัวเอง ควรจะใช้การวิเคราะห์วิธีการเล่นของ hand อย่างเป็นกลางจากมุมมองของ GTO ซึ่งจะทำให้เราตัดสินใจได้ว่า เรากำลังเล่นอยู่ใน range ที่สมดุลอยู่หรือไม่ นอกจากนี้ ในมุมมองจาก GTO เราควรจะต้องรู้ว่าควรจะเล่นอย่างไรกับ hand ใดๆในแต่ละสถานการณ์ ไม่ใช่แค่กับไพ่ 2 ใบที่เรากำลังถืออยู่ ดังนั้น ระหว่างช่วงเวลารีวิว hand เราควรจะถามตัวเองว่า ถ้าเราถือ hand อื่นๆ เราควรจะเล่นอย่างไรไว้ด้วย 

ในสถานการที่เราตั้งใจ bet เพื่อเอา value เราก็ควร bet เพื่อ bluff กับ hand อื่นๆใน range ของเราด้วย เพื่อให้คู่แข่งไม่แน่ใจว่าเรา bet เพื่อ value หรือ bluff กันแน่ และถ้าเรามีเฉพาะ value bet ตอน river โดยไม่ bluff เลย คู่แข่งของเราจะสามารถหมอบได้อย่างคุ้มค่าทุกครั้งเพราะรู้ว่าเรามี hand ที่ดีกว่าแน่นอน ในทางตรงกันข้าม ถ้าเรา bluff เยอะเกินไปในบางสถานการณ์ คู่แข่งของเราก็สามารถที่จะ call ได้อย่างคุ้มค่ามากขึ้นทุกครั้งที่เรา bluff เพราะรู้ว่าเรามีโอกาสน้อยที่จะมี strong hand จริงๆ

ถ้าเรายังไม่แน่ใจว่ากลยุทธ์แบบ GTO คือแนวทางที่สมควรจะเล่น ตัวอย่างที่เป็นสมมติฐานเหล่านี้จาก Doug Polk อาจจะสามารถช่วยให้เข้าใจได้มากขึ้น :

ตัวอย่างโป๊กเกอร์ที่เป็นทฤษฎีเกม

ที่ river เรา bet $100 ใน pot $100 ดังนั้นคู่แข่งของเราต้อง call $100 เพื่อชนะเงิน $200 ดังนั้นคู่แข่งของเราจะเจอ pot odds 2 : 1 pot odds จึงต้องมีโอกาสชนะอย่างน้อย 33% ถึงจะคุ้มทุน

การคำนวณแบบเร็วๆนี้แสดงถึงสัดส่วนการ bluff ที่เหมาะสมที่สุดใน betting range ของเราที่ river คือ 33% (1 bluff ทุก 2 value bet) สัดส่วนนี้เหมาะสมที่สุดเพราะมันทำให้เราชนะเงินใน pot โดยไม่ต้องถูกเล่นงานกลับได้บ่อยที่สุด 

เราจะลองมาทดสอบสัดส่วน bluff ต่อ value bet ที่แตกต่างกัน 4 กรณี เพื่อจะได้เข้าใจว่าทำไมสัดส่วน bluff 33% ต่อ value bet 66% ใน range ถึงเป็นตัวเลือกที่ดีที่สุดจากมุมมองของ GTO และคู่แข่งของเราก็ไม่สามารถทำอะไรได้

(เพื่อให้เข้าใจง่ายขึ้น จะสมมติว่าเราชนะทุกครั้งที่คู่แข่ง call value bet ของเรา และแพ้ทุกครั้งที่ bluff bet ของเราถูก call)

กรณ๊ที่ 1 – Bluff 0%, Value Bet 100%:

คู่แข่งของเราสามารถ fold ได้ 100% ทุกครั้ง ทำให้เราได้เงิน $100 จาก betting range ของเรา

กรณีที่ 2 – Bluff 100%, Value Bet 0%:

คู่แข่งของเราสามารถ call ได้ 100% ทุกครั้ง ทำให้เราเสียเงิน $100 จาก betting range ของเรา

กรณีที่ 3 – Bluff 50%, Value Bet 50%:

ถ้าคู่แข่งของเรา call 100% ทุกครั้ง เราจะได้เงิน $200 เมื่อเราเป็น value bet และจะเสียเงิน $100 เมื่อเรา bluff สุทธิแล้วจะทำให้เราได้เงินเฉลี่ย $50 จาก betting range ของเรา ถ้าคู่แข่ง call มาทุกครั้ง (50% * -$100 = -$50; 50% * $200 = $100 ดังนั้น $100 – $50 = $50)

กรณีนี้จึงแสดงให้เห็นว่า จริงๆแล้วการไม่ bluff จะได้กำไรระยะยาวมากกว่าการ bluff 50% 

กรณีที่ 4 – Bluff 33%, Value Bet 67%:

ถ้าคู่แข่ง call เราตลอด เช่นเคย เราจะได้เงิน $200 เมื่อเรา value bet และเสีย $100 เมื่อเรา bluff แต่ครั้งนี้ เราจะเสีย $100 แค่ 33% และได้ $200 67% ทำให้ได้กำไรสุทธิระยะยาว $100 (33% * $100 = -$33; 67% * $200 = $133. $133 – $33 = $100)

สัดส่วน bluff-to-value bet ในกรณีนี้เหมาะสมที่สุดเนื่องจาก :

  • เราจะได้เงิน $100 ถ้าคู่แข่ง call ทุกครั้ง
  • เราจะได้เงิน $100 ถ้าคู่แข่ง fold ทุกครั้ง

ทำให้ยังไงเราก็ได้กำไร $100 ไม่ว่าคู่แข่งของเราจะ call หรือ fold กรณี win-win แบบนี้จะสามารถทำได้เฉพาะเมื่อเราใช้ range ที่สมดุลแบบสมบูรณ์แบบเท่านั้น เนื่องจากมันทำให้คู่แข่งของเราไม่รู้สึกแตกต่างว่าจะ call หรือ fold เพราะไม่ว่าเขาจะเลือกแบบไหน range ของเราจะทำกำไรเฉลี่ยได้เท่ากันเสมอ 

แม้ว่าการปรับสัดส่วนเพื่อที่จะ exploit ผู้เล่นที่ weak อาจจะสามารถทำกำไรได้มากกว่า แต่มันต้องใช้ความระมัดระวังและต้องปรับให้ถูกต้องเหมาะสมจากหลักฐานที่เชื่อถือได้

ถ้าเราต้องการจะได้ระดับ stake ขึ้นไปและเอาชนะเกมระดับสูงได้ในระยะยาว ความเข้าใจในเรื่องกลยุทธ์ในเชิง GTO จึงเป็นเรื่องทีสำคัญอย่างยิ่ง!

ข้อดี 4 ข้อของการใช้ GTO

สุดท้ายนี้ เรามาดูข้อดีทั่วไป 4 เรื่องจากการใช้กลยุทธ์ GTO อย่างแข็งแกร่งกัน

1. ไม่ต้องคิดกลับไปกลับมา

มรดกตกทอดของการฝึกฝนโป๊กเกอร์ในช่วงปี 90 ก็คือการพยายามวิเคราะห์ว่าผู้เล่นคนนี้กำลังเล่นอยู่ใน “ระดับ” ไหน

  • ความคิดระดับพื้นฐาน คือการคิดถึงแต่เฉพาะ hand ของเรา
  • จากนั้นก็คิดไปว่า คู่แข่งของเรา จะถืออะไร
  • จากนั้นก็คิดกลับมาว่า คู่แข่งคิดว่า เราจะถืออะไร
  • และก็คิดกลับมาอีกว่า เราคิดว่า คู่แข่งจะคิดว่า เราคิดว่าเขาถืออะไร
  • และเป็นแบบนี้ต่อไปอีกเรื่อยๆ

ในทางอุดมคติแล้ว สุดท้ายเราจะต้องกำหนดว่าความคิด “ระดับไหน” ที่กระบวนการนี้จะไปสิ้นสุด ซึ่งเราก็ต้องหาให้ได้ว่าคู่แข่งของเรากำลังเล่นอยู่ ณ ความคิดระดับไหน และปรับความคิดให้ชนะระดับนั้น 

แต่ในทางปฏิบัติ วิธีการแบบนี้มันใช่ไม่ค่อยได้กับผู้เล่นที่ weak และเมื่อใช้กับผู้เล่นที่มีประสบการณ์สูง ในทางทฤษฎีแล้ว มันอาจจะต้องคิดซ้ำไปมาจนหมดเวลา กว่าที่ฝ่ายใดฝ่ายจะสามารถคิดให้เหนือกว่าระดับของอีกฝ่ายได้

เราสามารถหลีกเลี่ยงสถานการณ์แบบนี้ด้วยการใช้กลยุทธ์การ bluff ที่ได้รับอิทธิพลจาก GTO ทำให้เราต้องทำให้ตัวเองสับสน หรือพาตัวเองเข้าไปอยู่ในสงครามระดับการคิดบน flop โดยไม่มี equity

2. ไม่ต้องตั้งสมมติฐานเอาเอง

ข้อดีอีกอย่างของหลักการที่ใช้ GTO เป็นพื้นฐานกับโป๊กเกอร์ คือมันช่วยให้เราหลีกเลี่ยงโอกาสที่เราจะตั้งสมมติฐานเกี่ยวกับผู้เล่นคนอื่นๆแบบผิดๆได้ แน่นอนว่าเราอาจจะตั้งสมมติฐานได้ค่อนข้างชัดเจนเมื่อเจอกับใครที่เราได้เห็นตัวอย่าง hand จำนวนมากพอก็ตาม แต่การตั้งสมมติฐานที่เป็นเรื่องทั่วไปมากๆ ถือเป็นเรื่องที่เสี่ยงมากเช่นกัน

ตัวอย่างเช่น มันไม่ค่อยฉลาดเท่าไหร่นักที่จะพูดว่า “มันไม่ใช่ bluff แน่นอน” หรือ “เขาเล่นแบบนี้ตลอด” เช่นเดียวกัน เราก็ไม่ควรสรุปว่า ผู้เล่นที่เราไม่มีข้อมูล จะไม่มี hand นั้นอยู่ใน hand ของเขา ไม่ว่าเขาจะเปิดด้วย range ที่กว้างมากๆหรือแคบมากๆก็ตาม

กลยุทธ์ GTO ที่ถูกสร้างมาอย่างดีจะทำให้ความสับสนนั้นหมดไป และช่วยให้เราเล่นแบบมีกำไรในระยะยาวได้

3. มีการวิเคราะห์อย่างเป็นกลาง

ผู้เล่นหลายคนตัดสินวิธีการเล่นแบบผิดๆ จากผลลัพธ์ที่เกิดขึ้น แต่เมื่อยิ่งผู้เล่นคนนั้นได้พัฒนาในเส้นทางโป๊กเกอร์อาชีพมากขึ้นเท่าไหร่ เขาจะยิ่งตระหนักได้ว่านี่ไม่ใช่งานที่ตัดสินทุกอย่างจากผลลัพธ์ได้อย่างลอยๆ

อย่างไรก็ตาม การคิดอย่างเป็นกลางนั้นเป็นเรื่องยาก โดยเฉพาะเมื่อผลลัพธ์ของการเล่นมันแย่มากๆ หรือดีมากๆ แค่เพียงเพราะเราติด full house ที่ river และกินชิพคู่แข่งได้หมด stack ไม่ได้แปลว่าการ call มาสองรอบจะเป็นการเล่นที่ถูกต้องเสมอไป

เมื่อเราเข้าใจแล้วว่ากลยุทธ์แบบ GTO ที่ถูกต้องในสถานการณ์นั้นๆเป็นอย่างไร ให้ใช้มันกับช่วงการวิเคราะห์การเล่นก่อนหน้า เพื่อดูว่าการเล่นกับ range ของเราทำกำไรระยะยาวหรือไม่ ไม่ใช่แค่กับไพ่ 2 ใบใดๆ

ผู้เล่นโป๊กเกอร์ที่ประสบความสำเร็จทุกคนรู้ว่า การยอมรับข้อผิดพลาดของตัวเองเป็นเรื่องที่จำเป็นอย่างมาก สำหรับการเล่นให้ถูกต้องอย่างสม่ำเสมอ

4. ทำให้การปรับการเล่นทำได้ง่ายขึ้น

ทำไมทฤษฎีการเล่นถึงเป็นเรื่องที่สำคัญถ้าเราต้องปรับกลยุทธ์การเล่นให้ได้ผล? เราลองมาเล่นเกมเพื่อหาคำตอบกันสักหน่อย

สมมติว่าเราลืมทุกอย่างเกี่ยวกับกลยุทธ์การเล่นโป๊กเกอร์ไปหมด ยกเว้นพื้นฐานวิธีการเล่น และเรากำลังจะเริ่มเล่นเป็นครั้งแรก

ไลฟ์เกม $1/$2 Effective Stack $200 

Hero ถือ A♦ 9♦ ที่ BB

คนอื่นหมอบจนถึง BTN BTN raise $7 SB fold Hero call

Flop ($14) A♠ T♦ 3♥

Hero check BTN bet $9 Hero call

Turn ($32) J♣

Hero check BTN bet $21 Hero call

River ($74) 9♣

Hero check BTN bet $50 Hero call

BTN โชว์ไพ่ A♥2♣. Hero ชนะ pot $174 จาก 2 pair

เราได้อะไรจากการได้รู้ว่า BTN ใช้วิธีการเล่นแบบ aggressive กับ top pair ที่ weak ของเขาแบบนั้น? เราจะปรับวิธ๊การเล่นเพื่อ exploit เขาในอนาคตอย่างไร? ถ้าเราไม่เข้าใจวิธีการเล่น hand นั้นๆอย่างถูกต้องตามทฤษฎี เราจะไม่รู้เลยว่าควรจะเริ่มจากจุดไหน 

ในทางตรงกันข้าม ถ้าเรารู้วิธีการเล่น A2o ในสถานการณ์นี้ ในตำแหน่ง BTN อย่างถูกต้องตามทฤษฎี เราก็จะรู้ว่าเขาเล่นเบี่ยงออกจากแนวทางนั้น ความรู้นี้ช่วยให้เราลดวิธีที่จะ exploit คู่แข่งคนนี้ ให้เหลือวิธีที่ชัดเจนขึ้น

นี่คือวิธีปรับที่เราจะสามารถเล่นงานกลยุทธ์การ bet ที่อ่อนแอของผู้เล่นที่ aggressive โดยเฉพาะ

  • วิธี exploit แบบเล็ก : call ตามเมื่อเขา bet อย่างต่อเนื่อง (แต่อย่าให้บ่อยมาก)
  • วิธี exploit แบบใหญ่ : โจมตีอย่างต่อเนื่องกับ range check back ของเขา เพราะชัดเจนว่ามัน weak ด้วยการ bet ใหญ่เอา value ร่วมกับ bluff

ความเข้าใจในวิธีการเล่นที่เหมาะสมที่สุดตามทฤษฎี ทำให้การ exploit คู่แข่งนั้นง่ายขึ้น เพราะเราจะรู้ว่าคู่แข่งเบี่ยงเบนไปจากวิธีที่ดีที่สุดอย่างไร เมื่อเราไม่รู้ว่าอะไรคือวิธีที่ถูก เราจะไม่มีวันเข้าใจเลยว่าอะไรคือวิธีที่ผิด

สรุป

ความมุ่งมั่นที่จะเข้าใจกลยุทธ์แบบ GTO ที่สมบูรณ์แบบ อาจดูเหมือนการพยายามสรุปให้ได้อย่างมีตรรกะ แต่ความจริงแล้ว ไม่มีใครที่จะสามารถเล่นกลยุทธ์ที่ดีที่สุดตามทฤษฎีเกมได้ทั้งหมด เพราะโป๊กเกอร์เป็นเกมที่ทั้งคนและเครื่องจักรยังไม่สามารถแก้ปัญหาได้ทั้งหมด แต่เราก็ยังแนะนำให้ใช้ทฤษฎีเกมเป็นกลยุทธ์การเล่นหลักเท่าที่เป็นไปได้ เช่นเคย มันหมายถึงการที่เราต้องศึกษาการเล่นทั้งในและนอกโต๊ะให้มาก

บทความนี้เป็นบทสรุปขั้นพื้นฐานเกี่ยวกับวิธีที่จะนำทฤษฎีเกมมาใช้ในโป๊กเกอร์ แต่ก็หวังว่าเราจะได้อะไรบางอย่างกลับไป หรืออย่างน้อยก็เริ่มสงสัยว่าจะพัฒนาวิธีการเล่นให้สอดคล้องกับแนวคิดของทฤษฎีเกมได้อย่างไร

https://upswingpoker.com/gto-poker-game-theory-optimal-strategy/