ขึ้นอยู่กับการรวมกันของผู้เล่นทั้งสองหยิบ
1 min read
Galla และ Farmer สงสัยว่ากระบวนการเรียนรู้นี้จะช่วยให้ผู้เล่นพบสมดุลของ Nash เมื่อเกมยากหรือไม่ พวกเขายังอยากรู้ว่าจะเกิดอะไรขึ้นถ้าเกมไม่ได้สร้างผลลัพธ์ที่ดีที่สุด เราควรคาดหวังพฤติกรรมแบบใด Galla และ Farmer พัฒนาเกมที่ผู้เล่นคอมพิวเตอร์สองคนสามารถเลือกจากการเคลื่อนไหวห้าสิบที่เป็นไปได้ ขึ้นอยู่กับการรวมกันของผู้เล่นสองคนที่เลือกพวกเขาแต่ละคนจะได้รับผลตอบแทนเฉพาะซึ่งได้รับการสุ่มก่อนที่เกมจะเริ่ม ค่าของการจ่ายผลตอบแทนที่กำหนดไว้ล่วงหน้าเหล่านี้ตัดสินใจว่าการแข่งขันเป็นอย่างไร การจ่ายเงินที่แตกต่างกันระหว่างการเป็นศูนย์ – ผลรวมกับการสูญเสียของผู้เล่นคนหนึ่งเท่ากับผลประโยชน์ของผู้อื่นจะเหมือนกันสำหรับผู้เล่นทั้งสอง