สมดุลแบบแนช (อังกฤษ: Nash equilibrium) เป็นแนวคิดในวิชาทฤษฎีเกมที่อธิบายสถานการณ์ที่ผู้เล่นแต่ละคนเลือกทางเลือกที่ดีสุดสำหรับตัวเองเมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้น ผู้เล่นแต่ละคนจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล สมดุลแบบแนชเรียกตามชื่อของจอห์น แนช นักคณิตศาสตร์ซึ่งเป็นผู้นิยามสมดุลในลักษณะนี้
ประวัติ
ชื่อแนวคิดสมดุลแบบแนชมีที่มาจากจอห์น แนช ผู้ที่นิยามแนวคิดสมดุลในรูปแบบที่ใช้กันในปัจจุบันเมื่อปี 1950 แต่การใช้แนวคิดที่มีลักษณะของสมดุลแบบแนชนั้นย้อนไปได้ถึงงานเขียนของอ็องตวน-โอกุสแต็ง กูร์โน ที่ตีพิมพ์ในปี 1838 ในหนังสือ Recherches sur les principes mathématiques de la théorie des richesses (ฝรั่งเศส: งานวิจัยว่าด้วยหลักคณิตศาสตร์ของทรัพยศาสตร์) กูร์โนได้เขียนถึงวิเคราะห์การแข่งขันระหว่างผู้ผลิตสินค้าใน (เรียกภายหลังว่าเป็นแบบจำลอง) ในแบบจำลองนี้ กำไรของผู้ผลิตสินค้าแต่ละราย ไม่เพียงขึ้นอยู่กับปริมาณการผลิตของตัวเอง แต่ขึ้นอยู่กับการผลิตของคู่แข่งด้วย ผลลัพธ์ของแบบจำลองของกูร์โนเป็นจุดสมดุลแบบแนชรูปแบบหนึ่ง แต่กูร์โนไม่ได้ขยายความให้แนวคิดมีนัยทั่วไปกับสถานการณ์อื่นๆ
แนวคิดทฤษฎีเกมในแบบที่ใช้กันในปัจจุบัน มีรากฐานจากงานของจอห์น ฟอน นอยมันน์และ ในหนังสือ The Theory of Games and Economic Behavior (อังกฤษ: ทฤษฎีว่าด้วยเกมและพฤติกรรมทางเศรษฐกิจ) ซึ่งตีพิมพ์ครั้งแรกในปี 1944 ได้นิยามเกมและแนวคิด ซึ่งเป็นหมายถึงการที่ผู้เล่นในเกมเลือกแจกแจงความน่าจะเป็นที่จะใช้ทางเลือกแต่ละทางที่ตนเองมี หนังสือยกตัวอย่างแนวคิดกลยุทธ์แบบผสมในเกมเป่ายิ้งฉุบว่า "สามัญสำนึกจะบอกได้ว่าวิธีที่ดีที่จะเล่นเกมนี้คือการเลือกทางเลือกทั้งสามทางด้วยความน่าจะเป็นแต่ละทางเท่ากับ 1/3" ฟอนนอยมันน์กับมอร์เกินสแตร์นได้เสนอแนวคิดคำตอบของเกมที่มีกลยุทธ์แต่ผสม แต่แนวคิดนี้ใช้ได้เฉพาะกับเกมผลรวมเป็นศูนย์
ในปี 1950 จอห์น แนชได้นิยามกลยุทธ์แบบผสมสำหรับเกมใดๆ ที่ผู้เล่นมีทางเลือกจำกัด และพิสูจน์ว่าสมดุลชนิดนี้มีอยู่ในเกมลักษณะดังกล่าวใดๆ ที่ผู้เล่นสามารถใช้กลยุทธ์แบบผสม บทพิสูจน์ในตอนแรกของแนชใช้ ถัดมาในปี 1951 แนชได้ตีพิมพ์บทความวิชาการอีกบทความหนึ่งซึ่งใช้ในการพิสูจน์แทน
นิยาม
ในทางทฤษฎีเกม การนิยามเกมแบบพื้นฐานประกอบไปด้วยองค์ประกอบสามอย่าง ได้แก่ ผู้เล่น ทางเลือกของผู้เล่นแต่ะละคนในเกม (เรียกในทฤษฎีเกมว่า "กลยุทธ์") และความพึงพอใจของผู้เล่นแต่ละคนที่มีต่อผลลัพธ์แต่ละแบบของเกม ซึ่งมักเขียนในรูปแบบที่เรียกว่าฟังก์ชัน ค่าของอรรถประโยชน์ของผู้เล่นแต่ละคน ขึ้นอยู่กับกลยุทธ์ของผู้เล่นทุกคนในเกม หากเขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ นิยามพื้นฐานของเกมสามารถกำหนดได้ดังต่อไปนี้
- เซตของผู้เล่น
- เซตของกลยุทธ์ สำหรับผู้เล่น แต่ละคนในเซตผู้เล่น
- ค่าอรรถประโยชน์ สำหรับผู้เล่น แต่ละคนในเซตผู้เล่น ที่อิงจากกลยุทธ์ ที่ผู้เล่นแต่ละคนเลือก
โพรไฟล์กลยุทธ์ (อังกฤษ: strategy profile) หมายถึงเวกเตอร์ที่ระบุกลยุทธ์ของผู้เล่นทุกคน นั่นคือ และใช้สัญลักษณ์ หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้น ค่าอรรถประโยชน์ของผู้เล่น จึงสามารถเขียนได้เป็น และ ด้วย
จากนิยามเกมข้างต้น โพร์ไฟล์กลยุทธ์ ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์ ที่ผู้เล่น เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่ ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์ เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า
ทฤษฎีบทของแนชพิจารณาเกมที่สามารถมีกลยุทธ์แบบผสมได้ กลยุทธ์แบบผสม หมายถึงการที่ผู้เล่นแต่ละคนเลือกความน่าจะเป็นที่จะเลือกทางเลือกแต่ละทางให้แก่ทุกสมาชิกในเซตกลยุทธ์ (ความน่าจะเป็นของสมาชิกแต่ละอันอาจจะเป็น 0 หรือ 1 ได้) โดยผลรวมของความน่าจะเป็นของทุกตัวเลือกเท่ากับ 1 ตามนิยามของการแจกแจงความน่าจะเป็น ในกรณีนี้ เซตกลยุทธ์ที่เป็นกลยุทธ์แบบผสม จะกลายเป็นมีลักษณะเป็นซิมเพล็กซ์แทน
การมีอยู่ของสมดุลแบบแนช
แนชพิสูจน์ว่า ถ้าหากเกมมีจำนวนผู้เล่นจำกัด และผู้เล่นแต่ละคนมีเซตกลยุทธ์ที่จำกัด และเราพิจารณากลยุทธ์แบบผสม เกมนั้นจะมีสมดุลแบบแนชในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แต่หากเราไม่อนุญาตให้มีการผสมกลยุทธ์แล้ว (นั่นคือ มีเพียงเซตกลยุทธ์ที่เป็นเซตจำกัด) เกมนั้นอาจไม่มีสมดุลแบบแนชก็ได้ ในกรณีนี้ เรียกว่าเกมนั้นไม่มีกลยุทธ์แบบแท้
วิธีพิสูจน์ด้วยทฤษฎีบทจุดตรึงที่แนชใช้นั้น สามารถใช้พิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่านั้นได้ กล่าวคือ ถ้าหากว่าเกมนั้นมีเซตกลยุทธ์เป็นเซตย่อยของที่ และไม่เป็นเซตว่าง และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็นฟังก์ชันต่อเนื่องในเซตโพรไฟล์กลยุทธ์ และต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด เกมที่มีกลยุทธ์แบบผสมถือเป็นกรณีเฉพาะอันหนึ่งของเกมในนัยทั่วไปนี้
อ้างอิง
- Kreps, David M. (2018) [1987]. "Nash Equilibrium". ใน Macmillan Publishers (บ.ก.). The New Palgrave Dictionary of Economics (ภาษาอังกฤษ) (3 ed.). Palgrave Macmillan. pp. 9251–9258. doi:10.1057/978-1-349-95121-5_963-1. ISBN .
- Watson, Joel (2018) [2008]. "Nash, John Forbes (Born 1928)". ใน Macmillan Publishers (บ.ก.). The New Palgrave Dictionary of Economics (ภาษาอังกฤษ) (3 ed.). Palgrave Macmillan. pp. 9276–9283. doi:10.1057/978-1-349-95121-5_1957-1. ISBN .
- Von Neumann, John; Morgenstern, Oskar (1953). Theory of Games and Economic Behavior (ภาษาอังกฤษ) (3 ed.). Princeton: Princeton University Press. OCLC 10006173.
- Nash, John F. (1950). "Equilibrium points in n-person games". Proceedings of the National Academy of Sciences. 36 (1): 48–49. doi:10.1073/pnas.36.1.48. ISSN 0027-8424. PMID 16588946.
- Nash, John (1951). "Non-cooperative games". Annals of Mathematics. 54 (2): 286–295. doi:10.2307/1969529. ISSN 0003-486X. JSTOR 1969529.
- Fudenberg, Drew; Tirole, Jean (1991). Game Theory (ภาษาอังกฤษ). Cambridge, Massachusetts: MIT Press. ISBN .
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
smdulaebbaench xngkvs Nash equilibrium epnaenwkhidinwichathvsdiekmthixthibaysthankarnthiphuelnaetlakhneluxkthangeluxkthidisudsahrbtwexngemuxphicarnathungthangeluxkkhxngphuelnxunincudsmdulnn phuelnaetlakhncungimsamarthidpraoychnmakkhundwykarepliynthangeluxkkhxngtwexngaetephiyngfayediywidincudsmdul smdulaebbaencheriyktamchuxkhxngcxhn aench nkkhnitsastrsungepnphuniyamsmdulinlksnaniprawtichuxaenwkhidsmdulaebbaenchmithimacakcxhn aench phuthiniyamaenwkhidsmdulinrupaebbthiichkninpccubnemuxpi 1950 aetkarichaenwkhidthimilksnakhxngsmdulaebbaenchnnyxnipidthungnganekhiynkhxngxxngtwn oxkusaetng kuron thitiphimphinpi 1838 inhnngsux Recherches sur les principes mathematiques de la theorie des richesses frngess nganwicywadwyhlkkhnitsastrkhxngthrphysastr kuronidekhiynthungwiekhraahkaraekhngkhnrahwangphuphlitsinkhain eriykphayhlngwaepnaebbcalxng inaebbcalxngni kairkhxngphuphlitsinkhaaetlaray imephiyngkhunxyukbprimankarphlitkhxngtwexng aetkhunxyukbkarphlitkhxngkhuaekhngdwy phllphthkhxngaebbcalxngkhxngkuronepncudsmdulaebbaenchrupaebbhnung aetkuronimidkhyaykhwamihaenwkhidminythwipkbsthankarnxun aenwkhidthvsdiekminaebbthiichkninpccubn mirakthancakngankhxngcxhn fxn nxymnnaela inhnngsux The Theory of Games and Economic Behavior xngkvs thvsdiwadwyekmaelaphvtikrrmthangesrsthkic sungtiphimphkhrngaerkinpi 1944 idniyamekmaelaaenwkhid sungepnhmaythungkarthiphuelninekmeluxkaeckaecngkhwamnacaepnthicaichthangeluxkaetlathangthitnexngmi hnngsuxyktwxyangaenwkhidklyuththaebbphsminekmepayingchubwa samysanukcabxkidwawithithidithicaelnekmnikhuxkareluxkthangeluxkthngsamthangdwykhwamnacaepnaetlathangethakb 1 3 fxnnxymnnkbmxrekinsaetrnidesnxaenwkhidkhatxbkhxngekmthimiklyuththaetphsm aetaenwkhidniichidechphaakbekmphlrwmepnsuny inpi 1950 cxhn aenchidniyamklyuththaebbphsmsahrbekmid thiphuelnmithangeluxkcakd aelaphisucnwasmdulchnidnimixyuinekmlksnadngklawid thiphuelnsamarthichklyuththaebbphsm bthphisucnintxnaerkkhxngaenchich thdmainpi 1951 aenchidtiphimphbthkhwamwichakarxikbthkhwamhnungsungichinkarphisucnaethnniyaminthangthvsdiekm karniyamekmaebbphunthanprakxbipdwyxngkhprakxbsamxyang idaek phueln thangeluxkkhxngphuelnaetalakhninekm eriykinthvsdiekmwa klyuthth aelakhwamphungphxickhxngphuelnaetlakhnthimitxphllphthaetlaaebbkhxngekm sungmkekhiyninrupaebbthieriykwafngkchn khakhxngxrrthpraoychnkhxngphuelnaetlakhn khunxyukbklyuththkhxngphuelnthukkhninekm hakekhiyndwysylksnthangkhnitsastr niyamphunthankhxngekmsamarthkahndiddngtxipni estkhxngphueln N 1 2 n displaystyle N 1 2 dots n estkhxngklyuthth Si displaystyle S i sahrbphueln i displaystyle i aetlakhninestphueln khaxrrthpraoychn ui s1 s2 sn displaystyle u i s 1 s 2 dots s n sahrbphueln i displaystyle i aetlakhninestphueln thixingcakklyuthth s1 s2 sn displaystyle s 1 s 2 dots s n thiphuelnaetlakhneluxk ophriflklyuthth xngkvs strategy profile hmaythungewketxrthirabuklyuththkhxngphuelnthukkhn nnkhux s s1 s2 sn displaystyle s s 1 s 2 dots s n aelaichsylksn s i displaystyle s i hmaythungophriflklyuththkhxngphuelnthukkhnykewn i displaystyle i khaxrrthpraoychnkhxngphueln i displaystyle i cungsamarthekhiynidepnui s displaystyle u i s aela ui si s i displaystyle u i s i s i dwy cakniyamekmkhangtn ophriflklyuthth s s1 s2 sn displaystyle s s 1 s 2 dots s n thuxwaepncudsmdulaebbaench thaklyuthth si displaystyle s i thiphueln i displaystyle i eluxk epnklyuthththiihxrrthpraoychnsungsudaekphueln i displaystyle i emuxphuelnkhnxun eluxkelnklyuthththirabuin s displaystyle s klawxikthanghnungkhux phuelnaetlakhninekmimsamarththaihxrrthpraoychnkhxngtwexngsungkhundwykareluxkklyuththxunthiimich si displaystyle s i trabidthiphuelnkhnxunthukkhneluxkklyuththkhxngtwexngtamthikahndinophriflklyuthth s displaystyle s enguxnikhniekhiyndwysylksnthangkhnitsastridwa i N si Si ui s ui si s i displaystyle forall i in N forall s i in S i u i s geq u i s i s i thvsdibthkhxngaenchphicarnaekmthisamarthmiklyuththaebbphsmid klyuththaebbphsm hmaythungkarthiphuelnaetlakhneluxkkhwamnacaepnthicaeluxkthangeluxkaetlathangihaekthuksmachikinestklyuthth khwamnacaepnkhxngsmachikaetlaxnxaccaepn 0 hrux 1 id odyphlrwmkhxngkhwamnacaepnkhxngthuktweluxkethakb 1 tamniyamkhxngkaraeckaecngkhwamnacaepn inkrnini estklyuthththiepnklyuththaebbphsm caklayepnmilksnaepnsimephlksaethnkarmixyukhxngsmdulaebbaenchaenchphisucnwa thahakekmmicanwnphuelncakd aelaphuelnaetlakhnmiestklyuthththicakd aelaeraphicarnaklyuththaebbphsm ekmnncamismdulaebbaenchinklyuththaebbphsmxyangnxyhnungcudesmx aethakeraimxnuyatihmikarphsmklyuththaelw nnkhux miephiyngestklyuthththiepnestcakd ekmnnxacimmismdulaebbaenchkid inkrnini eriykwaekmnnimmiklyuththaebbaeth withiphisucndwythvsdibthcudtrungthiaenchichnn samarthichphisucnthvsdibththiminythwipkwannid klawkhux thahakwaekmnnmiestklyuththepnestyxykhxngthi aelaimepnestwang aelafngkchnxrrthpraoychnkhxngphuelnaetlakhnepnfngkchntxenuxnginestophriflklyuthth aelatxklyuththkhxngtwexng ekmnnkcamicudsmdulaebbaenchxyangnxyhnungcud ekmthimiklyuththaebbphsmthuxepnkrniechphaaxnhnungkhxngekminnythwipnixangxingKreps David M 2018 1987 Nash Equilibrium in Macmillan Publishers b k The New Palgrave Dictionary of Economics phasaxngkvs 3 ed Palgrave Macmillan pp 9251 9258 doi 10 1057 978 1 349 95121 5 963 1 ISBN 978 1 349 95188 8 Watson Joel 2018 2008 Nash John Forbes Born 1928 in Macmillan Publishers b k The New Palgrave Dictionary of Economics phasaxngkvs 3 ed Palgrave Macmillan pp 9276 9283 doi 10 1057 978 1 349 95121 5 1957 1 ISBN 978 1 349 95121 5 Von Neumann John Morgenstern Oskar 1953 Theory of Games and Economic Behavior phasaxngkvs 3 ed Princeton Princeton University Press OCLC 10006173 Nash John F 1950 Equilibrium points in n person games Proceedings of the National Academy of Sciences 36 1 48 49 doi 10 1073 pnas 36 1 48 ISSN 0027 8424 PMID 16588946 Nash John 1951 Non cooperative games Annals of Mathematics 54 2 286 295 doi 10 2307 1969529 ISSN 0003 486X JSTOR 1969529 Fudenberg Drew Tirole Jean 1991 Game Theory phasaxngkvs Cambridge Massachusetts MIT Press ISBN 978 0 262 06141 4