บทความนี้ไม่มีจาก |
ความลำบากใจของนักโทษ (อังกฤษ: prisoner's dilemma) เป็นปัญหาพื้นฐานในทฤษฎีเกมซึ่งแสดงให้เห็นว่าเหตุใดคนสองคนจึงอาจไม่ร่วมมือกันแม้ว่าทั้งสองจะได้รับผลประโยชน์มากที่สุดในการร่วมมือกันนั้น เดิมปัญหาดังกล่าวคิดขึ้นโดยเมอร์ริลล์ ฟลัด และเมลวิน เดรชเชอร์ ซึ่งกำลังทำงานอยู่ที่ RAND ในปี ค.ศ. 1950 อัลเบิร์ต ดับเบิลยู. ทักเกอร์ทำให้เกมดังกล่าวเป็นระเบียบแบบแผนด้วยการกำหนดโทษจำคุกและให้ชื่อว่า "ความลำบากใจของนักโทษ"
ตัวอย่างคลาสสิกของความลำบากใจของนักโทษมีดังนี้
ผู้ต้องสงสัยสองคนถูกตำรวจจับกุม ตำรวจมีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่ามีความผิด ตำรวจแยกผู้ต้องสงสัยทั้งคู่ออกจากกัน และเสนอข้อเสนอเดียวกันแก่ผู้ต้องสงสัยทั้งคู่ หากคนหนึ่งให้การเป็นพยานต่ออีกคนหนึ่ง (แปรพักตร์) และอีกคนหนึ่งยังคงไม่ให้การ (ร่วมมือ) ผู้แปรพักตร์จะถูกปล่อยตัวไปแต่ผู้สมคบคิดที่ไม่ให้การจะได้รับโทษจำคุกเต็มหนึ่งปี หากทั้งคู่ไม่ให้การ นักโทษทั้งสองจะถูกตัดสินจำคุกเพียงหนึ่งเดือนด้วยข้อหาเล็กน้อย หากทั้งสองให้การ แต่ละคนจะได้รับโทษสามเดือน นักโทษแต่ละคนต้องเลือกที่จะทรยศอีกฝ่ายหนึ่งหรือปฏิเสธที่จะให้การ แต่ละคนต่างก็รู้ว่าอีกฝ่ายหนึ่งไม่อาจรู้ได้ถึงการทรยศก่อนการสืบสวนจะสิ้นสุด นักโทษควรทำอย่างไร
หากผู้เล่นแต่ละคนต่างสนใจลดเวลาในการถูกจำคุกลงให้เหลือน้อยที่สุด เช่นนั้นแล้วความลำบากใจของนักโทษก็จะเป็นเกมที่มีผลรวมไม่เป็นศูนย์ซึ่งผู้เล่นทั้งสองอาจร่วมมือกันหรือแปรพักตร์จากผู้เล่นอีกคนหนึ่ง ในเกมนี้ เช่นเดียวกับทฤษฎีเกมส่วนมาก ผู้เล่นแต่ละคน (นักโทษ) ต่างก็ต้องการให้ตนเองได้รับผลประโยชน์มากที่สุด โดยไม่คำนึงถึงผลประโยชน์ของผู้เล่นอีกคนหนึ่ง สมดุลเฉพาะของเกมนี้คือ สภาวะเลวกว่าอุตมภาพแบบพาเรโต (Pareto-suboptimal solution) นั่นคือ ทางเลือกนำให้ผู้เล่นทั้งสองเลือกที่จะแปรพักตร์ทั้งคู่ ถึงแม้ว่าผู้เล่นแต่ละคนจะได้รับผลประโยชน์มากกว่าหากทั้งสองรวมมือกัน
ในรูปแบบคลาสสิกของเกมนี้ การแปรพักตร์เป็นกลยุทธ์เด่นเหนือกว่าการร่วมมือกัน ดังนั้นสมดุลที่เป็นไปได้ของเกมนี้คือผู้เล่นทุกคนเลือกจะแปรพักตร์ ไม่ว่าผู้เล่นอีกฝ่ายจะเลือกอะไร แต่ผู้เล่นจะได้รับผลประโยชน์สูงสุดโดยการเลือกแปรพักตร์ เพราะว่าในสถานการณ์ใด ๆ การเลือกแปรพักตร์ได้ประโยชน์มากกว่าจะร่วมมือกัน ผู้เล่นทุกคนจึงเลือกแปรพักตร์ และผลที่ได้ก็จะออกมาเท่ากัน
กลยุทธ์สำหรับความลำบากใจของนักโทษคลาสสิก
ความลำบากใจของนักโทษแบบคลาสสิกสามารถสรุปได้ดังนี้
นักโทษ ข ปฏิเสธจะให้การ (ร่วมมือ) | นักโทษ ข สารภาพ (แปรพักตร์) | |
---|---|---|
นักโทษ ก ปฏิเสธจะให้การ (ร่วมมือ) | ทั้งสองรับโทษ 1 เดือน | นักโทษ ก: 1 ปี นักโทษ ข: ปล่อยตัวเป็นอิสระ |
นักโทษ ก สารภาพ (แปรพักตร์) | นักโทษ ก: ปล่อยตัวเป็นอิสระ นักโทษ ข: 1 ปี | ทั้งสองรับโทษ 3 เดือน |
ลองจินตนาการดูว่าคุณเป็นผู้เล่น ก หากผู้เล่น ข ตัดสินใจปฏิเสธจะให้การเกี่ยวกับอาชญากรรม คุณก็จะได้ผลประโยชน์มากกว่าหากคุณสารภาพ เพราะคุณจะถูกปล่อยตัวเป็นอิสระ เช่นเดียวกัน หากผู้เล่น ข สารภาพ คุณก็จะได้รับผลประโยชน์มากกว่าถ้าคุณสารภาพ เพราะคุณจะได้รับโทษเพียง 3 เดือน แทนที่จะเป็น 1 ปี จากมุมมองนี้ ไม่ว่าผู้เล่น ข จะเลือกอะไร ผู้เล่น ก ก็จะได้รับผลประโยชน์มากกว่าถ้าสารภาพ มีผู้กล่าวว่าการสารภาพ (แปรพักตร์) เป็นกลยุทธ์เด่นของเกมนี้
หากคุณเป็นนักโทษ ก คุณสามารถกล่าวได้ว่า "ไม่ว่านักโทษ ข จะเลือกอย่างไร ผม/ดิฉันก็จะได้เปรียบถ้าจะสารภาพกว่าเลือกที่จะไม่ให้การ ดังนั้น เพื่อเห็นแก่ตัวผม/ดิฉันเอง ผม/ดิฉันควรจะสารภาพ" อย่างไรก็ตาม หากผู้เล่นอีกคนหนึ่งทำแบบเดียวกัน คือ ทั้งสองคนเลือกจะสารภาพ แล้วทั้งสองก็จะได้รับโทษมากกว่าที่คุณและอีกฝ่ายหนึ่งจะได้รับหากเลือกที่จะไม่ให้การทั้งคู่ นั่นคือ การตัดสินใจที่ดูเหมือนว่าจะให้ประโยชน์แก่ตนเองมากที่สุดกลับไม่ได้ให้ผลประโยชน์ที่ดีที่สุด ดังนั้นจึงกลายเป็นที่มาของความลำบากใจ ในทฤษฎีเกมนี้เป็นตัวอย่างเกมที่มีผลรวมไม่เป็นศูนย์ว่า สมดุลของแนชไม่จำเป็นจะต้องเป็นอุตมภาพของพาเรโต
แต่แม้ว่าพวกเขาไม่ได้รับอนุญาตให้สื่อสารระหว่างกัน หากนักโทษต่างก็เชื่อมั่นในตัวอีกฝ่าย ทั้งสองก็สามารถเลือกที่จะไม่ให้การได้ ซึ่งจะลดโทษแก่พวกเขาทั้งสอง
รูปแบบทั่วไป
รูปแบบทั่วไปของเกมได้ถูกใช้บ่อยครั้งในเศรษฐศาสตร์ทดลอง ตัวอย่างเกมเป็นดังนี้
มีผู้เล่นสองคนกับนายธนาคาร ผู้เล่นแต่ละคนมีไพ่คนละสองใบ ใบหนึ่งมีคำว่า "ร่วมมือ" ส่วนอีกใบหนึ่งมีคำว่า "แปรพักตร์" ผู้เล่นแต่ละคนหมอบไพ่หนึ่งใบไว้ตรงหน้านายธนาคาร ผู้เล่นแต่ละฝ่ายไม่มีโอกาสรู้ล่วงหน้าเลยว่าอีกฝ่ายหนึ่งหมอบไพ่อะไร (อันที่จริงเปิดไพ่ก็ไม่ได้มีผลกระทบต่อการวิเคราะห์กลยุทธ์เด่นแต่อย่างใด) ในตอนท้ายของรอบ นายธนาคารหงายหน้าไพ่ทั้งคู่และจ่ายค่าตอบแทนตามนั้น
กำหนดให้มีผู้เล่นสองคน "แดง" และ "น้ำเงิน" หากผู้เล่นแดงแปรพักตร์และผู้เล่นน้ำเงินร่วมมือ ผู้เล่นแดงจะได้รับผลประโยชน์จากการแปรพักตร์นั้น 5 แต้ม ขณะที่ผู้เล่นน้ำเงินได้รับผลประโยชน์ 0 แต้ม หากผู้เล่นทั้งสองร่วมมือกันจะได้รับรางวัลแห่งความร่วมมือคนละ 3 แต้ม หากผู้เล่นทั้งสองแปรพักตร์ ทั้งสองจะได้รับผลประโยชน์เพียงคนละ 1 แต้ม ตารางผลลัพธ์เป็นดังนี้
ร่วมมือ | แปรพักตร์ | |
---|---|---|
ร่วมมือ | 3, 3 | 0, 5 |
แปรพักตร์ | 5, 0 | 1, 1 |
หากจำกัดความด้วยคำว่า "แพ้" หรือ "ชนะ" ตารางจะดูเหมือนแบบนี้
ร่วมมือ | แปรพักตร์ | |
ร่วมมือ | ชนะ-ชนะ | แพ้มากกว่า-ชนะมากกว่า |
แปรพักตร์ | ชนะมากกว่า-แพ้มากกว่า | แพ้-แพ้ |
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
bthkhwamniimmikarxangxingcakaehlngthimaidkrunachwyprbprungbthkhwamni odyephimkarxangxingaehlngthimathinaechuxthux enuxkhwamthiimmiaehlngthimaxacthukkhdkhanhruxlbxxk eriynruwacanasaraemaebbnixxkidxyangiraelaemuxir khwamlabakickhxngnkoths xngkvs prisoner s dilemma epnpyhaphunthaninthvsdiekmsungaesdngihehnwaehtuidkhnsxngkhncungxacimrwmmuxknaemwathngsxngcaidrbphlpraoychnmakthisudinkarrwmmuxknnn edimpyhadngklawkhidkhunodyemxrrill fld aelaemlwin edrchechxr sungkalngthanganxyuthi RAND inpi kh s 1950 xlebirt dbebilyu thkekxrthaihekmdngklawepnraebiybaebbaephndwykarkahndothscakhukaelaihchuxwa khwamlabakickhxngnkoths twxyangkhlassikkhxngkhwamlabakickhxngnkothsmidngni phutxngsngsysxngkhnthuktarwccbkum tarwcmihlkthanimephiyngphxthicaphisucnwamikhwamphid tarwcaeykphutxngsngsythngkhuxxkcakkn aelaesnxkhxesnxediywknaekphutxngsngsythngkhu hakkhnhnungihkarepnphyantxxikkhnhnung aeprphktr aelaxikkhnhnungyngkhngimihkar rwmmux phuaeprphktrcathukplxytwipaetphusmkhbkhidthiimihkarcaidrbothscakhuketmhnungpi hakthngkhuimihkar nkothsthngsxngcathuktdsincakhukephiynghnungeduxndwykhxhaelknxy hakthngsxngihkar aetlakhncaidrbothssameduxn nkothsaetlakhntxngeluxkthicathrysxikfayhnunghruxptiesththicaihkar aetlakhntangkruwaxikfayhnungimxacruidthungkarthryskxnkarsubswncasinsud nkothskhwrthaxyangir hakphuelnaetlakhntangsnicldewlainkarthukcakhuklngihehluxnxythisud echnnnaelwkhwamlabakickhxngnkothskcaepnekmthimiphlrwmimepnsunysungphuelnthngsxngxacrwmmuxknhruxaeprphktrcakphuelnxikkhnhnung inekmni echnediywkbthvsdiekmswnmak phuelnaetlakhn nkoths tangktxngkarihtnexngidrbphlpraoychnmakthisud odyimkhanungthungphlpraoychnkhxngphuelnxikkhnhnung smdulechphaakhxngekmnikhux sphawaelwkwaxutmphaphaebbphaerot Pareto suboptimal solution nnkhux thangeluxknaihphuelnthngsxngeluxkthicaaeprphktrthngkhu thungaemwaphuelnaetlakhncaidrbphlpraoychnmakkwahakthngsxngrwmmuxkn inrupaebbkhlassikkhxngekmni karaeprphktrepnklyuththednehnuxkwakarrwmmuxkn dngnnsmdulthiepnipidkhxngekmnikhuxphuelnthukkhneluxkcaaeprphktr imwaphuelnxikfaycaeluxkxair aetphuelncaidrbphlpraoychnsungsudodykareluxkaeprphktr ephraawainsthankarnid kareluxkaeprphktridpraoychnmakkwacarwmmuxkn phuelnthukkhncungeluxkaeprphktr aelaphlthiidkcaxxkmaethaknklyuththsahrbkhwamlabakickhxngnkothskhlassikkhwamlabakickhxngnkothsaebbkhlassiksamarthsrupiddngni nkoths kh ptiesthcaihkar rwmmux nkoths kh sarphaph aeprphktr nkoths k ptiesthcaihkar rwmmux thngsxngrboths 1 eduxn nkoths k 1 pi nkoths kh plxytwepnxisrankoths k sarphaph aeprphktr nkoths k plxytwepnxisra nkoths kh 1 pi thngsxngrboths 3 eduxn lxngcintnakarduwakhunepnphueln k hakphueln kh tdsinicptiesthcaihkarekiywkbxachyakrrm khunkcaidphlpraoychnmakkwahakkhunsarphaph ephraakhuncathukplxytwepnxisra echnediywkn hakphueln kh sarphaph khunkcaidrbphlpraoychnmakkwathakhunsarphaph ephraakhuncaidrbothsephiyng 3 eduxn aethnthicaepn 1 pi cakmummxngni imwaphueln kh caeluxkxair phueln k kcaidrbphlpraoychnmakkwathasarphaph miphuklawwakarsarphaph aeprphktr epnklyuththednkhxngekmni hakkhunepnnkoths k khunsamarthklawidwa imwankoths kh caeluxkxyangir phm dichnkcaidepriybthacasarphaphkwaeluxkthicaimihkar dngnn ephuxehnaektwphm dichnexng phm dichnkhwrcasarphaph xyangirktam hakphuelnxikkhnhnungthaaebbediywkn khux thngsxngkhneluxkcasarphaph aelwthngsxngkcaidrbothsmakkwathikhunaelaxikfayhnungcaidrbhakeluxkthicaimihkarthngkhu nnkhux kartdsinicthiduehmuxnwacaihpraoychnaektnexngmakthisudklbimidihphlpraoychnthidithisud dngnncungklayepnthimakhxngkhwamlabakic inthvsdiekmniepntwxyangekmthimiphlrwmimepnsunywa smdulkhxngaenchimcaepncatxngepnxutmphaphkhxngphaerot aetaemwaphwkekhaimidrbxnuyatihsuxsarrahwangkn haknkothstangkechuxmnintwxikfay thngsxngksamartheluxkthicaimihkarid sungcaldothsaekphwkekhathngsxngrupaebbthwiprupaebbthwipkhxngekmidthukichbxykhrnginesrsthsastrthdlxng twxyangekmepndngni miphuelnsxngkhnkbnaythnakhar phuelnaetlakhnmiiphkhnlasxngib ibhnungmikhawa rwmmux swnxikibhnungmikhawa aeprphktr phuelnaetlakhnhmxbiphhnungibiwtrnghnanaythnakhar phuelnaetlafayimmioxkasrulwnghnaelywaxikfayhnunghmxbiphxair xnthicringepidiphkimidmiphlkrathbtxkarwiekhraahklyuththednaetxyangid intxnthaykhxngrxb naythnakharhngayhnaiphthngkhuaelacaykhatxbaethntamnn kahndihmiphuelnsxngkhn aedng aela naengin hakphuelnaedngaeprphktraelaphuelnnaenginrwmmux phuelnaedngcaidrbphlpraoychncakkaraeprphktrnn 5 aetm khnathiphuelnnaenginidrbphlpraoychn 0 aetm hakphuelnthngsxngrwmmuxkncaidrbrangwlaehngkhwamrwmmuxkhnla 3 aetm hakphuelnthngsxngaeprphktr thngsxngcaidrbphlpraoychnephiyngkhnla 1 aetm tarangphllphthepndngni twxyangtarangphlid rwmmux aeprphktrrwmmux 3 3 0 5aeprphktr 5 0 1 1 hakcakdkhwamdwykhawa aeph hrux chna tarangcaduehmuxnaebbni rwmmux aeprphktrrwmmux chna chna aephmakkwa chnamakkwaaeprphktr chnamakkwa aephmakkwa aeph aeph