วิธีมอนเตการ์โล (Monte Carlo method, MC) เป็นชื่อเรียกวิธีการที่ใช้ในการทำการจำลองหรือการวิเคราะห์เชิงตัวเลข เดิมทีมีที่มาจากการที่คิดวิธีเพื่อที่จะค้นหารูปแบบของการเคลื่อนวนของนิวตรอนภายในสสาร และได้รับการตั้งชื่อนี้โดยจอห์น ฟอน นอยมันน์ โดยที่มาของชื่อมาจากชื่อเขตมอนเตการ์โลของโมนาโกซึ่งมีชื่อเสียงเรื่องกาสิโน
ทฤษฎีการคำนวณ
ในสาขาทฤษฎีการคำนวณ วิธีมอนเตการ์โลได้รับการนิยามว่าหมายถึงขั้นตอนวิธีแบบสุ่ม ภายใต้ขอบเขตบนของความน่าจะเป็นที่จะให้คำตอบที่ไม่ถูกต้อง ตัวอย่างเช่น ขั้นตอนวิธีนี้จะตอบว่าใช่อย่างแน่นอนหากจำนวนที่ให้เป็นจำนวนเฉพาะ แต่ถ้าเป็นจำนวนประกอบก็อาจตอบว่าใช่ ทั้ง ๆ ที่ควรจะตอบว่าไม่ใช่ แม้ว่าจะมีความน่าจะเป็นน้อยมากก็ตาม โดยทั่วไป วิธีมอนเตการ์โลจะทำโดยเลือกแบบสุ่มโดยอิสระแล้ววนซ้ำไปเรื่อย ๆ และความน่าจะเป็นที่จะได้คำตอบที่ไม่ถูกต้องสามารถลดลงได้ด้วยการทุ่มเทเวลามากขึ้น ในบรรดาวิธีมอนเตการ์โล วิธีที่ขอบเขตบนของปริมาณการคำนวณเวลาสูงสุดสำหรับข้อมูลใด ๆ ที่ป้อนเข้าถูกกำหนดโดยพหุนามของขนาดค่าป้อนเข้า เรียกว่าเป็นวิธีมอนเตการ์โลที่มีประสิทธิภาพ
ขั้นตอนวิธีการเลือกแบบสุ่มซึ่งตามทฤษฎีไม่จำเป็นต้องสิ้นสุด แต่จะถูกต้องเสมอหากได้รับคำตอบ เรียกว่า
ทฤษฎีความซับซ้อนในการคำนวณ กำหนด ประเภทของปัญหาต่าง ๆ ที่สามารถจำลองได้ด้วย และแก้โดยใช้วิธีมอนเตการ์โล ตัวอย่างทั่วไป ได้แก่ RP, BPP และ PP ด้วยการอธิบายความสัมพันธ์ระหว่างประเภทเหล่านี้กับ P และ NP ช่วงของปัญหาที่สามารถแก้ไขได้โดยอัลกอริธึมที่มีการสุ่มเช่นวิธีมอนเตการ์โลจะขยาย (P ≠ BPP) หรือไม่ หรือจะเพียงแค่ลดลำดับเวลาพหุนามของปัญหาที่สามารถแก้ไขได้ด้วย (คือ P=BPP หรือไม่) นี่เป็นหนึ่งในคำถามสำคัญใน ทฤษฎีความซับซ้อนในการคำนวณ ปัจจุบันเรารู้ว่า NP ⊂ PP และ RP ⊆ NP แต่ไม่ทราบความสัมพันธ์ระหว่าง BPP และ NP
ปริพันธ์
ในด้านการวิเคราะห์เชิงตัวเลข มักใช้วิธีมอนเตการ์โลเป็นวิธีการประมาณความน่าจะเป็น หากทำการจำลอง n ครั้งและมีเหตุการณ์บางอย่างเกิดขึ้น m ครั้ง ความน่าจะเป็นของเหตุการณ์นั้นโดยธรรมชาติจะประมาณได้เป็น m/n ยิ่งจำนวนการทดลองน้อย การประมาณก็จะยิ่งหยาบ และยิ่งการทดลองมากขึ้น การประมาณก็จะยิ่งดีขึ้นเท่านั้น
นอกจากนี้ เมื่อใช้ความน่าจะเป็นนี้ ก็จะสามารถหาคำตอบโดยประมาณของ ปริพันธ์ (พื้นที่) ได้ พื้นที่ S ของพื้นที่ R สามารถประมาณได้เป็น S = pT โดยการสุ่มวางจุดภายในพื้นที่ของพื้นที่ T ที่รวมพื้นที่ R ด้วย และค้นหาความน่าจะเป็นที่ p ตกภายในพื้นที่ R โดยใช้วิธีมอนเตการ์โล
n- อินทิกรัลพับ
คำนวณโดยใช้วิธีมอนเตการ์โลที่มีขนาดตัวอย่างเป็น N โดยสร้างตัวเลขสุ่มชุด n × N ที่มีค่าระหว่าง 0 ถึง 1
แล้วให้
จะได้ I N เป็นค่าประมาณของอินทิกรัล การแทนที่ตัวเลขสุ่มแบบสม่ำเสมอด้วยลำดับการกระจายแบบสม่ำเสมอยิ่งส่งผลให้เกิดวิธีเสมือนมอนเตการ์โล
การเรียนรู้แบบเสริมกำลัง
ในบริบทของ ในสาขาการเรียนรู้ของเครื่อง วิธีมอนเตการ์โลหมายถึงวิธีการประมาณค่าสถานะและมูลค่าการกระทำโดยอาศัยประสบการณ์การได้รางวัลซึ่งมาจากแค่การกระทำ
สถิติศาสตร์
เป็นหนึ่งในวิธีมอนเตการ์โลซึ่งใช้ในทางสถิติศาสตร์
อ้างอิง
- Motwani & Raghavan 1995.
- Sutton, Richard S. (1998). Reinforcement Learning: An Introduction (PDF). p. 91. ISBN .
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
withimxnetkarol Monte Carlo method MC epnchuxeriykwithikarthiichinkarthakarcalxnghruxkarwiekhraahechingtwelkh edimthimithimacakkarthikhidwithiephuxthicakhnharupaebbkhxngkarekhluxnwnkhxngniwtrxnphayinssar aelaidrbkartngchuxniodycxhn fxn nxymnn odythimakhxngchuxmacakchuxekhtmxnetkarolkhxngomnaoksungmichuxesiyngeruxngkasionthvsdikarkhanwninsakhathvsdikarkhanwn withimxnetkarolidrbkarniyamwahmaythungkhntxnwithiaebbsum phayitkhxbekhtbnkhxngkhwamnacaepnthicaihkhatxbthiimthuktxng twxyangechn khntxnwithinicatxbwaichxyangaennxnhakcanwnthiihepncanwnechphaa aetthaepncanwnprakxbkxactxbwaich thng thikhwrcatxbwaimich aemwacamikhwamnacaepnnxymakktam odythwip withimxnetkarolcathaodyeluxkaebbsumodyxisraaelwwnsaiperuxy aelakhwamnacaepnthicaidkhatxbthiimthuktxngsamarthldlngiddwykarthumethewlamakkhun inbrrdawithimxnetkarol withithikhxbekhtbnkhxngprimankarkhanwnewlasungsudsahrbkhxmulid thipxnekhathukkahndodyphhunamkhxngkhnadkhapxnekha eriykwaepnwithimxnetkarolthimiprasiththiphaph khntxnwithikareluxkaebbsumsungtamthvsdiimcaepntxngsinsud aetcathuktxngesmxhakidrbkhatxb eriykwa thvsdikhwamsbsxninkarkhanwn kahnd praephthkhxngpyhatang thisamarthcalxngiddwy aelaaekodyichwithimxnetkarol twxyangthwip idaek RP BPP aela PP dwykarxthibaykhwamsmphnthrahwangpraephthehlanikb P aela NP chwngkhxngpyhathisamarthaekikhidodyxlkxrithumthimikarsumechnwithimxnetkarolcakhyay P BPP hruxim hruxcaephiyngaekhldladbewlaphhunamkhxngpyhathisamarthaekikhiddwy khux P BPP hruxim niepnhnunginkhathamsakhyin thvsdikhwamsbsxninkarkhanwn pccubneraruwa NP PP aela RP NP aetimthrabkhwamsmphnthrahwang BPP aela NPpriphnthtwxyangkarichwithimxnetkarol ephuxpramankha p emuxsumwang 30 000 cud khapramankhxng p thiidmikhwamphidphladnxykwa 0 07 cakkhacring indankarwiekhraahechingtwelkh mkichwithimxnetkarolepnwithikarpramankhwamnacaepn hakthakarcalxng n khrngaelamiehtukarnbangxyangekidkhun m khrng khwamnacaepnkhxngehtukarnnnodythrrmchaticapramanidepn m n yingcanwnkarthdlxngnxy karpramankcayinghyab aelayingkarthdlxngmakkhun karpramankcayingdikhunethann nxkcakni emuxichkhwamnacaepnni kcasamarthhakhatxbodypramankhxng priphnth phunthi id phunthi S khxngphunthi R samarthpramanidepn S pT odykarsumwangcudphayinphunthikhxngphunthi T thirwmphunthi R dwy aelakhnhakhwamnacaepnthi p tkphayinphunthi R odyichwithimxnetkarol n xinthikrlphb I 01 01f x1 x2 xn dx1 dxn displaystyle I int 0 1 dotsi int 0 1 f x 1 x 2 dotsc x n dx 1 dotsm dx n khanwnodyichwithimxnetkarolthimikhnadtwxyangepn N odysrangtwelkhsumchud n N thimikharahwang 0 thung 1 Xi j 1 i n 1 j N displaystyle X i j quad 1 leq i leq n 1 leq j leq N aelwih IN 1N jf X1 j X2 j Xn j displaystyle I N frac 1 N sum j f X 1 j X 2 j dotsc X n j caid I N epnkhapramankhxngxinthikrl karaethnthitwelkhsumaebbsmaesmxdwyladbkarkracayaebbsmaesmxyingsngphlihekidwithiesmuxnmxnetkarolkareriynruaebbesrimkalnginbribthkhxng insakhakareriynrukhxngekhruxng withimxnetkarolhmaythungwithikarpramankhasthanaaelamulkhakarkrathaodyxasyprasbkarnkaridrangwlsungmacakaekhkarkrathasthitisastrepnhnunginwithimxnetkarolsungichinthangsthitisastrxangxingMotwani amp Raghavan 1995 sfn error no target CITEREFMotwaniRaghavan1995 Sutton Richard S 1998 Reinforcement Learning An Introduction PDF p 91 ISBN 978 0262039246