การเคลื่อนลงตามความชันแบบเฟ้นสุ่ม (stochastic gradient descent) เป็น ขั้นตอนวิธีแบบสุ่มสำหรับปัญหาการหาค่าเหมาะที่สุดโดยการทำซ้ำอย่างต่อเนื่อง วิธีนี้ปรับปรุงมาจากวิธีการเคลื่อนลงตามความชันแบบดั้งเดิม ซึ่งเป็นวิธีการเรียนรู้โดยอาศัยชุดข้อมูลทั้งหมด การจะใช้วิธีนี้ได้ฟังก์ชันเป้าหมายจำเป็นต้องอยู่ในรูปที่หาอนุพันธ์ได้
แนวคิด
พิจารณาปัญหาการทำให้ค่าฟังก์ชันเป้าหมายในรูปแบบของผลรวมด้านล่างมีค่าน้อยที่สุด
เป้าหมายของเราคือการหาค่า ที่ทำให้ Q(w) มีค่าน้อยที่สุด โดยวิธีดั้งเดิมแล้ว จะใช้เป็นข้อมูลฝึกตัวที่ i
ในสถิติศาสตร์ดั้งเดิม ปัญหาการลดผลรวมจะปรากฏในปัญหาค่ากำลังสองน้อยสุด ปัญหาการประมาณภาวะน่าจะเป็นสูงสุด เป็นต้น ในกรณีทั่วไป ตัวประมาณค่าที่ลดผลรวมให้เหลือน้อยที่สุดเรียกว่าค่าประมาณ M อย่างไรก็ตาม สำหรับปัญหาการประมาณภาวะน่าจะเป็นสูงสุด เป็นที่ทราบกันมานานแล้วว่าแม้แต่เมื่อต้องการแก้ปัญหาเฉพาะจุดก็มีข้อจำกัดเข้มงวดมากแล้ว ดังในตัวอย่างของโทมัส เฟอร์กูสัน ดังนั้น นักทฤษฎีสถิติสมัยใหม่จึงมักพิจารณา (จุดที่อนุพันธ์กลายเป็นศูนย์) ของฟังก์ชันภาวะน่าจะเป็นสูงสุด
ปัญหาการทำให้ผลรวมต่ำสุดยังปรากฏในปัญหา ด้วย ถ้าให้ค่า เป็นค่าข้อมูลฝึกตัวที่ i แล้ว Q(w) คือค่าการสูญเสียเชิงประจักษ์
เมื่อทำให้ค่าฟังก์ชัน Q ข้างต้นเหลือน้อยที่สุด วิธีการเคลื่อนลงตามความชันแบบดั้งเดิม (การเรียนรู้แบบกลุ่ม) จะทำซ้ำการวนซ้ำดังนี้
โดย เรียกว่าเป็นขนาดขั้นบันได ใน การเรียนรู้ของเครื่อง เรียกอีกอย่างว่า
หากการแจกแจงความน่าจะเป็นเป็น เป็นการแจกแจงแบบเลขชี้กำลังที่มีพารามิเตอร์ตัวเดียว บางครั้งผลรวมของความชันสามารถคำนวณได้ด้วยการคำนวณเพียงเล็กน้อย แต่ก็มีกรณีที่จำเป็นต้องคำนวณความชันทีละตัวแล้วจึงคำนวณผลรวมจำนวนมาก ในกรณีเช่นนี้ ปริมาณการคำนวณต่อการวนซ้ำแต่ละครั้งสามารถลดลงได้โดยการคำนวณแค่เพียงส่วนหนึ่งของผลรวม แทนที่จะคำนวณผลรวมทั้งหมด วิธีนี้มีประสิทธิภาพสำหรับปัญหาการเรียนรู้ของเครื่องขนาดใหญ่มาก
อ้างอิง
- Ferguson, Thomas S. (1982). "An inconsistent maximum likelihood estimate". Journal of the American Statistical Association. 77 (380): 831–834. doi:10.1080/01621459.1982.10477894. JSTOR 2287314.
- Bottou, Léon; Bousquet, Olivier (2008). The Tradeoffs of Large Scale Learning. Advances in Neural Information Processing Systems. Vol. 20. pp. 161–168.
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
karekhluxnlngtamkhwamchnaebbefnsum stochastic gradient descent epn khntxnwithiaebbsumsahrbpyhakarhakhaehmaathisudodykarthasaxyangtxenuxng withiniprbprungmacakwithikarekhluxnlngtamkhwamchnaebbdngedim sungepnwithikareriynruodyxasychudkhxmulthnghmd karcaichwithiniidfngkchnepahmaycaepntxngxyuinrupthihaxnuphnthidtwxyangkrafthiaesdngkarldlngkhxngkhafngkchnepahmayodyichminiaebtchinwithikarekhluxnlngtamkhwamchnaebbefnsumaenwkhidphicarnapyhakarthaihkhafngkchnepahmayinrupaebbkhxngphlrwmdanlangmikhanxythisud Q w i 1nQi w displaystyle Q w sum i 1 n Q i w epahmaykhxngerakhuxkarhakha w displaystyle w thithaih Q w mikhanxythisud odywithidngedimaelw Qi displaystyle Q i caichepnkhxmulfuktwthi i insthitisastrdngedim pyhakarldphlrwmcapraktinpyhakhakalngsxngnxysud pyhakarpramanphawanacaepnsungsud epntn inkrnithwip twpramankhathildphlrwmihehluxnxythisuderiykwakhapraman M xyangirktam sahrbpyhakarpramanphawanacaepnsungsud epnthithrabknmananaelwwaaemaetemuxtxngkaraekpyhaechphaacudkmikhxcakdekhmngwdmakaelw dngintwxyangkhxngothms efxrkusn dngnn nkthvsdisthitismyihmcungmkphicarna cudthixnuphnthklayepnsuny khxngfngkchnphawanacaepnsungsud pyhakarthaihphlrwmtasudyngpraktinpyha dwy thaihkha Qi w displaystyle Q i w epnkhakhxmulfuktwthi i aelw Q w khuxkhakarsuyesiyechingpracks emuxthaihkhafngkchn Q khangtnehluxnxythisud withikarekhluxnlngtamkhwamchnaebbdngedim kareriynruaebbklum cathasakarwnsadngni w w h Q w w h i 1n Qi w displaystyle w w eta nabla Q w w eta sum i 1 n nabla Q i w ody h displaystyle eta eriykwaepnkhnadkhnbnid in kareriynrukhxngekhruxng eriykxikxyangwa hakkaraeckaecngkhwamnacaepnepn epnkaraeckaecngaebbelkhchikalngthimipharamietxrtwediyw bangkhrngphlrwmkhxngkhwamchnsamarthkhanwniddwykarkhanwnephiyngelknxy aetkmikrnithicaepntxngkhanwnkhwamchnthilatwaelwcungkhanwnphlrwmcanwnmak inkrniechnni primankarkhanwntxkarwnsaaetlakhrngsamarthldlngidodykarkhanwnaekhephiyngswnhnungkhxngphlrwm aethnthicakhanwnphlrwmthnghmd withinimiprasiththiphaphsahrbpyhakareriynrukhxngekhruxngkhnadihymakxangxingFerguson Thomas S 1982 An inconsistent maximum likelihood estimate Journal of the American Statistical Association 77 380 831 834 doi 10 1080 01621459 1982 10477894 JSTOR 2287314 Bottou Leon Bousquet Olivier 2008 The Tradeoffs of Large Scale Learning Advances in Neural Information Processing Systems Vol 20 pp 161 168