แบบจำลองภาษา (language model) คือแบบจำลองเชิงสถิติที่แสดงการแจกแจงความน่าจะเป็น สำหรับข้อความภาษาธรรมชาติคำอธิบายเมื่อมีสายอักขระข้อความที่มีความยาว m แบบจำลองภาษาจะคำนวณความน่าจะเป็นของสายอักขระคำ…
โครงข่ายประสาทแบบสังวัตนาการ หรือ โครงข่ายประสาทแบบคอนโวลูชัน (convolutional neural network, CNN) เป็น แต่ละหน่วยเซลล์ภายในโครงข่ายลักษณะนี้สามารถถูกคำนวณร่วมไปกับหน่วยที่อยู่ในขอบเขตรอบข้าง เป็นวิ…
โอเพนเอไอ (อังกฤษ: OpenAI ) เป็นห้องปฏิบัติการวิจัยปัญญาประดิษฐ์ ประกอบด้วย OpenAI LP ซึ่งเป็นบริษัทที่แสวงหาผลกำไรและ OpenAI Inc. เป็นที่ไม่แสวงหาผลกำไร บริษัทเป็นคู่แข่งของ DeepMind ที่ดำเนินการว…
การเรียนรู้แบบกึ่งมีผู้สอน (semi-supervised learning) เป็นรูปแบบหนึ่งของการเรียนรู้ของเครื่องที่ใช้ข้อมูลที่มีฉลากกำกับจำนวนเล็กน้อยและข้อมูลที่ไม่มีฉลากกำกับจำนวนมากในระหว่างการฝึก การเรียนรู้แบบก…
ฟังก์ชันซอฟต์แมกซ์ (softmax function) หรือ ฟังก์ชันเลขชี้กำลังที่ทำให้เป็นปกติ (normalized exponential function) เป็นส่วนขยายแบบหลายมิติของฟังก์ชันซิกมอยด์ มักใช้เป็นฟังก์ชันกระตุ้นสำหรับขั้นสุดท้า…
กลไกความใส่ใจ (attention mechanism) หรือ แอตเทนชัน (attention) ในโครงข่ายประสาทเทียม เป็นเทคนิคที่ออกแบบมาเพื่อเลียนแบบกระบวนการความใสใจในการรับรู้ของมนุษย์กลไกความใส่ใจมีส่วนช่วยในการเสริมน้ำหนักข…
แบบจำลองรากฐาน (foundation model) เป็นแบบจำลองปัญญาประดิษฐ์ขนาดใหญ่ที่ได้รับการฝึกโดยใช้ข้อมูลจำนวนมหาศาลผ่านการเรียนรู้แบบสอนตัวเองหรือการเรียนรู้แบบกึ่งมีผู้สอน และสามารถนำไปใช้ในงานต่าง ๆ แยกตาม…
การปรับละเอียด (fine-tuning) ในสาขาการเรียนรู้ของเครื่อง เป็นวิธีการเรียนรู้แบบถ่ายโอนแบบหนึ่ง ทำโดยฝึกพารามิเตอร์น้ำหนักของแบบจำลองที่ได้รับการฝึกล่วงหน้าแล้วโดยใช้ข้อมูลใหม่ การปรับละเอียดสำหรับโ…