บทความนี้อาจต้องการตรวจสอบต้นฉบับ ในด้านไวยากรณ์ รูปแบบการเขียน การเรียบเรียง คุณภาพ หรือการสะกด คุณสามารถช่วยพัฒนาบทความได้ |
การให้น้ำหนักคำ (อังกฤษ: term weighting) หรือการกำหนดน้ำหนักคำ เป็นวิธีการให้น้ำหนักสำหรับคำที่มีความสำคัญหรือใช้เป็นตัวแทนของเอกสารที่ควรจะปรากฏอยู่เป็นจำนวนมากในเนื้อหาของเอกสารเฉพาะฉบับนั้น และปรากฏอยู่น้อยในชุดของเอกสารที่เหลือทั้งหมด แต่ถ้าคำนั้นปรากฏเป็นจำนวนมากในทุก ๆ เอกสาร แสดงว่าคำดังกล่าวไม่สามารถเป็นตัวแทนของเอกสารใด ๆ ได้ ซึ่งคำเหล่านั้นเรียกว่าคำหยุด (อังกฤษ: stop word) เช่น a, and, the เป็นต้น ดังนั้นการให้น้ำหนักคำ ๆ หนึ่งในเอกสารฉบับหนึ่งจะพิจารณาจากความถี่ของคำ (อังกฤษ: Term Frequency) ที่ปรากฏในเอกสารนั้นและจำนวนของเอกสารทั้งหมดที่มีคำ ๆ นั้นปรากฏอยู่ วิธีการให้น้ำหนักของคำวิธีหนึ่งคือ (อังกฤษ: Term Frequency. Inverted Document Frequency)
อ้างอิง
- Salton, G. and C. Buckley. 1988. Term-weighting approaches in automatic text retrieval. Information Processing and Management. 24(5): 513-523.
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
bthkhwamnixactxngkartrwcsxbtnchbb indaniwyakrn rupaebbkarekhiyn kareriyberiyng khunphaph hruxkarsakd khunsamarthchwyphthnabthkhwamid karihnahnkkha xngkvs term weighting hruxkarkahndnahnkkha epnwithikarihnahnksahrbkhathimikhwamsakhyhruxichepntwaethnkhxngexksarthikhwrcapraktxyuepncanwnmakinenuxhakhxngexksarechphaachbbnn aelapraktxyunxyinchudkhxngexksarthiehluxthnghmd aetthakhannpraktepncanwnmakinthuk exksar aesdngwakhadngklawimsamarthepntwaethnkhxngexksarid id sungkhaehlanneriykwakhahyud xngkvs stop word echn a and the epntn dngnnkarihnahnkkha hnunginexksarchbbhnungcaphicarnacakkhwamthikhxngkha xngkvs Term Frequency thipraktinexksarnnaelacanwnkhxngexksarthnghmdthimikha nnpraktxyu withikarihnahnkkhxngkhawithihnungkhux xngkvs Term Frequency Inverted Document Frequency xangxingSalton G and C Buckley 1988 Term weighting approaches in automatic text retrieval Information Processing and Management 24 5 513 523