วิทยาการข้อมูล (อังกฤษ: Data science) เป็นสหสาขาวิชาที่ใช้วิธีการ กระบวนการ อัลกอริทึม และระบบทางวิทยาศาสตร์มาใช้เพื่อหาความรู้จากข้อมูลหลากหลายรูปแบบ ทั้งจัดเก็บเป็นระเบียบและไม่เป็นระเบียบ เป็นสาขาที่เกี่ยวข้องกับการทำเหมืองข้อมูล การเรียนรู้เชิงลึก และข้อมูลขนาดใหญ่
วิทยาการข้อมูลเป็นศาสตร์ที่เป็นการบูรณาการสถิติศาสตร์ การวิเคราะห์ข้อมูล และการเรียนรู้ของเครื่องเข้าด้วยกันเพื่อให้สามารถเข้าใจและวิเคราะห์ปรากฏการณ์ที่เกิดขึ้นจริงในข้อมูลได้ ใช้เทคนิคและทฤษฎีที่ได้มาจากคณิตศาสตร์ สถิติศาสตร์ วิทยาการคอมพิวเตอร์ และวิทยาการสารสนเทศ
จิม เกรย์ นักวิทยาศาสตร์ผู้ได้รับรางวัลทัวริงมองว่า วิทยาการข้อมูลเป็นวิทยาศาสตร์แขนงที่สี่ ต่อยอดมาจากวิทยาศาสตร์การทดลอง วิทยาศาสตร์ทฤษฎี และวิทยาศาสตร์เชิงคำนวณ โดยเชื่อว่าทุกอย่างที่เกี่ยวข้องกับวิทยาศาสตร์กำลังจะเปลี่ยนไปโดยอิทธิพลของเทคโนโลยีสารสนเทศและการเพิ่มขึ้นของข้อ
พื้นฐาน
วิทยาการข้อมูลเป็นสหสาขาวิชาที่มุ่งเน้นการหาความรู้จากกลุ่มข้อมูลซึ่งส่วนมากมักมีขนาดใหญ่ ครอบคลุมตั้งแต่การเตรียมข้อมูลเพื่อวิเคราะห์ วิเคราะห์ และนำเสนอสิ่งที่ค้นพบให้กับผู้มีอำนาจใจการตัดสินใจในองค์กร จึงต้องใช้ทักษะทางด้านวิทยาการคอมพิวเตอร์ คณิตศาสตร์ สถิติศาสตร์ การนำเสนอข้อมูลด้วยภาพ การออกแบบกราฟิก และธุรกิจ
นักสถิติศาสตร์หลายคน อาทิ เนท ซิลเวอร์ มองว่าวิทยาการข้อมูลไม่ได้เป็นศาสตร์ใหม่ แต่เป็นอีกชื่อหนึ่งของสถิติศาสตร์ แต่บ้างก็แย้งว่าวิทยาการข้อมูลเน้นการศึกษาปัญหาและเทคนิคที่แตกต่างกับวิชาสถิติ โดยวิสันต์ ธาร์ ศาสตราจารย์ที่มหาวิทยาลัยนิวยอร์กมองว่าสถิติจะเน้นการศึกษาข้อมูลเชิงปริมาณและหาคำอธิบาย ส่วนวิทยาการข้อมูลจะเน้นศึกษาทั้งข้อมูลเชิงปริมาณและเชิงคุณภาพ (เช่นภาพ) และเน้นการพยากรณ์และการลงมือทำ
เส้นทางอาชีพ
วิทยาการข้อมูลเป็นศาสตร์ที่กำลังเติบโต นักวิทยาการข้อมูลเป็นอาชีพหนึ่งที่ได้รับเงินเดือนระดับที่สูงมากในสหรัฐอเมริกา โดยมีค่ามัธยฐานอยู่ที่ 118,370 ดอลลาร์สหรัฐต่อปี หรือประมาณ 56.91 ดอลลาร์ต่อชั่วโมง การเติบโตของสายงานสูงกว่าค่าเฉลี่ยของแรงงานในตลาด คาดว่าจะเติบโตราวร้อยละ 16 ระหว่างปี ค.ศ. 2018 ถึง ค.ศ. 2028
สาขาเฉพาะทางของวิทยาการข้อมูล
- นักวิทยาศาสตร์การเรียนรู้ของเครื่อง มีหน้าที่วิจัยหาวิธีการวิเคราะห์ข้อมูบแบบใหม่และสร้างอัลกอริทึม
- นักวิเคราะห์ข้อมูล ใช้ข้อมูลขนาดใหญ่เพื่อรวบรวมข้อมูลที่ตรงตามความความสนใจของบริษัท
- ที่ปรึกษาด้านข้อมูล ทำงานร่วมกับภาคธุรกิจเพื่อศึกษาว่าจะใช้ข้อมูลจากการวิเคราะห์ให้เกิดประโยชน์ได้อย่างไร
- สถาปนิกข้อมูล สร้างโซลูชันข้อมูลที่เหมาะสมกับการนำไปใช้งาน
- สถาปนิกการนำไปใช้งาน ติดตามการนำไปใช้งานตลอดทั้งวงจรธุรกิจ
ผลกระทบของวิทยาการข้อมูล
เครื่องมือวิเคราะห์ข้อมูลขนาดใหญ่เริ่มเป็นเครื่องมือสำคัญสำหรับภาคธุรกิจและบริษัททุกระดับ การมีข้อมูลขนาดใหญ่และมีความสามารถในการตีความได้เปลี่ยนแปลงโมเดลธุรกิจรูปแบบเก่า ก่อให้เกิดการสร้างโมเดลแบบใหม่ ธุรกิจที่เกิดจากข้อมูลมีมูลค่ารวมกันสูงถึง 1.2 ล้านล้านดอลลาร์สหรัฐในปี ค.ศ. 2020 เพิ่มขึ้นจากปี ค.ศ. 2015 ที่มีอยู่เพียง 333 พันล้านดอลลาร์ นักวิทยาการข้อมูลเป็นผู้ที่ย่อยข้อมูลให้อยู่ในรูปแบบที่มีประโยชน์ สร้างซอฟต์แวร์และอัลกอริทึมที่ช่วยให้บริษัทและองค์กรค้นพบวิธีการที่ดีที่สุดในการดำเนินธุรกิจ ข้อมูลขนาดใหญ่มีผลกระทบอย่างมหาศาลทั่วโลก
เทคโนโลยีและเทคนิค
เทคนิค
- การแบ่งกลุ่มข้อมูล เป็นวิธีการจัดกลุ่มข้อมูลเข้าด้วยกัน
- การลดมิติ ใช้เพื่อลดความความซับซ้อนในการคำนวณเพื่อให้การทำงานเร็วขึ้น
- การเรียนรู้ของเครื่อง ใช้ในการหารูปแบบจากข้อมูล
เทคโนโลยี
- ภาษาไพธอน เป็นภาษาคอมพิวเตอร์ที่ใช้กันทั่วไปในวงการวิทยาการข้อมูล มีไลบรารีให้เลือกใช้มากมา
- ภาษาอาร์ เป็นภาษาคอมพิวเตอร์ที่ใช้สำหรับการวิเคราะห์ทางสถิติและการทำเหมืองข้อมูล
- TensorFlow เป็นเฟรมเวิร์คที่ใช้ในการสร้างโมเดลการเรียนรู้ของเครื่อง พัฒนาโดยกูเกิล
- PyTorch เป็นเฟรมเวิร์คที่ใช้ในการสร้างโมเดลการเรียนรู้ของเครื่อง พัฒนาโดย
- เป็นส่วนติดต่อกับผู้ใช้รูปแบบเว็บสำหรับการเขียนภาษาไพธอนที่ทำให้การทำงานสะดวกขึ้น
- ใช้สำหรับการนำเสนอข้อมูลด้วยภาพ
- เป็นเฟรมเวิร์คสำหรับประมวลผลข้อมูลขนาดใหญ่ในระบบปฏิบัติการเชิงกระจาย
ดูเพิ่ม
อ้างอิง
- Dhar, V. (2013). . Communications of the ACM. 56 (12): 64–73. doi:10.1145/2500499. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 9 November 2014. สืบค้นเมื่อ 2 September 2015.
- (2013-12-12). . Simply Statistics. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2 January 2014. สืบค้นเมื่อ 1 January 2014.
- Hayashi, Chikio (1998-01-01). "What is Data Science? Fundamental Concepts and a Heuristic Example". ใน Hayashi, Chikio; Yajima, Keiji; Bock, Hans-Hermann; Ohsumi, Noboru; Tanaka, Yutaka; Baba, Yasumasa (บ.ก.). Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization (ภาษาอังกฤษ). Springer Japan. pp. 40–51. doi:10.1007/978-4-431-65950-1_3. ISBN .
- Stewart Tansley; Kristin Michele Tolle (2009). . Microsoft Research. ISBN . คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 20 March 2017. สืบค้นเมื่อ 16 December 2016.
- Bell, G.; Hey, T.; Szalay, A. (2009). "COMPUTER SCIENCE: Beyond the Data Deluge". Science. 323 (5919): 1297–1298. doi:10.1126/science.1170411. ISSN 0036-8075. PMID 19265007.
- . www.datascienceassn.org. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2020-08-10. สืบค้นเมื่อ 2020-04-03.
- "1. Introduction: What Is Data Science? - Doing Data Science [Book]". www.oreilly.com (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- "the three sexy skills of data geeks". m.e.driscoll: data utopian (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- . www.statisticsviews.com. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2020-06-11. สืบค้นเมื่อ 2020-04-03.
- "What's the Difference Between Data Science and Statistics?". Priceonomics (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- DharVasant (2013-12-01). "Data science and prediction". Communications of the ACM (ภาษาอังกฤษ). 56 (12): 64–73. doi:10.1145/2500499.
- "Best Jobs in America". Glassdoor (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- "Computer and Information Research Scientists : Occupational Outlook Handbook: : U.S. Bureau of Labor Statistics". www.bls.gov (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 2020-04-03.
- "Computer and Information Research Scientists : Occupational Outlook Handbook: : U.S. Bureau of Labor Statistics". www.bls.gov (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 2020-04-03.
- Pham, Peter. "The Impacts Of Big Data That You May Not Have Heard Of". Forbes (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- Martin, Sophia (2019-09-20). "How Data Science will Impact Future of Businesses?". Medium (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
- Martin, Sophia (2019-09-20). "How Data Science will Impact Future of Businesses?". Medium (ภาษาอังกฤษ). สืบค้นเมื่อ 2020-04-03.
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
withyakarkhxmul xngkvs Data science epnshsakhawichathiichwithikar krabwnkar xlkxrithum aelarabbthangwithyasastrmaichephuxhakhwamrucakkhxmulhlakhlayrupaebb thngcdekbepnraebiybaelaimepnraebiyb epnsakhathiekiywkhxngkbkarthaehmuxngkhxmul kareriynruechingluk aelakhxmulkhnadihy withyakarkhxmulepnsastrthiepnkarburnakarsthitisastr karwiekhraahkhxmul aelakareriynrukhxngekhruxngekhadwyknephuxihsamarthekhaicaelawiekhraahpraktkarnthiekidkhuncringinkhxmulid ichethkhnikhaelathvsdithiidmacakkhnitsastr sthitisastr withyakarkhxmphiwetxr aelawithyakarsarsneths cim ekry nkwithyasastrphuidrbrangwlthwringmxngwa withyakarkhxmulepnwithyasastraekhnngthisi txyxdmacakwithyasastrkarthdlxng withyasastrthvsdi aelawithyasastrechingkhanwn odyechuxwathukxyangthiekiywkhxngkbwithyasastrkalngcaepliynipodyxiththiphlkhxngethkhonolyisarsnethsaelakarephimkhunkhxngkhxphunthanwithyakarkhxmulepnshsakhawichathimungennkarhakhwamrucakklumkhxmulsungswnmakmkmikhnadihy khrxbkhlumtngaetkaretriymkhxmulephuxwiekhraah wiekhraah aelanaesnxsingthikhnphbihkbphumixanacickartdsinicinxngkhkr cungtxngichthksathangdanwithyakarkhxmphiwetxr khnitsastr sthitisastr karnaesnxkhxmuldwyphaph karxxkaebbkrafik aelathurkic nksthitisastrhlaykhn xathi enth silewxr mxngwawithyakarkhxmulimidepnsastrihm aetepnxikchuxhnungkhxngsthitisastr aetbangkaeyngwawithyakarkhxmulennkarsuksapyhaaelaethkhnikhthiaetktangkbwichasthiti odywisnt thar sastracarythimhawithyalyniwyxrkmxngwasthiticaennkarsuksakhxmulechingprimanaelahakhaxthibay swnwithyakarkhxmulcaennsuksathngkhxmulechingprimanaelaechingkhunphaph echnphaph aelaennkarphyakrnaelakarlngmuxthaesnthangxachiphwithyakarkhxmulepnsastrthikalngetibot nkwithyakarkhxmulepnxachiphhnungthiidrbengineduxnradbthisungmakinshrthxemrika odymikhamthythanxyuthi 118 370 dxllarshrthtxpi hruxpraman 56 91 dxllartxchwomng karetibotkhxngsayngansungkwakhaechliykhxngaerngnganintlad khadwacaetibotrawrxyla 16 rahwangpi kh s 2018 thung kh s 2028 sakhaechphaathangkhxngwithyakarkhxmul nkwithyasastrkareriynrukhxngekhruxng mihnathiwicyhawithikarwiekhraahkhxmubaebbihmaelasrangxlkxrithum nkwiekhraahkhxmul ichkhxmulkhnadihyephuxrwbrwmkhxmulthitrngtamkhwamkhwamsnickhxngbristh thipruksadankhxmul thanganrwmkbphakhthurkicephuxsuksawacaichkhxmulcakkarwiekhraahihekidpraoychnidxyangir sthapnikkhxmul srangosluchnkhxmulthiehmaasmkbkarnaipichngan sthapnikkarnaipichngan tidtamkarnaipichngantlxdthngwngcrthurkicphlkrathbkhxngwithyakarkhxmulekhruxngmuxwiekhraahkhxmulkhnadihyerimepnekhruxngmuxsakhysahrbphakhthurkicaelabrisththukradb karmikhxmulkhnadihyaelamikhwamsamarthinkartikhwamidepliynaeplngomedlthurkicrupaebbeka kxihekidkarsrangomedlaebbihm thurkicthiekidcakkhxmulmimulkharwmknsungthung 1 2 lanlandxllarshrthinpi kh s 2020 ephimkhuncakpi kh s 2015 thimixyuephiyng 333 phnlandxllar nkwithyakarkhxmulepnphuthiyxykhxmulihxyuinrupaebbthimipraoychn srangsxftaewraelaxlkxrithumthichwyihbristhaelaxngkhkrkhnphbwithikarthidithisudinkardaeninthurkic khxmulkhnadihymiphlkrathbxyangmhasalthwolkethkhonolyiaelaethkhnikhethkhnikh karaebngklumkhxmul epnwithikarcdklumkhxmulekhadwykn karldmiti ichephuxldkhwamkhwamsbsxninkarkhanwnephuxihkarthanganerwkhun kareriynrukhxngekhruxng ichinkarharupaebbcakkhxmulethkhonolyi phasaiphthxn epnphasakhxmphiwetxrthiichknthwipinwngkarwithyakarkhxmul miilbrariiheluxkichmakma phasaxar epnphasakhxmphiwetxrthiichsahrbkarwiekhraahthangsthitiaelakarthaehmuxngkhxmul TensorFlow epnefrmewirkhthiichinkarsrangomedlkareriynrukhxngekhruxng phthnaodykuekil PyTorch epnefrmewirkhthiichinkarsrangomedlkareriynrukhxngekhruxng phthnaody epnswntidtxkbphuichrupaebbewbsahrbkarekhiynphasaiphthxnthithaihkarthangansadwkkhun ichsahrbkarnaesnxkhxmuldwyphaph epnefrmewirkhsahrbpramwlphlkhxmulkhnadihyinrabbptibtikarechingkracayduephimkarthaehmuxngkhxmul kareriynruechingluk khxmulkhnadihy withyakarsarsnethsxangxingDhar V 2013 Communications of the ACM 56 12 64 73 doi 10 1145 2500499 khlngkhxmulekaekbcakaehlngedimemux 9 November 2014 subkhnemux 2 September 2015 2013 12 12 Simply Statistics khlngkhxmulekaekbcakaehlngedimemux 2 January 2014 subkhnemux 1 January 2014 Hayashi Chikio 1998 01 01 What is Data Science Fundamental Concepts and a Heuristic Example in Hayashi Chikio Yajima Keiji Bock Hans Hermann Ohsumi Noboru Tanaka Yutaka Baba Yasumasa b k Data Science Classification and Related Methods Studies in Classification Data Analysis and Knowledge Organization phasaxngkvs Springer Japan pp 40 51 doi 10 1007 978 4 431 65950 1 3 ISBN 9784431702085 Stewart Tansley Kristin Michele Tolle 2009 Microsoft Research ISBN 978 0 9825442 0 4 khlngkhxmulekaekbcakaehlngedimemux 20 March 2017 subkhnemux 16 December 2016 Bell G Hey T Szalay A 2009 COMPUTER SCIENCE Beyond the Data Deluge Science 323 5919 1297 1298 doi 10 1126 science 1170411 ISSN 0036 8075 PMID 19265007 www datascienceassn org khlngkhxmulekaekbcakaehlngedimemux 2020 08 10 subkhnemux 2020 04 03 1 Introduction What Is Data Science Doing Data Science Book www oreilly com phasaxngkvs subkhnemux 2020 04 03 the three sexy skills of data geeks m e driscoll data utopian phasaxngkvs subkhnemux 2020 04 03 www statisticsviews com khlngkhxmulekaekbcakaehlngedimemux 2020 06 11 subkhnemux 2020 04 03 What s the Difference Between Data Science and Statistics Priceonomics phasaxngkvs subkhnemux 2020 04 03 DharVasant 2013 12 01 Data science and prediction Communications of the ACM phasaxngkvs 56 12 64 73 doi 10 1145 2500499 Best Jobs in America Glassdoor phasaxngkvs subkhnemux 2020 04 03 Computer and Information Research Scientists Occupational Outlook Handbook U S Bureau of Labor Statistics www bls gov phasaxngkvsaebbxemrikn subkhnemux 2020 04 03 Computer and Information Research Scientists Occupational Outlook Handbook U S Bureau of Labor Statistics www bls gov phasaxngkvsaebbxemrikn subkhnemux 2020 04 03 Pham Peter The Impacts Of Big Data That You May Not Have Heard Of Forbes phasaxngkvs subkhnemux 2020 04 03 Martin Sophia 2019 09 20 How Data Science will Impact Future of Businesses Medium phasaxngkvs subkhnemux 2020 04 03 Martin Sophia 2019 09 20 How Data Science will Impact Future of Businesses Medium phasaxngkvs subkhnemux 2020 04 03