Machine Learning คือ 4 มีกี่ประเภท เบื้องต้น ภาษาไทย ในชีวิตประจำวัน

Click to rate this post!
[Total: 367 Average: 5]

Machine Learning คือ

Machine Learning คือ

การค้นหาข่าวปลอมด้วยวิธีการเรียนรู้ของเครื่อง (Machine Learning)

ปัจจุบันนั้นข้อมูลจำนวนมากถูกสร้างขึ้นบนเครือข่ายสังคมออนไลน์ในรูปแบบโซเชียลมีเดียต่างๆ ซึ่งนั่นทำให้เกิดข้อมูลต่างๆ บนเว็บไซต์เพิ่มขึ้นอย่างมหาศาล และเมื่อเกิดเหตุการณ์ใดเหตุการณ์หนึ่งเกิดขึ้น ก็จะเกิดการกล่าวถึงจากผู้คนจำนวนมากที่ใช้งานอยู่ภายใต้แพลตฟอร์มต่างๆ บนโลกออนไลน์นั่นเอง แต่อย่างไรก็ก็ตาม เนื่องด้วยการกระจายของข่าวเป็นวงกว้างนั้นทำให้เกิดปัญหากับผู้ติดตามข่าวนั่นเอง เพราะการกระจายของข่าวนั้นจะทำให้เกิดแหล่งข้อมูลที่ไม่พึงประสงค์เกิดขึ้นมากมาย หรือเกิดการแก้ไขบิดเบือนข้อมูลให้มีความผิดเพี้ยนไปซึ่งอาจจะเกิดข่าวลวง ข่าวลือ และทฤษฎีสมคบคิด ซึ่งจะทำให้ผู้คนนั้นเข้าใจผิดกันไป และเมื่อมีการส่งต่อกันออกไป ก็จะยิ่งเป็นการกระจายข่าวที่ผิดให้มีจำนวนเพิ่มขึ้นไปด้วย

            ข่าวหลายๆประเภทอย่างเช่น ข่าวเหตุการณ์เลวร้ายจากธรรมชาติ หรือเหตุการณ์เลวร้ายจากเหตุการ์ไม่คาดฝันต่างๆ เป็นต้น ลักษณะข่าวดังกล่าวนั้นเมื่อถูกกระจายออกไปเป็นวงกว้างมักจะทำให้เกิดความสับสนอยู่บ่อยครั้ง ถึงแม้จะมีข่าวจริงปะปนอยู่ แต่ผู้คนส่วนใหญ่ก็มักจะเจอกับข่าวปลอมมากกว่าข่าวที่เป็นความจริง ข่าวปลอมนั้นเกิดมาจากข้อมูลทีผิ่ดพลาด ความเข้าใจผิดของผู้รับสาร และนำไปส่งต่อ หรือมาจากแหล่งที่ไม่น่าเชื่อถือ ในประเทศไทยเองถ้าศึกษาภูมิศาสตร์ของประเทศ ก็จะสามารถคาดเดาได้ว่าประเทศไทยนั้นจะพบกับปัญหาด้านภัยธรรมชาติด้านใดบ้าง และก็มักจะพบข่าวลือเกี่ยวกับปัญหาที่มักจะเกิดบ่อยๆ หรือการส่งต่อข่าวอันเป็นเท็จต่อกันเป็นทอดๆต่อกันไป ตัวอย่างเช่นปัญหาเกี่ยวกับน้ำท่วมอาจจะมีการแจ้งเตือนว่าจะเกิดขึ้นกับริเวณใดบ้างจากแหล่งข่าวที่ไม่น่าเชื่อถือต่างๆ ซึ่งถึงแม้ว่าปัญหาดังกล่าวจะไม่เกิดขึ้นจริง แต่ก็ส่งผลต่อผู้คนที่รับข่าวสารนั้นไปทำให้เกิดความตระหนกตกใจ หรือสูญเสียทรัพย์สินที่ใช้ในการป้องกันปัญหาที่เกิดจากข่าวปลอมนั่นเอง

            ความน่าเชื่อถือของข้อมูลนั้นถูกนิยามไว้ด้วยคำหลายแบบในภาษาอังกฤษเช่น trustworthiness, believability, reliability, accuracy, fairness และ objectivity เป็นต้น จากการนิยามที่หลากหลายก็มีการนำการเรียนรู้ของเครื่อง (Machine Learning) มาใช้เรียนรู้และพยากรณ์ความน่าเชื่อถือจากข้อความในแพลตฟอร์มบนทวิตตเอร์ (Twitter) เช่นเดียวกัน

            มาดูส่วนเนื้อหาของการนิยามข่ามปลอมกันบ้าง ข่าวปลอมนั้นเป็นเนื้อหาที่พยายามหลอกให้คนเชื่อโดยอาศัยการปลอมแปลงข้อมูล และหลายครั้งมามาในรูปแบบของข้อความที่เรียกร้องความเห็นใจ หรือความสงสาร และเมื่อผู้รับสารได้รับข่าวสารปลอมนั้นไป ก็มักจะมีการส่งต่อไปอย่างรวดเร็ว การแพร่กระจายของข่าวปลอมในโลกดิจิทัลในปัจจุบันมักจะมีการผสมผสานกันได้อย่างน่าเชื่อของข้อมูลจริง และข้อมูลเท็จ ซึ่งลักษณะดังกล่าวส่งผลให้มีความซับซ้อนในการจำแนกข่าวจริงหรือข่าวปลอม แต่อย่างไรก็ตาม การมีข่าวปลอมเกิดขึ้นมามักจะส่งผลเสียมากกว่าผลดีเสมอ

            การนำหลักการของ Machine Learning มาใช้จำแนกข่าวปลอมมีหลากหลายวิธี โดยวิธีที่จะนำเสนอต่อจากนี้จะพูดถึงอยู่สามวิธีคือ Naïve Bayes, โครงข่ายประสาทเทียม (Neural network), และ Support Vector Machine (SVM) สามารถอืบายคร่าวๆสำหรับการทำงานในแต่ละวิธีได้ดังนี้ Naïve Bayes เป็นการจำแนกข้อมูลโดยอาศัยความน่าจะเป็นของข้อมูล, โครงข่ายประสาทเทียม เป็นแบบจำลองทางคณิตศาสตร์สำหรับกระบวนการคำนวณข้อมูลด้วยการเชื่อมต่อและการประมวลผลแบบขนาน และ เป็นการจำแนกประเภทวิธีการเรียนรู้ภายใต้การดูแลที่ใช้ไฮเปอร์เพลนเพื่อแยกจุดของคลาสข้อมูลสองจุดด้วยระยะขอบสูงสุด โดยวิธีการวัดผลของวิธีการด้าน Machine Learning นั้นโดยปกติจะใช้ตัววัดค่าอยู่ 4 ค่าดังนี้คือ precision, recall, F-measure และ accuracy ที่จะอาศัยการคำนวณค่าพารามิเตอร์ทั้ง 4 ชนิดดังนี้ TP (True Positive) คือจำนวนข้อความที่ถูกต้องจำแนกตามข้อความที่น่าเชื่อถือ, TN (True Negative) คือจำนวนข้อความที่ถูกต้องจำแนกตามข้อความที่ไม่น่าเชื่อ , FP (False Positive) คือจำนวนข้อความที่ไม่ถูกต้องจำแนกตามข้อความที่น่าเชื่อ และ FN (False Negative) คือ จำนวนข้อความที่ไม่ถูกต้องจำแนกตามข้อความที่ไม่น่าเชื่อ และจะนำพารามิเตอร์ทั้ง 4 ชนิดมาหาคำนวณตัววัดค่าต่อไป

23082021 1

รูปที่ 1 ภาพรวมการทำงานสำหรับสร้างองค์ความรู้ในระบบ Machine Learning

            เมื่อรู้จักวิธีการคำนวณไปแล้วต่อมาทำความรู้จักกับภาพรวมของระบบที่นำมาสร้างองค์ความรู้สำหรับนนำใช้ในระบบ Machine Learning จะแสดงดังรูปที่ 1 โดยวิธีการที่พูดถึงในบทความนี้จะทำการตรวจสอบข้อมูลบน Twitter เพื่อนำมาจำแนกข่าวปลอม โดยจะประกอบไปด้วย การเข้าไปที่เนื้อหาต้นทางซึ่งคือ Twitter จากนั้นทำการเลือกหัวข้อ และปรับข้อมูลให้อยู่ในรูปแบบที่นำไปเข้าสู่ระบบได้ ทำการลบข้อมูลที่ซ้ำซ้อน และนำเข้าสู่การสร้างองค์ความรู้ของ Machine Learning

            การจัดการข้อมูลเพื่อนำเข้าสู่ระบบ Machine Learning นั้นจำเป็นที่ต้องกำหนดลักษณะของข้อมูลเป็นรูปแบบของตาราง และกำหนดว่าจะต้องมีข้อมูลใดบ้างที่ต้องนำไปใช้ในการสร้างองค์ความรู้ โดยเนื้อหาที่นำมาเรียนรู้สำหรับ Twitter จะประกอบไปด้วยข้อมูล 22 ชนิดดังนี้คือ Id, Name, IsVerified, ProfileImageUrl, FollowersCount, FriendsCount, FavouritesCount, StatusesCount, Description, Location, TimeZone, UserCreatedDate, Status, Url, Mentions, Number of Mentions, HashTags, Number of HashTags, RetweetCount, TweetCreatedDate, MessageText และ MessageImage ส่วนของหัวข้อที่สนใจนั้น สามารถเลือกได้ตามผู้ใช้ได้เลย โดยเมื่อผ่านวิธีการทางด้าน Machine Learning ทั้งสามวิธีนั้น ได้ผลลัพธ์ดังตารางที่ 1 จะเป็นการวัดผลพารามิเตอร์ต่างๆ และความแม่นยำของแต่ละวิธีนั่นเอง

ตารางที่ 1 ผลการทดลองจากวิธีการ Naïve Bayes, โครงข่ายประสาทเทียม (Neural network), และ Support Vector Machine (SVM)

23082021 2

     โดยจากวิธีการ และผลลัพธ์ต่างๆจะสรุปได้ว่าข่าวปลอมนั้นสามารถที่จะใช้วิธีการทางด้าน Machine Learning มาช่วยแก้ปัญหาได้อย่างมีประสิทธิภาพ โดยในเนื้อหาที่กล่าวถึงทั้ง 3 วิธีคือ Naïve Bayes, โครงข่ายประสาทเทียม (Neural network), และ Support Vector Machine (SVM) จะได้ผลลัพธ์เป้นอย่างที่น่าพอใจ ถึงแม้ผู้ใช้งานจะย้ายไปจัดการกับข้อมูลจากแพตฟอร์มอื่น ก็ยังคงสามารถใช้งานได้อย่างมีประสิทธิภาพได้เช่นเดียวกัน เพียงแต่ส่วนสำคัญคือการจัดการข้อมูลสำหรับนำเข้ามาเข้าสู่ระบบ Machine Learning ให้เหมาะสม ก็จะได้ผลลัพธ์เป็นที่น่าพอใจเช่นเดียวกัน

ที่มา:มหาวิทยาลัยเทคโนโลยีมหานคร


อัพเดทครั้งสุดท้าย เมื่อ 7 ตุลาคม 2021

Leave a Comment

Scroll to Top