Deep Learning

Deep Learning

ในงานสัมมนา Google I/O 2015 ที่เพิ่งจัดไปเมื่อปลายเดือนพฤษภาคมที่ผ่านมา Google ได้นำผลิตภัณฑ์หลายอย่างมานำเสนอต่อเหล่านักพัฒนาที่มารวมตัวกันเพื่อรับฟังและเรียนรู้เทคโนโลยีใหม่ๆ อย่างเช่น Android M, Android Wear, Cardboard V2 แอพพลิเคชันต่างๆ ของกูเกิลที่นำมาแสดงในงานเป็นแอพพลิเคชันที่มีความฉลาด แอพพลิเคชันมีความเข้าใจในเนื้อหาขณะนั้น สามารถเรียนรู้สถานการณ์ และสภาพแวดล้อม แล้วทำการวิเคราะห์เพื่อนำเสนอผลลัพธ์หรือเนื้อหาที่คิดว่าเหมาะสมกับสถานการณ์นั้นๆ เพื่อสร้างประสบการณ์ที่ดีให้กับผู้ใช้งานแอพพลิเคชัน

สิ่งที่อยู่เบื้องหลังความฉลาดของแอพพลิเคชันต่างๆ ของกูเกิลก็คือ Machine Learning ซึ่งก็คือปัญญาประดิษฐ์ (Artificial Intelligence) นั่นเอง การที่เครื่องจักรมีความสามารถในการเรียนรู้ได้เองโดยไม่ต้องเขียนโปรแกรม อาจจะโดยผ่านการสอนหรือไม่ผ่านการสอนก็ได้ ความสามารถนี้เราเรียกว่า Machine Learning ยกตัวอย่างเช่น การแก้ไขปัญหาจราจร ถ้าเราต้องการให้โปรแกรมของเราคาดการณ์สภาวะการจราจรบนถนนเส้นใดเส้นหนึ่ง เราก็ทำให้โปรแกรมของเรามีความสามารถในการเรียนรู้ (Machine Learning) แล้วป้อนรูปแบบการจราจรของถนนเส้นนั้นในอดีตที่ผ่านมาให้กับโปรแกรม ถ้าโปรแกรมสามารถเรียนรู้ได้สำเร็จโปรแกรมจะสามารถทำนายรูปแบบการจราจรในอนาคตต่อไปได้
ในช่วงหลายปีที่ผ่านมา บริษัทยักษ์ใหญ่ด้านไอทีได้ให้ความสำคัญอย่างมากกับการศึกษาและวิจัยเรื่องปัญญาประดิษฐ์ ไม่ว่าจะเป็น Google, Microsoft, IBM, Facebook หรือแม้แต่ Apple ต่างก็ตั้งทีมงานสำหรับทำการวิจัยและพัฒนาความรู้ในด้านนี้ เพื่อนำมาเสริมสร้างผลิตภัณฑ์ของตน ให้สามารถสร้างประสบการณ์ที่ดีแก่ผู้ใช้งานได้

การเรียนรู้ของมนุษย์เป็นสิ่งที่น่าอัศจรรย์ มนุษย์สามารถเรียนรู้สิ่งต่างๆ ได้ทั้งจากการสอนและการเรียนด้วยตนเอง การเรียนรู้ของมนุษย์เกิดจากการสังเกต จดจำแล้วสร้างความเข้าใจ หรือสร้างความสัมพันธ์ของสิ่งต่างๆ เกิดเป็นความรู้ที่สามารถนำไปใช้กับเหตุการณ์ที่เกิดขึ้นใหม่ การทำให้เครื่องจักรเรียนรู้ได้แบบมนุษย์จึงต้องเลียนแบบการเรียนรู้ของมนุษย์

 

Deep Learning

Machine Learning ของกูเกิลใช้วิธีการที่เรียกว่า Deep Learning โดยการสร้างระดับชั้นของการเรียนรู้ โดยระดับล่างสุดเป็นการเรียนรู้ขั้นพื้นฐานคือการแยกแยะองค์ประกอบ เช่น รูปภาพก็ทำการแยกแยะ เส้น จุด รูปทรง สี ซึ่งเป็นสิ่งพื้นฐานของภาพจากนั้นในชั้นบนถัดขึ้นมา ก็จะนำส่วนย่อยๆ นั้นมาประกอบเข้ากันเพื่อทำการจำแนกในลักษณะที่ใหญ่ขึ้น เช่น ตา จมูก ปาก ฟัน หู เส้นขน จากนั้นในชั้นถัดไปจึงจำแนกว่าเป็นส่วนใดของร่างกายแล้วจึงจำแนกว่าเป็นสัตว์ชนิดใดในชั้นสูงๆ ขึ้นไป กูเกิลประกาศว่าในขณะนี้บริษัทสามารถสร้างระดับชั้นของการเรียนรู้นี้ได้สูงถึง 30 ชั้น

ระดับชั้นแต่ละระดับมีความสัมพันธ์ซึ่งกันและกัน ความสัมพันธ์นี้มีลักษณะที่มากมายและซับซ้อน และมีผลต่อการประมวลผลการเรียนรู้ การนำเทคโนโลยีโครงข่ายสมอง (Neural Network) เข้ามาช่วยในการจัดการกับปัญหาจึงเป็นทางเลือกที่เหมาะสมด้วยวิธีการ Deep Learning แบบนี้ทำให้โปรแกรม Google Photos สามารถแยกแยะองค์ประกอบของรูปภาพต่างๆ และสามารถจัดกลุ่มของภาพที่ถ่ายในสถานที่เดียวกันได้ หรือถ่ายในเหตุการณ์เดียวกันได้ นอกจากภาพถ่ายแล้ว Deep Learning ยังสามารถนำไปใช้กับข้อมูลอื่นๆ ได้ เช่น เสียง ภาพเคลื่อนไหว และลายมือ ปัจจุบันระบบจดจำเสียงของกูเกิลมีระดับความผิดพลาดเพียง 8% เท่านั้น

โลกในยุคของ Machine Learning

Machine Learning ไม่ใช่เรื่องใหม่ มีการศึกษาเรื่องนี้มาเป็นระยะเวลานาน และมีการนำมาใช้งานแล้ว ปัจจุบันสิ่งที่เห็นได้ชัดคือ การแสดงผลการค้นหาของกูเกิล และการแสดงโฆษณาที่เกี่ยวข้องในผลการค้นหา การแนะนำหนังสือหรือสินค้าที่คิดว่าผู้ใช้น่าจะสนใจของเว็บไซต์อเมซอน การแนะนำเพื่อนของเฟซบุ๊ค

แต่การนำ Deep Learning มาใช้เป็นการเปิดประตูสู่การทำงานกับข้อมูลที่ทำให้เป็นค่าตัวเลขได้ยากอย่างเช่น รูปภาพและเสียง สิ่งที่พวกเราจะได้เห็นกันในอนาคตอันใกล้ก็คือ พาหนะไร้คนขับ อย่างเช่น Google Car ซึ่งสามารถวิ่งไปบนท้องถนน สามารถรับรู้สถานการณ์ต่างๆ บนท้องถนน และสามารถขับเคลื่อน และหลบหลีกสิ่งกีดขวางได้อย่างปลอดภัย การสั่งงานด้วยเสียงที่เที่ยงตรงแม่นยำมากขึ้นเรื่อยๆ จนต่อไปในอนาคตเราอาจไม่ต้องใช้คีย์บอร์ดและเมาส์ การรักษาความปลอดภัยในชีวิตและทรัพย์สินที่รวดเร็ว และสามารถป้องกันเหตุร้ายต่างๆ ได้ คงต้องคอยเฝ้าดูกันต่อไปสำหรับนวัตกรรมใหม่ๆ ที่จะเกิดขึ้นจากเทคโนโลยีนี้ในอนาคตอันใกล้นี้



Top