Big Data เริ่มต้นที่…?

Big Data เริ่มต้นที่…?

เทคโนโลยีบิ๊กดาต้ามีข้อดีที่เอื้อต่อการแข่งขันในเชิงธุรกิจหลายประการ การใช้ข้อมูลเชิงลึกเพื่อประกอบการตัดสินใจมักจะสร้างคุณค่ามหาศาลให้กับองค์กร

สามารถเริ่มต้นทำได้โดยอาศัยการนำข้อมูลจากแหล่งข้อมูลชนิดต่างๆ มาวิเคราะห์เพื่อให้เกิดเป็นความเข้าใจที่ลึกซึ้ง (Insight) และเชาว์ปัญญา (Intelligence) ในเชิงธุรกิจ ทว่าการใช้ประโยชน์จากเทคโนโลยีนี้ยังไม่กระจ่างเท่าไรนัก องค์กรหลายแห่งที่สนใจยังคงมีข้อข้องใจหลายประการ เช่น จะต้องวางแผนสร้างทีมอย่างไร ใช้เวลานานเท่าไหร่ คาดหวังผลอะไรได้บ้าง และที่สำคัญควรจะเริ่มต้นสร้างโปรเจคบิ๊กดาต้าอย่างไรจึงจะเหมาะสม

ระยะเวลาและความสำเร็จของการทำโปรเจคบิ๊กดาต้านั้นขึ้นอยู่กับระดับความชัดเจนของเป้าหมายทางธุรกิจ ความง่ายในการเข้าถึงข้อมูลที่ต้องใช้ ระดับความซับซ้อนของโมเดลวิเคราะห์ และอื่นๆ อีกมากมาย บุคลากรที่เกี่ยวข้องจึงควรเข้าใจตรงกันว่าการฟันธงในเรื่องต่างๆ ของโปรเจคบิ๊กดาต้านั้นควรยกให้เป็นการตัดสินใจในเชิงธุรกิจไม่ใช่เชิงไอที เพราะคำว่าการวิเคราะห์บิ๊กดาต้า (Big Data Analytics) นั้นไม่ได้หมายถึงฮาดูป (Hadoop) แต่เพียงอย่างเดียว การเริ่มต้นศึกษาเพื่อประยุกต์ใช้ศาสตร์ใหม่นี้จึงควรจะนำร่องจากโจทย์เล็กๆ ก่อน เพื่อสร้างความชัดเจนให้กับทีมงาน โดยให้ทดสอบ ทดลอง วิธีการบูรณาการข้อมูลเข้ากับกระบวนการทางธุรกิจให้เข้าใจอย่างถ่องแท้แล้วค่อยคุยกันเรื่องไอที

Begin with Defining The Problem

วิธีการใช้ประโยชน์เทคโนโลยีบิ๊กดาต้าควรจะเริ่มต้นจากการตั้งโจทย์เชิงธุรกิจที่ชัดเจน โดยสำรวจจากความท้าทายและเป้าหมายทางธุรกิจที่องค์กรพบอยู่ในปัจจุบัน เช่น ต้องการสร้างรายได้เพิ่มจากการขายสินค้า/บริการ ในกลุ่มลูกค้าเดิม ต้องการเปิดตลาดใหม่ ต้องการปรับกระบวนการทำงานในบางแผนกเพื่อเพิ่มประสิทธิภาพ ต้องการเพิ่มผลกำไร/ ลดต้นทุน ต้องการให้แบรนด์เป็นที่รู้จักอย่างกว้างขวางมากขึ้นหรือต้องการสร้างความพึงพอใจให้กับลูกค้า ซึ่งการเลือกโจทย์ปัญหาที่เหมาะสมตามทิศทางขององค์กรจะช่วยเพิ่มโอกาสสู่ความสำเร็จได้

Identifying The Impact

นอกจากนี้ทีมงานควรจะพิจารณาว่าโจทย์ที่เลือกขึ้นมานั้นมีผลกระทบต่อธุรกิจและบุคลากรขององค์กรในระดับใด หากทำสำเร็จองค์กรจะได้ประโยชน์สูงแค่ไหน กรณีศึกษา (Use Cases) ที่เหมาะสมจะหน้าตาเป็นอย่างไร และสุดท้ายใครจะเป็นผู้ถือผลประโยชน์ (Stakeholders) และผู้อุปถัมภ์ (Sponsor) ของโปรเจคที่สร้างขึ้น โดยผู้อุปถัมภ์นี้เองจะให้ความช่วยเหลือทั้งในด้านการหางบประมาณและทรัพยากรบุคคลที่จำเป็น

Specifying The Success Criteria

วิธีที่ใช้วัดความสำเร็จของโปรเจคก็เป็นสิ่งสำคัญ ทีมงานบิ๊กดาต้าควรจะเลือกวิธีการ (Process) และตัวชี้วัด (KPIs) ที่เหมาะสมเพื่อใช้ในการติดตามความก้าวหน้าและประเมินความสำเร็จในแต่ละช่วงของโครงการ ซึ่งตัวชี้วัดที่เลือกควรจะวัดผลได้อย่างเป็นรูปธรรม เช่น ถ้าเป้าหมายคือการเพิ่มรายได้จากการขายสินค้า ตัวชี้วัดอาจจะเป็นอัตราส่วนร้อยละของยอดขายที่เพิ่มขึ้นในช่วง 1 ปีแรก เป็นต้น ทั้งนี้ทีมงานควรจะทำความเข้าใจว่าโปรเจคที่ออกแบบขึ้นมานั้นจะสามารถเริ่มสร้างมูลค่าได้เมื่อเวลาผ่านไปในช่วงระยะกี่เดือนหรือกี่ปีก่อนที่จะออกแบบตัวชี้วัด

เมื่ออ่านมาถึงจุดนี้ ผู้อ่านอาจจะมีคำถามว่าการทำโปรเจคบิ๊กดาต้าไม่ต้องคุยกันเรื่องไอทีเลยหรืออย่างไร ในความเป็นจริงก็คือเมื่อการคุยเรื่องโจทย์เชิงธุรกิจจบลง ทีมงานก็ต้องตกลงกันในเรื่องของเทคนิคการวิเคราะห์ข้อมูล (Data Science) และเทคโนโลยีบริหารจัดการบิ๊กดาต้า (Data Engineering) เป็นขั้นตอนต่อไป

Designing The Sciences and The Engineering of Data

การออกแบบกระบวนการวิเคราะห์ที่เหมาะสมต้องอาศัยประสบการณ์ของนักวิทยาศาสตร์ข้อมูลผู้มีความรู้ในด้านสถิติประยุกต์ (Statistics) การขุดเหมืองข้อมูล (Data Mining) การเรียนรู้ของเครื่องคอมพิวเตอร์ (Machine Learning) การแสดงผลข้อมูล (Visualization) และการออกแบบการทดลอง (Design of Experiment) รวมทั้งมีความคุ้นเคยกับขอบเขตของความรู้เชิงธุรกิจ (Business Domain) อีกด้วย ซึ่งการสร้างทีมวิเคราะห์ที่ประกอบด้วยบุคลากรจากหลายส่วนงานจะช่วยส่งเสริมให้เกิดความคิดเชิงวิเคราะห์ที่หลากหลายและช่วยให้การออกแบบและประยุกต์ใช้งานโมเดลวิเคราะห์มีโอกาสเป็นรูปธรรมมากขึ้น

ส่วนแรกที่นักวิทยาศาสตร์ข้อมูลต้องให้ความสนใจก็คือการเลือกสรรข้อมูลที่จะใช้ในการวิเคราะห์ว่าควรจะหน้าตาเป็นอย่างไรและสามารถหามาได้จากแหล่งใดบ้าง ตัวอย่างเช่น ข้อมูลภายในองค์กรที่มีอยู่แล้วแต่ยังไม่ได้ถูกนำมาใช้ประโยชน์ (ข้อมูลรายการธุรกรรมข้อมูลลูกค้า เว็บบล็อก ฯลฯ) ข้อมูลที่ต้องจัดซื้อเพิ่มเติม (ข้อมูลความคิดเห็น จากสื่อสังคม ข้อมูลเชิงประชากร ฯลฯ) และข้อมูลที่ต้องจัดเก็บเพิ่มจากการสำรวจ

ซึ่งในขณะที่ทีมวิเคราะห์ข้อมูลเริ่มสร้างระบบต้นแบบ ทีมวิศวกรข้อมูลก็ต้องเริ่มกระบวนการออกแบบสถาปัตยกรรมระบบประมวลผลที่เหมาะสม จัดซื้อหรือเช่าใช้เครื่องประมวลผลที่จำเป็น และทำการตั้งค่าระบบ รวมทั้งพัฒนาส่วนติดต่อระบบเพื่อดึงข้อมูลจากแหล่งต่างๆ ทำการแปรรูปและจัดเก็บในถังข้อมูลขนาดใหญ่เพื่อเตรียมสำหรับการใช้งานเชิงวิเคราะห์ต่อไป นอกจากนี้ทีมวิศกรข้อมูลยังต้องจัดซื้อ จัดหาหรือพัฒนาเครื่องมือประเภทต่างๆ สำหรับใช้ในการบริหารจัดการข้อมูลอีกด้วย ซึ่งระบบนิเวศฮาดูป (Hadoop Ecosystem) เป็นเทคโนโลยีที่ได้รับการยอมรับสูงและมีการพัฒนาอย่างต่อเนื่อง จึงมีองค์กรเลือกใช้งานเทคโนโลยีนี้เป็นจำนวนมาก จัดได้ว่าเป็นมาตรฐานของการสร้างระบบประมวลผลบิ๊กดาต้าในปัจจุบัน

จากที่กล่าวมาในข้างต้น จุดที่สำคัญที่สุดคือการวางเป้าหมายและโจทย์ปัญหาให้สอดคล้องกับทิศทางขององค์กร เริ่มต้นด้วยโจทย์ที่มีมูลค่าและผลกระทบสูงแต่มีขอบเขตงานที่ชัดเจน อย่าปล่อยให้กรอบงานถูกบิดไปมาหรือขยายขึ้นอย่างไม่สมเหตุผล สร้างตัวชี้วัดความสำเร็จให้เหมาะสมและสามารถแสดงค่าผลตอบแทนการลงทุนได้ จากนั้นก็หาทีมนักวิทยาศาสตร์และวิศวกรข้อมูลที่มีความสามารถและประสบการณ์ เพียงเท่านี้ท่านก็จะสามารถเริ่มทำโปรเจคบิ๊กดาต้าได้อย่างเป็นรูปธรรม



Top