ข้อมูลกลายเป็นปัจจัยหลักในการทำธุรกิจทุกวันนี้ จริงๆแล้ว องค์กรข้อมูลระหว่างประเทศ หรือ International Data Corporation (IDC) คาดการณ์ไว้ว่าในปี 2022 จะมีการลงทุนในเรื่องของข้อมูลและการวิเคราะห์ข้อมูลถึง $274.3 พันล้านเหรียญสหรัฐเลยทีเดียว
อย่างไรก็ตาม จำนวนเงินมหาศาสที่ว่าก็ไม่ได้ใช้ในทางที่คุ้มค่า นักวิเคราะห์จาก Gartner อย่าง Nick Heudecker ได้ประมาณเอาไว้ว่า 85% ของโครงการที่เกี่ยวกับ Big Data ทั้งหมดเป็นโครงการที่ล้มเหลว
ปัญหาใหญ่ก็คือเราแทบไม่สงสัยตั้งคำถามเลยว่าจำนวนตัวเลขบนหน้าจอคอมฯนั้นเอามาจากไหน? ได้มาอย่างไร? ถูกดัดแปลงแก้ไขมาอย่างไร? หรือข้อมูลพวกนี้เอามาใช้ได้ตามเป้าหมายที่เราต้องการจริงๆหรือ?
ความจริงก็คือถ้าต้องการข้อมูลที่มีประโยชน์ ใช้งานได้จริง เราไม่ควรมองตัวเลขแค่ผิวเผินอย่างเดียว แต่ต้องรู้จักสงสัยและตั้งคำถามด้วย นี่คือ 4 คำถามที่เราควรจะสงสัยเกี่ยวกับข้อมูลที่เรามี
1. ข้อมูลที่เรามีได้มาอย่างไร?
ไม่ว่าจะเป็นธุรกรรมทางการเงิน การวินิจฉัยโรค ข้อมูลต่างๆที่เกี่ยวข้อง Gartner ได้เคยศึกษาแล้วว่าธุรกิจหมดเงินไปกับข้อมูลไปกับข้อมูลที่ไม่มีคุณภาพพวกนี้ตกปีละ 15 ล้านเหรียญสหรัฐ ข้อมูลพวกนี้ส่วนใหญ่มาจากความผิดพลาดของคน เช่นเสมียนที่ได้รับค่าจ้างแรงงานต่ำดูแลข้อมูลเรื่องสต็อกสินค้า ต่อให้ระบบการเก็บรักษาข้อมูลเป็นระบบอัตโนมัติ ข้อมูลก็ยังมีข้อบกพร่อง และถ้าเราเอาไปใช้ผิดบริบท ความผิดพลาดก็จะตามมากกว่าการที่เราไม่มีข้อมูลให้วิเคราะห์เสียอีก ในการศึกษางานหนึ่งบอกไว้ว่า 65% ของข้อมูลสต็อกสินค้าในร้านค้าปลีกเป็นข้อมูลที่ไม่ถูกต้องแม่นยำ
นี่ยังไม่พูดถึงวิธีการได้ข้อมูลมาตามกฎหมายของ GDPR อีกนะว่าจะเอาข้อมูลมาได้ ต้องให้เจ้าของข้อมูลยินยอมเสียก่อน
ฉะนั้นอย่าเพิ่งคิดเอาเองว่าข้อมูลที่มีเป็นข้อมูลมีคุณภาพและแม่นยำ ต้องถามให้แน่ใจว่าได้ข้อมูลมาอย่างไร? เราเก็บข้อมูลไว้ในรูปแบบไหน? คอยสอดส่องการเดินทางของข้อมูลตลอดเวลาด้วย
2. เราวิเคราะห์ข้อมูลกันอย่างไร?
เพราะต้อให้เรามีข้อมูลที่ดีมีคุณภาพ ถูกต้องแม่นยำ โมเดลที่ใช้วิเคราะห์ข้อมูลก็สำคัญ เพราะปรกติโมเดลที่เราใช้วิเคราะห์ข้อมูล เราก็เอามาใช้จากแพลตฟอร์มที่เปิดให้ใช้ทั่วไป แต่เราลืมตั้งคำถามที่ว่าโมเดลพวกนี้ได้มาจากไหน? มันประเมินวิเคราะห์ข้อมูลที่เรามีอย่างไร?
เช่น Overfitting ที่โมเดลทำนายผลลัพธ์ในอนาคต โดยเอาข้อมูล เอาตัวแปร “ทุกอย่าง” เอามาวิเคราะห์ ข้อมูลที่มีมากเกินความจำเป็น ทำให้ได้ผลลัพธ์ที่ไม่น่าเชื่อถือในที่สุด
ฉะนั้นการวิเคราะห์ข้อมูล เราต้องรู้ว่าเราจะวิเคราะห์ข้อมูลไปทำไม ข้อมูลที่เรามีมันเหมาะกับเป้าหมายหรือเปล่า? ตัวแปรที่เราใช้เป็นตัวแปรที่เกี่ยวข้องหรือไม่? แล้วผลลัพธ์ที่ได้สามารถอธิบายเหตุการณ์ที่เกินขึ้นจริงได้มากน้อยแค่ไหน?
3. มีอะไรบ้างที่ข้อมูลไม่ได้บอกเรา?
เพราะเรามักจะตัดสินใจจากข้อมูลที่เรามี แต่บางครั้งเราต้องคิดไว้ว่าข้อมูลที่เราไม่มีก็มีผลต่อการตัดสินใจพอๆกับข้อมูลที่เรามีเช่นกัน พูดอีกอย่างคือเรามักจะลำเอียงเชื่อถือข้อมูลที่เรามีมากกว่าข้อมูลที่เรายังไม่มี และเรามักจะให้ระบข้อมูลจัดการกับข้อมูลที่ไม่มีให้เราเอาเอง
ยกตัวอย่างเช่น ในอุตสาหกรรมทางการเงิน คนที่มีเครดิตทางการเงินดีมักจะเข้าถึงเครดิดได้มากกว่า คนที่มีเครดิตทางการเงินต่ำ มักจะไม่มีเงินซื้อของแพงๆแม้แต่มีบัตรเครดิตของตัวเอง อย่างไรก็ตามก็ไม่ได้หมายความว่าคนประเภทหลังจะมีความเสี่ยงทางการเงินสูง สถาบันทางการเงินมักจะไม่สนใจลูกค้าประเภทหลัง เพียงแค่เพราะไม่มีข้อมูลเกี่ยวกับคนพวกนี้มากพอ สถาบันทางการเงินก็อาจจะพลาดโอกาสได้รายได้จากคนที่มีความเสี่ยงทางการเงินสูงก็ได้
ฉะนั้นลองคิดดูว่าเรายังไม่รู้อะไรบ้าง? ตัวชี้วัดที่เรามีมันวัดเหตุการณ์ที่เกิดขึ้นจริงได้หรือเปล่า? ไม่ใช่แค่ข้อมูลที่เก็บมาได้ด้วยวิธีที่ง่ายๆ
4. แล้วเราจะใช้ข้อมูลไปปรับปรุงสินค้าบริการหรือโมเดลธุรกิจอย่างไร?
อย่างที่เกริ่นไปว่าข้อมูลกลายเป็นหัวใจหลักในการทำธุรกิจ บริการคอนเทนต์สตรีมมิ่งอย่าง Netflix ที่มีระบบวิเคราะห์เพื่อให้เรามีโปรแกรมดูซีรีย์ที่ตรงใจเรามากที่สุด กลายเป็นความได้เปรียบเมื่อต้องแข่งขันกับธุรกิจคอนเทนต์เจ้าอื่นๆอย่าง Disney กับ WarnerMedia
ทั้งหมดนี้ไม่ใช่แค่เพราะมีแค่ข้อมูล แต่การตั้งคำถามที่ใช่ จะทำให้เราได้คำตอบที่ใช่ นำมาสู่สินค้า บริการ และโมเดลธุรกิจที่ตอบโจทย์คนมากที่สุด
แหล่งที่มา