Big Data : ผลกระทบต่อการวิเคราะห์ข่าวกรอง

ภาพที่ 1 วงรอบข่าวกรอง

Every day I wake up and ask, how can I flow data better,manage data better, analyse data better?
Rollin Lee Ford, Executive Vice President and CIO of Wal-Mart Stores Inc.

นยุคที่ “ข้อมูล” เป็นทรัพยากรมีค่ามากที่สุดในการหล่อเลี้ยง “เศรษฐกิจใหม่” (แทนที่ “น้ำมัน” ซึ่งมีบทบาทสำคัญในศตวรรษที่ผ่านมา) หน่วยงานภาครัฐและธุรกิจเอกชนต่างรู้สึกถึงผลกระทบจากการแพร่ขยายของข้อมูลปริมาณมหาศาล เปลี่ยนแปลงอย่างรวดเร็ว รูปแบบซับซ้อน และแหล่งกำเนิดหลากหลาย หรือปรากฏการณ์ Big Data ซึ่งไม่เพียงก่อให้เกิดปัญหาในการตรวจจับ (Capturing) จัดเก็บ (Storing) เข้าถึง (Accessing) ดำเนินกรรมวิธี (Process) และแบ่งปัน (Sharing) เท่านั้น แต่ยังเปลี่ยนกระบวนทัศน์ (Paradigm Shift) ของการวิเคราะห์ข่าวกรองจากที่มุ่งเน้นการวิเคราะห์แบบพื้นฐานไปสู่การวิเคราะห์แบบคาดทำนายและให้ข้อเสนอแนะ
          แม้ยังไม่มีฉันทามติในการนิยามคำว่า Big Data แต่ศัพท์คำนี้มักถูกใช้ในความหมายเช่นเดียวกับข่าวกรองทางธุรกิจ (Business Intelligence)[1] และการทำเหมืองข้อมูล (Data Mining)[2] ซึ่งเกี่ยวข้องกับการวิเคราะห์ข้อมูล และในหลายกรณีเป็นการวิเคราะห์แบบก้าวหน้า แนวคิดเกี่ยวกับ Big Data แตกต่างจากการวิเคราะห์ข่าวกรองทางธุรกิจและการทำเหมืองข้อมูล เนื่องจากปริมาณ จำนวนรายการเปลี่ยนแปลงการทำธุรกรรม (Transaction) และแหล่งกำเนิดข้อมูลมีขนาดใหญ่ ซับซ้อน การสกัดความรู้เชิงลึก (Insight) จาก Big Data ต้องใช้ระเบียบวิธีและเทคโนโลยีแบบพิเศษ ซึ่งไม่สามารถดำเนินการโดยใช้เครื่องมือจัดการฐานข้อมูลแบบดั้งเดิม (Data Warehouse)[3]
          หลักเกณฑ์ที่นิยมใช้อธิบายเกี่ยวกับ Big Data คือ ข้อมูลที่มีคุณลักษณะ 4Vs ได้แก่[4] ข้อมูลที่มีปริมาณมากเกินกว่าที่ระบบจะรองรับได้ (Volume) อัตราการเปลี่ยนแปลงของข้อมูลเป็นไปอย่างรวดเร็ว (Velocity) แบบทันที (Real – Time) รูปแบบข้อมูลมีความหลากหลาย (Variety) ทั้งแบบมีโครงสร้าง (Structured) กึ่งมีโครงสร้าง (Semi-structured) ไม่มีโครงสร้าง (Unstructured) และข้อมูลที่มีความคลุมเครือ (Veracity) โดยธรรมชาติของข้อมูลที่มาจากหลากหลายช่องทาง ย่อมมีข้อผิดพลาด (Errors) หรือสิ่งรบกวน (Noise) รวมอยู่ด้วย  จึงต้องมีกระบวนการทำให้ข้อมูลมีคุณภาพก่อนนำมาใช้ประโยชน์ต่อไป
กล่าวในเชิงทฤษฎีความรู้ (Theory of Knowledge) ข่าวสาร/สารสนเทศ (Information)[5] ประกอบด้วยชุดข้อมูล (Data)[6] ที่ถูกรวบรวม คำนวณ แปลความหมาย ส่วนความรู้ (Knowledge) เกิดจากข่าวสารสำคัญหลากหลายชนิดที่ถูกควั่นไว้ด้วยกัน ในที่นี้คำว่า “ข้อมูล” และ “ข่าวสาร” ใช้แทนที่กันได้ เนื่องจากทั้งสองสิ่งยากที่จะแยกจากกัน[7] อย่างไรก็ดี Big Data จะมีคุณค่าต่อเมื่อนำข้อมูลมาวิเคราะห์ด้วยกระบวนการแก้ปัญหาที่สามารถอธิบายเป็นขั้นตอนที่ชัดเจน (Algorithm) ทำให้เกิดความเข้าใจเชิงลึก (Insights) เห็นตัวแบบ (Model) และรูปแบบ (Pattern) ที่สะท้อนพฤติกรรมของข้อมูลในมุมมองหลากหลายมิติ
          สำหรับ “ข่าวกรอง” มีที่มาเช่นเดียวกับ “ความรู้” กล่าวคือ ข้อมูลข่าวสารที่ผ่านการตรวจสอบความถูกต้อง ให้ความหมายที่แท้จริง (Real Meaning) มีการวิเคราะห์ (Critical Analysis) ประเมิน (Assessments) และแสดงแนวโน้ม (Trends) แจ้งผลกระทบทั้งบวกและลบ เฉพาะอย่างยิ่งผลกระทบต่อผลประโยชน์และความมั่นคงของไทย (ถ้าคิดได้) ทั้งนี้ ข้อมูลข่าวสารมาจาก Source ทุกประเภทที่มีอยู่แล้วและที่หาได้ จากสิ่งพิมพ์ทุกชนิดมากที่สุดเท่าที่จะหาได้ มิใช่เฉพาะที่ผ่านมาที่ตัวเราเท่านั้น จากการสนทนาแลกเปลี่ยนความเห็นในงาน/ฝ่าย/กอง/ต่างกอง/นอกหน่วยงาน (ถ้าเป็นไปได้) เพราะทุกเรื่องเกี่ยวพันกันไปหมด และคนอื่นอาจรู้ดีกว่าเราในงานของเรา/เราอาจช่วยคนอื่นได้ในงานของเขา เป็นการร่วมมือกันทำงาน (Team Work) โดยมีการบันทึก/สะสม/จัดเก็บอย่างเป็นระบบ[8] จุดมุ่งหมายในการดำเนินกรรมวิธีผลิตข่าวกรอง คือ ทำให้ผู้ใช้ข่าว (Users) มีความรู้ในเรื่องที่ไม่รู้ และนำไปใช้ประโยชน์ในการกำหนดนโยบายและสนับสนุนการตัดสินใจ

ข้อมูล Big Data หมายถึงอะไร  
          ที่ผ่านมาองค์การต่างๆใช้วิธีการแบบดั้งเดิมตรวจจับข้อมูลจากรายการทำธุรกรรม ปัจจุบันหลายองค์การตรวจจับข้อมูลข่าวสารเพิ่มเติมจากการปฏิบัติการของตนด้วยความรวดเร็ว ตัวอย่างเช่น  1) ข้อมูลพฤติกรรมการท่องเว็บ (Web Data) ของกลุ่มเป้าหมาย การค้นหา การอ่านคำวิจารณ์ผลการใช้ผลิตภัณฑ์ 2) ข้อความเอกสาร (Text Data) จดหมายอิเล็กทรอนิกส์ ข่าวสาร Facebook Feeds ซึ่งเป็นแหล่งข้อมูลขนาดใหญ่ 3) ข้อมูลเวลาและสถานที่ (Time and location Data) ซึ่งเกิดจากการใช้อุปกรณ์ระบุตำแหน่งบนพื้นโลก (GPS) รวมทั้งการเชื่อมต่ออุปกรณ์ Wi-Fi องค์การหลายแห่งตระหนักถึงพลังของความรู้เกี่ยวกับลูกค้าในระดับบุคคล ทั้งนี้ ข้อมูลเวลาและสถานที่เป็นข้อมูลที่มีความอ่อนไหวต่อความเป็นส่วนตัวมากที่สุด  4) ข้อมูลโครงข่ายอัจฉริยะและอุปกรณ์เซ็นเซอร์ (Smart grid and sensor data) ปัจจุบันมีการรวบรวมข้อมูลเซ็นเซอร์จากรถยนต์ ท่อส่งน้ำมัน กังหันลม ข้อมูลเซ็นเซอร์ให้ข่าวสารสำคัญเกี่ยวกับการทำงานของเครื่องยนต์และเครื่องจักรกล ทำให้สามารถตรวจสอบวินิจฉัยปัญหาได้ง่ายและรวดเร็ว 5) ข้อมูลเครือข่ายสังคม (Social network Data) เช่น Facebook, LinkedIn, Instagram มีความเป็นไปได้ที่จะวิเคราะห์ความเชื่อมโยงระหว่างเครือข่ายสังคมกับเป้าหมายบุคคล การวิเคราะห์เครือข่ายสังคมทำให้ได้ความรู้เชิงลึกในการจัดทำโฆษณาเพื่อดึงดูดลูกค้า

วิธีแยกแยะความแตกต่างระหว่างข้อมูล Big Data กับแหล่งข้อมูลแบบดั้งเดิม[9]
          แหล่งกำเนิด Big Data เกือบทั้งหมดมาจากแหล่งใหม่ เช่น ข้อมูลการทำธุรกรรมออนไลน์ โดยพื้นฐานมิได้แตกต่างจากการทำธุรกรรมแบบดั้งเดิม อย่างไรก็ดี การตรวจจับพฤติกรรมการเรียกดูข้อมูลของลูกค้า (การนำทางค้นหาจนนำไปสู่การทำธุรกรรมซื้อขายได้สร้างพื้นฐานของข้อมูลแบบใหม่ ความเร็วในการป้อนข้อมูลอาจถือเป็นแหล่งข้อมูลใหม่ด้วย ตัวอย่างเช่น ที่ผ่านมาการอ่านมาตรวัดการใช้พลังงานต้องใช้คนตรวจดูเดือนละครั้งเป็นเวลาหลายปี ปัจจุบันเรามีมาตรวัดอัจฉริยะที่อ่านค่าโดยอัตโนมัติทุก 10 นาที อาจถูกโต้แย้งว่า ข้อมูลดังกล่าวเป็นข้อมูลประเภทเดียวกัน ขณะนี้ปริมาณข้อมูลแบบกึ่งมีโครงสร้างและไม่มีโครงสร้างกำลังเพิ่มขึ้น แหล่งข้อมูลแบบดั้งเดิมส่วนใหญ่เป็นข้อมูลแบบมีโครงสร้าง เช่น ใบเสร็จรับเงินของร้านขายของชำ ใบรับเงินเดือน (Salary Slip) ข้อมูลบัญชีในซอฟต์แวร์ และข้อมูลในตารางฐานข้อมูลสัมพันธ์ (Relational Database) ซึ่งมีรูปแบบการจัดลำดับเฉพาะ สามารถจัดการได้ง่าย ส่วนข้อมูลแบบไม่มีโครงสร้าง เช่น ข้อความ เสียง วิดิโอ มาจากแหล่งที่ไม่สามารถควบคุมได้ และมีความยุ่งยากในการจัดการ เนื่องจากไม่ได้กำหนดรูปแบบไว้ล่วงหน้า สำหรับข้อมูลแบบกึ่งมีโครงสร้างเป็นข้อมูลที่อยู่ระหว่างทั้งสองแบบดังกล่าว เช่น ข้อมูล Web Log ซึ่งเปลี่ยนแปลงอย่างรวดเร็วหรือไม่สามารถคาดทำนายได้ ผิดปกติและไม่มีแบบแผนตายตัว

หลักการค้นหา “ความรู้” ยังคงเดิมที่เพิ่มเติมคือ ML และ AI
การค้นหาความรู้จากข้อมูลข่าวสารและกรรมวิธีข่าวกรองมีลักษณะคล้ายคลึงกันอย่างมาก การผลิตข่าวกรองเกี่ยวข้องกับการพิสูจน์ให้เห็นถึงพยานหลักฐานที่น่าเชื่อถือกว่า (Preponderance of evidence) โดยมีขั้นตอนการปฏิบัติ ได้แก่ 1) การวางแผนและอำนวยการ (Planning and Direction) 2) การรวบรวม (Collection) 3) การดำเนินกรรมวิธีและแสวงประโยชน์ (Processing and Exploitation) 4) การวิเคราะห์และผลิต (Analysis and Production) 5) การกระจายข่าวกรองและบูรณาการ (Dissemination and Integration) ข่าวกรองที่ดีต้องมีการประเมินผลหลังการปฏิบัติ (After - Action Evaluation) และแสดงผลลัพธ์จากการประมวลผลนำเข้าสู่กระบวนการอีกครั้ง (Feedback) ภาพที่ 1[10]
ส่วนวิธีปฏิบัติเกี่ยวกับข้อมูล Big Data มีลักษณะเป็นวงรอบเช่นเดียวกับกรรมวิธีข่าวกรอง โดย Big Data ทำงานบนหลักการที่ว่า ยิ่งเรารู้สิ่งใดหรือสถานการณ์ใดมากเท่าไร จะยิ่งมีความเข้าใจอย่างลึกซึ้งและคาดการณ์สิ่งที่จะเกิดขึ้นในอนาคตได้[11] วงจรชีวิตของข้อมูลประกอบด้วยการจัดหา (Acquisition) และรวบรวม (Aggregation) ข้อมูลที่กระจัดกระจาย นำมากลั่นกรองจัดระเบียบ บูรณาการและวิเคราะห์ (Analysis) จนเกิดความรู้ใหม่ นำมาใช้ประโยชน์ (Application) ทำให้เกิดข้อมูลข้อมูลกึ่งโครงสร้าง (Log Data) ภาพที่ 2[12]
การจัดเก็บข้อมูล Big Data เพื่อประมวลผล วิเคราะห์/สืบค้นภายหลัง หรือการสร้างแหล่งข้อมูลขนาดใหญ่ (Data Lake) เปรียบเสมือนการสร้างอ่างเก็บน้ำ เริ่มจากการก่อสร้างคันกั้นพื้นที่รอบอ่าง (การสร้างกลุ่ม) แล้วเติมน้ำ (ข้อมูล) ลงในอ่าง เมื่อสร้างอ่างเก็บน้ำแล้วเสร็จเราใช้น้ำ (ข้อมูล) เพื่อจุดประสงค์หลายอย่าง เช่น ผลิตกระแสไฟฟ้า บริโภค (การคาดการณ์, Machine Learning,[13] การรักษาความปลอดภัยทางไซเบอร์ ฯลฯ) การเติมน้ำในอ่างเป็นประโยชน์ในตัวขององค์การต่างๆที่ต้องการใช้แหล่งข้อมูลขนาดใหญ่ เพื่อหาคำตอบซ้ำๆอย่างรวดเร็ว จึงต้องพิจารณาผลลัพธ์ทางธุรกิจก่อนลงทุนด้านบุคคลากร โครงสร้างพื้นฐาน และจัดซื้อเครื่องมือตรวจจับข้อมูล[14] ปัจจุบัน องค์การธุรกิจหลายแห่งประมวลผลข้อมูล Big Data โดยใช้เทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence) หรือคอมพิวเตอร์ที่เข้าใจภาษาธรรมชาติ ภาพ เสียง แบบเดียวกับมนุษย์ (Cognitive Computing)[15]

ภาพที่ 2 วงจรชีวิตข้อมูล

          IDC บริษัทวิจัยข้อมูลการตลาดของสหรัฐฯคาดการณ์ว่า ภายในปี ค.ศ. 2025 ข้อมูลดิจิทัลที่ถูกสร้างและทำสำเนาจะมีจำนวนมากถึง 180 zettabytes (180 ตามด้วยเลข 0 จำนวน 21 ตัวการสูบ (Pumping) ข้อมูลดังกล่าวมาใช้ประโยชน์ผ่านการเชื่อมต่อระบบอินเตอร์เน็ตความเร็วสูง (Broadband Internet) ต้องใช้ระยะเวลาดำเนินการนานถึง 450 ล้านปี[16] พลังของข้อมูล Big Data เกิดจากการวิเคราะห์และนำผลการวิเคราะห์ไปปฏิบัติ เพื่อช่วยสนับสนุนการตัดสินใจ ขณะเดียวกัน Big Data ได้เปลี่ยนกระบวนทัศน์การวิเคราะห์จากเดิมที่มุ่งตอบคำถามสิ่งที่เกิดขึ้นในอดีตไปสู่การคาดทำนายเหตุการณ์ที่จะเกิดขึ้นและให้ข้อเสนอแนะดังนี้[17]
          1. การวิเคราะห์ข้อมูลแบบพื้นฐานหรือรูปพรรณสัณฐาน (Descriptive analytics) เป็นการวิเคราะห์เพื่อตอบคำถามสิ่งที่เกิดขึ้นในอดีต (what happened in the past?) แสดงผลของรายการทางธุรกิจ เหตุการณ์ หรือกิจกรรมต่างๆที่ได้เกิดขึ้น หรืออาจกำลังเกิดขึ้น ในลักษณะที่ง่ายต่อการเข้าใจหรือต่อการตัดสินใจ เช่น รายงานผลการขายสินค้า/ยอดรายได้จากการขายสินค้าห้วงไตรมาสแรกของปี รายงานผลการดำเนินงานที่ผ่านมา
2. การวิเคราะห์เชิงวินิจฉัย (Diagnostic analytics) เป็นการอธิบายถึงสาเหตุของสิ่งที่เกิดขึ้น (what has happened and why?) ปัจจัยต่างๆและความสัมพันธ์ของปัจจัยหรือตัวแปรต่างๆ ที่มีความสัมพันธ์ต่อกันของสิ่งที่เกิดขึ้น เช่น ความสัมพันธ์ระหว่างยอดขายต่อกิจกรรมทางการตลาดแต่ละประเภท ซึ่งเป็นก้าวใหม่ที่ช่วยเสริมให้ตัดสินใจไปในทางที่ถูกต้อง
          3. การวิเคราะห์แบบคาดการณ์ (Predictive analytics) มีจุดมุ่งหมายเพื่อคาดการณ์เกี่ยวกับสิ่งที่กำลังจะเกิดขึ้นหรือน่าจะเกิดขึ้น (what might happen next?) โดยใช้ข้อมูลที่เกิดขึ้นแล้วกับแบบจำลองทางสถิติ หรือเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence) เช่น การคาดการณ์ยอดขาย การทำนายผลประชามติ
4. การวิเคราะห์แบบให้ข้อเสนอแนะ (Prescriptive analytics) เป็นการวิเคราะห์ข้อมูลที่มีความซับซ้อนที่สุด เพื่อตอบคำถามที่นำไปสู่การปฏิบัติ (how do I deal with this) โดยคาดทำนายสิ่งต่างๆ ที่จะเกิดขึ้น ข้อดี ข้อเสีย สาเหตุ และระยะเวลาของสิ่งที่จะเกิดขึ้น และเสนอทางเลือกในการตัดสินใจที่เหมาะสมกับการคาดการณ์บนฐานของข้อมูลและผลของแต่ละทางเลือก
การวิเคราะห์ข้อมูล Big Data แตกต่างจากข้อมูลแบบดั้งเดิม คือ ความสามารถในการดึงความเข้าใจเชิงลึกที่นำไปปฏิบัติได้ล่วงหน้าอย่างรวดเร็ว ถูกต้อง แม่นยำมากกว่าการวิเคราะห์ข้อมูลในอดีต ซึ่งมีข้อจำกัดเกี่ยวกับปริมาณและแหล่งกำเนิดของข้อมูล ทั้งนี้ การดำเนินกรรมวิธีวิเคราะห์ Big Data ที่ถูกฝังในกระบวนการปฏิบัติการขององค์การสามารถให้ข้อเสนอแนะโดยอัตโนมัติ เช่น บริษัท Amazon ร้านค้าออนไลน์ให้คำแนะนำสินค้าต่างชนิดแก่ลูกค้าแต่ละคนโดยขึ้นอยู่กับประวัติการค้นหาและซื้อสินค้า อย่างไรก็ดี การวิเคราะห์แบบพื้นฐานยังคงมีความสำคัญต่อการดำเนินธุรกิจ องค์การไม่ควรยึดมั่นต่อการวิเคราะห์แบบใดแบบหนึ่ง แต่ควรพิจารณาใช้เครื่องมือการวิเคราะห์ให้เหมาะสมกับงาน (the right tools for the right job)

กรรมวิธีข่าวกรอง VS การวิเคราะห์ข้อมูล Big Data
          ความมุ่งหมายในการวิเคราะห์ Big Data คือ การค้นพบสิ่งใหม่ที่ไม่เคยเห็นหรือจินตนาการมาก่อน        ด้วยการปฏิบัติตามกรรมวิธีข่าวกรอง เพื่อแก้ไขปัญหาสภาวการณ์ที่มีความไม่แน่นอน ภาพที่ 3[18] จะช่วยอธิบายเรื่องนี้ โดยเส้นแกน X (แกนนอน) คือ องค์ความรู้เกี่ยวกับโลกที่เรายังไม่ได้เรียนรู้ ส่วนเส้นแกน Y (แกนตั้ง) คือ ความเข้าใจเกี่ยวกับโลก ความรู้เกี่ยวกับบุคคลหรือองค์การถือเป็นส่วนย่อยของโลก เมื่อความรู้ความเข้าใจของเราทัดเทียมความรู้เกี่ยวกับโลกจะเกิดสภาวะแบบกล่องสีส้มซึ่งมีความแน่นอน (Certainty) ขณะที่อีกสองกล่องเป็นตัวแทนความไม่แน่นอน 2 ลักษณะ กล่องแรกเป็นความไม่แน่นอนที่แก้ไขได้ด้วยความพยายาม (Effort) แสวงหาความรู้ (เรารู้ว่ามีบางสิ่งที่เราไม่รู้) กล่องที่สองเป็นความไม่แน่นอนที่แก้ไขได้ด้วยการสำรวจ (Discovery) ค้นหาความรู้ (บางสิ่งที่เราไม่รู้ว่าเรารู้) กล่องสุดท้ายแทนความไม่แน่นอน (Uncertainty) หรือที่นายโดนัลด์ รัมส์เฟลด์ อดีตรัฐมนตรีกลาโหมสหรัฐฯระบุว่า “มีบางสิ่งสิ่งที่เราไม่รู้ว่าเราไม่รู้”[19]


ภาพที่ 3 การแก้ไขปัญหาความไม่แน่นอน

เทคโนโลยีข้อมูลข่าวสารในช่วง 3 ทศวรรษที่ผ่านมาอุทิศให้กับการแก้ไขความไม่แน่นอนด้วยการพยายามแสวงหาความรู้ที่เราขาดแต่มีอยู่จริง การวิเคราะห์ Big Data ด้วย Machine Learning หรือการวิเคราะห์แบบคาดการณ์ แสดงให้เห็นการสำรวจหาความรู้เพื่อแก้ไขปัญหาความไม่แน่นอน ซึ่งจำเป็นต้องใช้ข้อมูลข่าวสารจำนวนมากและพลังการประมวลผลอย่างรวดเร็วด้วยคอมพิวเตอร์ หากมองในภาพใหญ่เราใช้ “ความพยายาม” และ “การสำรวจ” ในการบีบกล่องความไม่แน่นอนให้เหลือน้อยลง หรือหากขยายกล่องความแน่นอนให้ใหญ่ขึ้นก็จะทำให้กล่องอื่นๆเล็กลง กรรมวิธีข่าวกรองในภาครัฐและธุรกิจเอกชนต่างได้รับผลกระทบจาก Big Data ในลักษณะเดียวกัน กล่าวคือ ความไม่แน่นอนรูปแบบใดก็ตามอาจกลายเป็นความจำเป็นด้านกรรมวิธีข่าวกรอง ในทำนองเดียวกันการวิเคราะห์ Big Data แบบคาดการณ์ล่วงหน้า ช่วยเปิดลู่ทางการตัดสินใจที่ไม่เคยพิจารณามาก่อน

บทสรุป
          Big Data ไม่ใช่สิ่งประดิษฐ์ใหม่ ย้อนกลับไปในยุคก่อนที่จะมีคอมพิวเตอร์และโปรแกรมฐานข้อมูล (Database) เรามีกระดาษบันทึกข้อมูลประวัติลูกค้า การทำธุรกรรมและจัดเก็บแฟ้มเอกสารในหอจดหมายเหตุ (Archives  ยุคต่อมาเราเก็บข้อมูลจำนวนมหาศาลในอุปกรณ์คอมพิวเตอร์ โปรแกรมบัญชี (Spreadsheet) และฐานข้อมูล อย่างเป็นระเบียบ สามารถสืบค้นและเข้าถึงได้ง่าย ปัจจุบันเราอยู่ในยุคดิจิทัล ซึ่งทุกการเคลื่อนไหวก่อให้เกิดร่องรอย เราผลิตข้อมูลทุกครั้งที่สื่อสารบนเครือข่ายสังคมออนไลน์ ใช้โทรศัพท์ติดอุปกรณ์ GPS อาจกล่าวได้ว่าเราสร้างรอยเท้าทางดิจิทัลทุกครั้งที่มีกิจกรรมเกี่ยวข้องกับดิจิทัล คำว่า Big Data หมายถึง ข้อมูลจำนวนมหาศาลที่รวบรวมไว้ ซึ่งสามารถนำมาวิเคราะห์ให้เกิดความเข้าใจเชิงลึก และนำไปใช้สนับสนุนการตัดสินใจรวมทั้งการดำเนินงานแบบอัตโนมัติ
          การดึงความรู้เชิงลึกจากข้อมูล Big Data จำเป็นต้องใช้วิธีการจัดการแบบใหม่ เนื่องจากข้อมูล Big Data มีขนาดและปริมาณมาก เปลี่ยนแปลงอย่างรวดเร็ว รูปแบบซับซ้อน และแหล่งกำเนิดที่หลากหลาย องค์การไม่จำเป็นต้องลงทุนใน Big Data ซึ่งอาจจะมีต้นทุนสูงให้เสร็จก่อนที่จะเริ่มการวิเคราะห์เชิงลึก แต่สามารถวิเคราะห์เชิงลึกกับฐานข้อมูลเดิมที่ใช้อยู่ เพื่อเพิ่มคุณค่าทำให้เกิดประโยชน์สูงสุด การวิเคราะห์ข้อมูล Big Data อาจทำให้ผลลัพธ์ของรูปแบบที่เกิดขึ้น  (Pattern Recognitions) แตกต่างไปจากที่วางกรอบแนวคิดไว้ การจัดซื้อเครื่องมือหรือเทคโนโลยี เพื่อการรวบรวมหรือวิเคราะห์ข้อมูล Big Data โดยไม่มีจุดมุ่งหมายที่ชัดเจน เพื่อแก้ไขปัญหาเผชิญหน้าองค์การอย่างแท้จริง อาจทำให้เกิดความเสียหายทางยุทธศาสตร์



-------------------------------------------------------------------
(ธันวาคม 2561)



[1] Software จัดการวิเคราะห์ข้อมูลและรายงานผล แสดงความสัมพันธ์และคาดการณ์ผลลัพธ์ของแนวโน้มที่อาจเกิดขึ้นได้ตรงตามความต้องการขององค์กร เพื่อใช้ประโยชน์ในการวางแผนกลยุทธ์ BI ประกอบด้วย 1) ฐานข้อมูลขนาดใหญ่ (Data Warehouse) ที่รวบรวมข้อมูลทั้งจากแหล่งข้อมูลภายในและภายนอกองค์กร โดยมีรูปแบบและวัตถุประสงค์ในการจัดเก็บข้อมูล ซึ่งจำเป็นต้องมีการออกแบบฐานข้อมูลให้สอดคล้องกับการนำข้อมูลมาใช้งาน 2) คลังเก็บข้อมูล (Data Mart) ที่มีลักษณะเฉพาะเจาะจง เช่น ข้อมูลการเงิน สินค้าคงคลัง การขาย ซึ่งทำให้การจัดการข้อมูล การสร้างความสัมพันธ์และวิเคราะห์ต่อง่ายขึ้น และ 3) การนำคลังข้อมูลหลักมาประมวลผลใหม่ (Data Mining) แสดงเฉพาะสิ่งที่สนใจ โดยมีสูตรทางธุรกิจ (Business Formula) และเงื่อนไขต่างๆ เข้ามาเกี่ยวข้อง ทำให้ได้ผลลัพธ์ในรูปแบบที่แตกต่างกัน เช่น เป็นแผนภูมิในการตัดสินใจ (Decision Trees) เป็นต้น
 http://www.mindphp.com/บทความ/162-project-menager-software/4465-business-intelligence-bi.html
[2] การค้นหาความรู้จาก Big Data เปรียบเทียบกับการทำเหมือง ซึ่งใช้เครื่องจักรขนาดใหญ่ที่มีสมรรถนะสูง ระเบิดภูเขาทั้งลูกแล้วได้สินแร่ เครื่องจักรที่ว่า คือ algorithm หรือ กระบวนการแก้ปัญหาที่สามารถอธิบายออกมาเป็นขั้นตอนที่ชัดเจน  ปัจจุบัน algorithm ถูกใช้ในการเรียงลำดับ (Sorting) จัดกลุ่ม (Clustering) หากฎความสัมพันธ์ (Associate rules) และจัดการจำแนก (Classification) ข้อมูล https://thaidatascience.wordpress.com/2017/01/12/รู้จัก-data-mining/
[3] Xiaomeng Su, Introduction to Big Data, Institute for Informatikk og e-Learning ved NTNU
[4] ในปี ค.ศ. 2012 Gartner บริษัทวิจัยและที่ปรึกษาทางธุรกิจของสหรัฐฯ นิยามความหมายของ Big Data ว่า มีคุณสมบัติสามประการ (3Vs)  ต่อมา IBM ได้ขยายความ โดยเพิ่ม ตัวที่สี Veracity – ความคลุมเครือ ซึ่งเกี่ยวข้องกับความเชื่อถือและความไม่แน่นอนของข้อมูลรวมทั้งผลลัพธ์ในการวิเคราะห์ (Jonathan Stuart Ward and Adam Barker, Undefined By Data: A Survey of Big Data Definitions University of St Andrews, UK) และดู The Knowledge, BOT พระสยาม MAGAZINE ฉบับ (มกราคม – กุมภาพันธ์ 2559) หน้า 24 - 25.
[5] ผลลัพธ์ของการประมวลผล การจัดดำเนินการและการเข้าประเภทข้อมูล หรือแนวคิดที่กว้างและหลากหลาย ตั้งแต่การใช้คำว่าสารสนเทศในชีวิตประจำวันจนถึงความหมายเชิงเทคนิค แนวคิดของสารสนเทศใกล้เคียงกับความหมายของการสื่อสาร เงื่อนไข การควบคุม ข้อมูล รูปแบบ คำสั่งปฏิบัติการ ความรู้ ความหมาย สื่อความคิด การรับรู้และการแทนความหมาย
https://th.wikipedia.org/wiki/สารสนเทศ
[6] พจนานุกรมฉบับราชบัณฑิตยสถาน (2554) ให้ความหมายของ ข้อมูล (Data) คือ ข้อเท็จจริงหรือสิ่งที่ถือหรือยอมรับว่าเป็นข้อเท็จจริง สำหรับใช้เป็นหลักอนุมานหาความจริงหรือการคำนวณ (http://www.royin.go.th/dictionary/index.php)
[7] “Data, data everywhere” SPECIAL REPORT The Economist (Feb 25th 2010)
https://www.economist.com/special-report/2010/02/25/data-data-everywhere
[8] นิวัติ ปรีชญานุต อดีตรองผู้อำนวยการสำนักข่าวกรองแห่งชาติ“บันทึกข้อเตือนใจ/แง่คิดในการผลิตข่าวกรอง”,  (11 สิงหาคม 2535).
[9] Bill Franks. “Taming the big data tidal wave”. Wiley, 2012
[10] Lance James, Fail vs Finished: The Difference Between Information and Intelligence, April 11, 2017 https://misti.com/infosec-insider/fail-vs-finished-the-difference-between-information-and-intelligence
[11] Bernard Marr, What is Big Data? A super simple explanation for everyone, Bernard Marr & Co https://www.bernardmarr.com/default.asp?contentID=766
[12] ChengXiang (“Cheng”) Zhai, Basic Concepts in Big Data, Department of Computer Science, University of Illinois at Urbana-Champaign http://luthuli.cs.uiuc.edu/~daf/courses/CS-199-BD/Slides/intro-bigdata.pdf
[13] การทำให้คอมพิวเตอร์รับทราบจากข้อมูล หรือจากสภาพแวดล้อม โดยไม่จำต้องมีคนโปรแกรมงานนั้นๆ และนำความรู้ที่ได้รับจัดเก็บไว้ในฐานความรู้ในรูปแบบการแทนความรู้อย่างใดอย่างหนึ่ง เช่น กฎ หรือฟังก์ชัน ตัวอย่างเช่น ทีมนักวิจัยมหาวิทยาลัย MIT ใช้ Machine learning เพื่อฝึกให้คอมพิวเตอร์สามารถบอกได้ว่า ภาพจาก Google Street View ของแต่ละย่านดูมีความปลอดภัยมากน้อยแค่ไหนในสายตามนุษย์ ด้วยข้อมูลจัดอันดับความปลอดภัย
[14] TOP TEN Big Data TRENDS FOR 2017 tableau เอกสาร PDF เข้าถึงได้ที่
https://www.tableau.com/sites/default/files/whitepapers/whitepaper_apac_top_10_big_data_trends_2017.pdf
[15] คอมพิวเตอร์ที่เข้าใจและสามารถเรียนรู้ข้อมูลต่าง ๆ คิดและตัดสินใจได้เอง โดยใช้วิธีการเรียนรู้เช่นเดียวกับสมองของมนุษย์ และสามารถตอบสนองต่อสิ่งต่าง ๆ ตัวอย่างเช่น ในปี ค.ศ. 1997 Deep Blue คอมพิวเตอร์ของ IBM ได้เอาชนะ Garry Kasparov แชมป์หมากรุกโลก ซึ่งเป็นจุดเริ่มต้นของการที่คอมพิวเตอร์สามารถตัดสินใจ (ในเกมส์หมากรุก) ได้ดีกว่ามนุษย์ หลังจากนั้นเทคโนโลยี Machine learning และ Cognitive computing ได้ถูกขยายผลในเชิงธุรกิจมากขึ้น
[16] Fuel of the future: Data is giving rise to a new economy, The economist Print edition (May 6th 2017)
https://www.economist.com/briefing/2017/05/06/data-is-giving-rise-to-a-new-economy
[17] ประมวลสรุปจาก 1) Big Data คืออะไร? Good Factory Team. Dec 42016 (https://blog.goodfactory.co/big-data-คืออะไร-8ebf3a1a0050) 2) ดร.เยาวลักษณ์ ชาติบัญชาชัย/คุณโสภณ เพิ่มศิริวัลลภ, คำถามที่พบบ่อย (FAQ) เกี่ยวกับ Big Data และ Data analytics, IOD Boardroom, Volume 48 Issue 5, 2016 3) Big Data And Analytics
Challenges and Issues,
 Stephen H. Kaisler, D.Sc.Frank J. Armour, Ph.D.J. Alberto Espinosa, Ph.D. William H. Money, Ph.D.Presented at HICSS-49 (January 52016), Grand Hyatt, Poipu, Kauai, Hawaii และ 4) เชิงอรรถที่ 3
[18] Brooke Aker, THE INTELLIGENCE CYCLE IN A BIG DATA ERA, BigDataLens, September 32014
http://www.bigdatalens.com/blog/2014/9/3/the-intelligence-cycle-in-a-big-data-era
[19] การบรรยายสรุปที่กระทรวงกลาโหมสหรัฐฯเมื่อ 12 กุมภาพันธ์ 2555 เกี่ยวกับการขาดหลักฐานเชื่อมโยงรัฐบาลอิรัก (ภายใต้การนำของซัดดัม ฮุสเซน) กับการจัดหาอาวุธที่มีอำนาจทำลายล้างสูง (WMD) แก่กลุ่มก่อการร้าย

Author Image

About Kim
Kim is a retired civil servant, specializing in intelligence analysis. He loves productivity hacks, minimalist workflows and CSI series.

No comments

Powered by Blogger.