สามารถฟัง version เสียงได้ที่
วันนี้ที่เป็นไวรัลมากอย่างนึงใน timeline นอกจากเรื่องดาราชกมวยให้ควยคนดู และหลวงปู่เค็มแล้ว ก็ยังมีอีกเรื่อง คือการที่ราชบัณฑิตได้ออกนิยามคำศัพท์ในวงการไอทีออกมาชุดนึง ซึ่งมีตั้งแต่คำว่า Cryptocurrency, Cyber security, Cyberbully และอื่น ๆ
และก็เหมือนกับทุกครั้งที่บัณฑิตประกาศออกมาก็มักไม่ค่อยตรงใจวัยจ๊าบชาวไอทีกันซักเท่าไหร่ เพราะมันยิ่งฟังยิ่งงง บางครั้งถึงกับต้องหยุดแปลไทยเป็นไทยอีกรอบ
เลยเป็นที่มาของ podcast ช่วงแบบนี้ ซึ่งสามารถเอามาขัดตาทัพช่วงของขาดและมาทดแทนช่วงให้ความรู้ได้เป็นอย่างดี
ซึ่งเอาจริง ๆ ไอเดียนี้มันมีมานานแล้วนะ แต่ไม่ได้ทำ เพราะดันไปติดกับดักว่าอยากทำ Podcast ยาวๆ ด้วยจริตของตัวเองที่ฟังแต่ podcast ยาวๆ Witcast งี้, เสาเสาเสา งี้ เลยอยากจะทำแต่ podcast ยาวๆ
หลังๆมานั่งฟัง podcast ไปเรื่อย ๆ ก็พบว่า เออ podcast สั้นๆมันก็ OK ดีนี่หว่าไม่ได้เสียหายอะไร อยากทำอะไรก็ทำ เลยเอาโปรเจคเดิมมาปัดฝุ่นใหม่แล้วกัน
ฉะนั้นจากนี้ไปวันพุธแล้วกันนะ จะมีช่วง ศัพท์(ไอที)ประหลาดมาเล่าไปเรื่อย ๆ แบบพยายามบ้านๆที่สุดนะ
เอ้า! มาเริ่มกันเลย
คือวงการเทคโนโลยีจะชอบมีนิสัยเสียอยู่อย่างนึง คือชอบตั้งคำศัพท์ประหลาดๆ ออกมาเพื่ออธิบายคำง่ายๆ
ซึ่งเอาจริง ๆ ในฐานะคนสอนก็เป็นสิ่งที่รบกวนจิตใจเรามาก
คือจะเอาไงดีวะ?
จะเรียกชื่อมันอย่างที่คนอื่นในวงการเรียกกัน แล้วคนเรียนเข้าใจบ้างไม่เข้าใจบ้าง หรือจะไล่อธิบายทีละคำแล้วสอนไม่ทันดี หรือบางทีคนเรียนอาจจะรู้อยู่แล้วก็ได้นะ แต่รู้มาแบบเดียวกันหรือเปล่านี่อีกเรื่องนึง
จนถึงทุกวันนี้ก็ยังหาแบบแผนที่ลงตัวไม่ได้ อาศัยมองตาเอาแล้วเดาว่า เค้าเข้าใจละมั้ง ..
เฮ้ย ตั้งใจให้ podcast สั้นแต่เกริ่นมาซะยาวเลย
คำนึงที่เวลาได้ยินคนพูด แล้วทำให้ตากระตุกอยู่ตลอด แล้วต้องแอบฟังว่าเอ๊ะ ที่เค้าพูดนี่เค้าเข้าใจอยู่หรือเปล่าวะ คือคำว่า Big Data แปลเป็นไทยคือ ข้อมูลใหญ่ เออ อย่าพยายามแปลมันเลย ทีนี้ยิ่งนานวันเข้าเราก็ยิ่งได้ยินคำว่า Big data เยอะขึ้นเรื่อย ๆ เว้ย จนมันเหมือนกลายเป็น ยาสารพัดนึก นึกอะไรไม่ออกบอก Big Data หน่อยงานภาครัฐจะของบ ก็เอาไปทำ Big Data แถมหลาย ๆ ทีพอคุยกันแล้ว เฮ้ย….มันไม่ช่ายยยย
แล้ว Big Data คืออะไร คำว่า Big Data ถูกเอามาใช้ครั้งแรกใน research ชื่อ “3D data management: Controlling data volume, velocity and variety” ซึ่งเค้านิยามตามชื่อ research เลยคือการจัดการข้อมูลใน 3 มิตินี้ คือ Volume คือ ขนาดของข้อมูล, Velocity คือความต่อเนื่องของข้อมูล, และ Variety คือความหลากหลายของชนิดของข้อมูล
คือถ้าข้อมูลของเรามันมี 3 อย่างนี้เยอะๆ มันจะทำให้การ process ข้อมูลของเรามันช้าลง แค่นั้นเอง เช่นถ้าข้อมูลมันเยอะมาก ๆ เป็น Peta Byte คือ 1 พันเทระไบต์ การจะค้นข้อมูล เอาข้อมูลมาใช้มันก็ยากใช้มะ มันจะช้า
หรือถ้าข้อมูลมัน update ตลอดเวลาเลยเช่น twitter feed, Facebook feed เงี้ยะ จะเอาไปสรุปหาอะไรซักอย่างมันก็ทำได้ช้าใช่มะ หรือข้อมูลมันหลายแบบมากเลยมีทั้ง เสีย ภาพ วีดีโอ ตัวอักษร ฐานข้อมูล อะไรเยอะแยะไปหมดการเอาไปใช้ก็ยากใช่มะมันก็ช้าลง
ฉะนั้นเอาเข้าจริง ๆ นะ เรื่อง Big Data มันไม่ใช่เรื่องของความ Big แฮะ มันเป็นเรื่องของความเร็วตะหาก !!
คือสมมติเราจะอยากรู้ว่าลูกค้าที่ซื้อนมจืดยี่ห้อ D เงี้ยะเค้ามักจะซื้ออะไรไปด้วย เพื่อที่จะได้อัพเซลล์ขายของเพิ่มได้ใช่มะ ถามว่าก่อนจะมี Big Data เค้ารู้ไหม เค้าก็รู้นะ แต่ช้าไงกว่าจะเอาข้อมูลทั้งหมดออกมาประมวลผลเพื่อให้ได้ผลลัพธ์ที่ถูกต้องที่สุด มันอาจจะต้องรอ 3 วัน
ซึ่งคำถามสำคัญคือ มันทันไหมละ?
ถ้าทันก็จบ ไม่ต้อง Big ดาต้งดาต้าอะไรมันแล้ว พอออ
แต่ถ้าไม่ทันเราละ สมมติเราอยากได้ผลลัพธ์ใน 3 วินาที เพื่อให้พนักงานร้าน 7-11 จะได้เสนอขายของทันทีที่เคาเตอร์เลยอ่ะ
แปลว่าวิธีการจัดการข้อมูลเราจะต้องเปลี่ยนแล้ว
หลัก ๆ พวก Big Data เนี้ยะมันจะมีสองส่วนคือ
- ส่วน Infrastructure ที่จะต้องไปทำ server แบบใหม่ฐานข้อมูลแบบใหม่การจัดเก็บแบบใหม่
- ส่วนที่เป็น Data analysis ที่เรามักได้ยินเรื่องอาชีพที่ sexy ที่สุดในยุคคือ Data Scientist นี่แหละที่เป็นคนทำ
คือจะมีทั้งสองส่วนก็ได้ หรือจะมีแค่อย่างใดอย่างหนึ่งก็ได้แต่หลักๆคือ มันทำจัดการกับข้อมูลเพื่อให้ได้ผลลัพธ์ที่เราต้องการได้ทันเวลาที่ ธุรกิจต้องการ
ถ้าวันนี้ธุรกิจเราไม่ได้มีปัญหาเรื่องนั้น ลืมคำว่า Big Data ไปเถอะอย่าเพิ่งไปโดนหลอกให้เสียเงินฟรีเลย
ถ้าวันนี้ธุรกิจเรามีปัญหาเรื่องอยากได้ insight ของลูกค้า ไปดูเรื่อง Data Visualization, Data mining โน้น
ด้วยความปรารถนาดี 52.5Hz