10 Big Data Do's และ Don'ts

ผู้เขียน: Eugene Taylor
วันที่สร้าง: 13 สิงหาคม 2021
วันที่อัปเดต: 22 มิถุนายน 2024
Anonim
10 Big Data Do's และ Don'ts - เทคโนโลยี
10 Big Data Do's และ Don'ts - เทคโนโลยี

เนื้อหา



ที่มา: Rawpixelimages / Dreamstime.com

Takeaway:

Big data เป็นโดเมนใหม่และเกิดขึ้นใหม่สำหรับ บริษัท ส่วนใหญ่ การทำให้มันใช้งานได้นั้นต้องทำการปรับจูนอย่างละเอียดและใช้แนวปฏิบัติที่เหมาะสมที่สุด

ข้อมูลขนาดใหญ่มีสัญญามากมายสำหรับอุตสาหกรรมทุกประเภท หากข้อมูลขนาดใหญ่นี้ได้รับการใช้ประโยชน์อย่างมีประสิทธิภาพและมีประสิทธิภาพข้อมูลนั้นอาจมีผลกระทบอย่างมีนัยสำคัญในการตัดสินใจและการวิเคราะห์ แต่ประโยชน์ของข้อมูลขนาดใหญ่สามารถทำได้หากจัดการในลักษณะที่มีโครงสร้าง แนวปฏิบัติที่ดีที่สุดของข้อมูลขนาดใหญ่ได้รับการจัดตั้งขึ้นอย่างค่อยเป็นค่อยไป แต่มีบางสิ่งที่ชัดเจนและไม่ควรนำมาใช้เมื่อมีการนำไปใช้

คำแนะนำต่อไปนี้ขึ้นอยู่กับประสบการณ์จริงและความรู้ที่รวบรวมจากโครงการในชีวิตจริง นี่คือข้อมูลขนาดใหญ่ที่ฉันควรทำและบริจาค

เกี่ยวข้องกับส่วนธุรกิจทั้งหมดในโครงการข้อมูลขนาดใหญ่

ความคิดริเริ่มด้านข้อมูลขนาดใหญ่ไม่ใช่กิจกรรมที่แยกได้และเป็นอิสระและการมีส่วนร่วมของทุกหน่วยธุรกิจจะต้องได้รับคุณค่าและความเข้าใจที่แท้จริง ข้อมูลขนาดใหญ่สามารถช่วยให้องค์กรใช้ประโยชน์จากข้อมูลจำนวนมากและได้รับข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมของลูกค้าเหตุการณ์แนวโน้มการคาดการณ์และอื่น ๆ ซึ่งเป็นไปไม่ได้ด้วยสแนปชอตของข้อมูลซึ่งรวบรวมเฉพาะส่วนหนึ่งของปริมาณข้อมูลทั้งหมด ดังนั้น บริษัท ต่าง ๆ จึงให้ความสำคัญกับข้อมูลทุกประเภทที่มาจากหน่วยงาน / หน่วยธุรกิจที่เป็นไปได้มากขึ้นเพื่อทำความเข้าใจกับรูปแบบที่ถูกต้อง

ประเมินโมเดลโครงสร้างพื้นฐานทั้งหมดสำหรับการใช้งานข้อมูลขนาดใหญ่

ปริมาณข้อมูลและการจัดการนั้นเป็นข้อกังวลหลักสำหรับการริเริ่มข้อมูลขนาดใหญ่ เนื่องจากข้อมูลขนาดใหญ่เกี่ยวข้องกับเพตาไบต์ของข้อมูลทางออกเดียวในการจัดการคือใช้ศูนย์ข้อมูล ในขณะเดียวกันส่วนประกอบต้นทุนจะต้องได้รับการพิจารณาก่อนที่จะเลือกและทำให้สถานที่จัดเก็บเสร็จสมบูรณ์ บริการคลาวด์มักจะเป็นทางเลือกที่ดีที่สุด แต่บริการของสภาพแวดล้อมคลาวด์ที่แตกต่างกันจะต้องได้รับการประเมินเพื่อพิจารณาบริการที่เหมาะสม เนื่องจากการจัดเก็บข้อมูลเป็นหนึ่งในองค์ประกอบที่สำคัญที่สุดในการใช้งานข้อมูลขนาดใหญ่ใด ๆ จึงเป็นปัจจัยที่ควรได้รับการประเมินอย่างรอบคอบในการริเริ่มข้อมูลขนาดใหญ่ (รับมุมมองอื่นในการท้าทายข้อมูลขนาดใหญ่ในปัจจุบันเกิดจากความหลากหลายไม่ใช่ปริมาณหรือความเร็ว)

พิจารณาแหล่งข้อมูลดั้งเดิมในการวางแผนข้อมูลขนาดใหญ่

มีแหล่งข้อมูลขนาดใหญ่หลายแห่งและจำนวนแหล่งข้อมูลก็เพิ่มขึ้นทุกวัน ข้อมูลจำนวนมากนี้ถูกใช้เป็นอินพุตในการประมวลผลข้อมูลขนาดใหญ่ เป็นผลให้บาง บริษัท คิดว่าแหล่งข้อมูลดั้งเดิมไม่มีประโยชน์ นี่ไม่ใช่ความจริงเนื่องจากข้อมูลดั้งเดิมนี้เป็นองค์ประกอบที่สำคัญสำหรับความสำเร็จของเรื่องราวข้อมูลขนาดใหญ่ ข้อมูลดั้งเดิมมีข้อมูลที่มีค่าดังนั้นควรใช้ร่วมกับแหล่งข้อมูลขนาดใหญ่อื่น ๆ มูลค่าที่แท้จริงของข้อมูลขนาดใหญ่สามารถรับได้หากแหล่งข้อมูลทั้งหมด (ดั้งเดิมและไม่ใช่ข้อมูลดั้งเดิม) ถูกนำมาพิจารณา (เรียนรู้เพิ่มเติมเกี่ยวกับ Take That, Big Data! ทำไม Data ขนาดเล็กอาจบรรจุ Punch ที่ใหญ่กว่าได้)

พิจารณาชุดข้อมูลที่สอดคล้องกัน

ในสภาพแวดล้อมข้อมูลขนาดใหญ่ข้อมูลมาจากแหล่งต่าง ๆ รูปแบบโครงสร้างและประเภทของข้อมูลแตกต่างจากแหล่งหนึ่งไปอีกแหล่งหนึ่ง ส่วนที่สำคัญที่สุดคือข้อมูลจะไม่ถูกล้างออกเมื่อมาถึงสภาพแวดล้อมข้อมูลขนาดใหญ่ของคุณ ดังนั้นก่อนที่คุณจะเชื่อถือข้อมูลที่เข้ามาคุณต้องตรวจสอบความสอดคล้องโดยการสังเกตและวิเคราะห์ซ้ำ ๆ เมื่อยืนยันความสอดคล้องของข้อมูลแล้วสามารถถือว่าเป็นชุดข้อมูลเมตาที่สอดคล้องกัน การค้นหาชุดข้อมูลเมตาที่สอดคล้องกันโดยการสังเกตอย่างระมัดระวังของรูปแบบคือการออกกำลังกายที่สำคัญในการวางแผนข้อมูลขนาดใหญ่

ทำการแจกจ่ายข้อมูล

ปริมาณข้อมูลเป็นข้อกังวลหลักเมื่อเราพิจารณาสภาพแวดล้อมการประมวลผล เนื่องจากปริมาณข้อมูลจำนวนมากที่ข้อมูลขนาดใหญ่เกี่ยวข้องจึงไม่สามารถทำการประมวลผลบนเซิร์ฟเวอร์เดียวได้ การแก้ปัญหาคือสภาพแวดล้อม Hadoop ซึ่งเป็นสภาพแวดล้อมการคำนวณแบบกระจายที่ทำงานบนฮาร์ดแวร์สินค้าโภคภัณฑ์ มันให้พลังของการประมวลผลที่เร็วขึ้นในหลาย ๆ โหนด (เรียนรู้เพิ่มเติมใน 7 สิ่งที่ควรรู้เกี่ยวกับ Hadoop)

อย่าพึ่งพาวิธีการวิเคราะห์ข้อมูลขนาดใหญ่เพียงครั้งเดียว

มีเทคโนโลยีหลากหลายในตลาดสำหรับการประมวลผลข้อมูลขนาดใหญ่ รากฐานของเทคโนโลยีข้อมูลขนาดใหญ่ทั้งหมดคือ Apache Hadoop และ MapReduce ดังนั้นจึงเป็นสิ่งสำคัญในการประเมินเทคโนโลยีที่ถูกต้องเพื่อวัตถุประสงค์ที่ถูกต้อง แนวทางการวิเคราะห์ที่สำคัญบางอย่าง ได้แก่ การวิเคราะห์เชิงพยากรณ์การวิเคราะห์เชิงกำหนดการวิเคราะห์การวิเคราะห์ข้อมูลสตรีม ฯลฯ การเลือกวิธีการ / แนวทางที่เหมาะสมนั้นเป็นสิ่งสำคัญเพื่อให้บรรลุเป้าหมายที่ต้องการ เป็นการดีที่สุดที่จะหลีกเลี่ยงการพึ่งพาวิธีการเดียว แต่เพื่อตรวจสอบวิธีการต่างๆและเลือกคู่ที่สมบูรณ์แบบสำหรับโซลูชันของคุณ

อย่าเริ่มต้นโครงการข้อมูลขนาดใหญ่ขนาดใหญ่ก่อนที่คุณจะพร้อม

ขอแนะนำเสมอให้เริ่มต้นด้วยขั้นตอนเล็ก ๆ สำหรับการริเริ่มข้อมูลขนาดใหญ่ ดังนั้นเริ่มต้นด้วยโครงการนำร่องเพื่อเพิ่มความเชี่ยวชาญแล้วไปสู่การปฏิบัติจริง ศักยภาพของข้อมูลขนาดใหญ่นั้นน่าประทับใจมาก แต่คุณค่าที่แท้จริงจะเกิดขึ้นได้ก็ต่อเมื่อเราลดความผิดพลาดและได้รับความเชี่ยวชาญมากขึ้น

อย่าใช้ข้อมูลในการแยก

แหล่งข้อมูลขนาดใหญ่กระจัดกระจายรอบตัวเราและเพิ่มขึ้นทุกวัน มันเป็นสิ่งสำคัญที่จะรวมข้อมูลทั้งหมดเหล่านี้เพื่อรับเอาท์พุทการวิเคราะห์ที่ถูกต้อง มีเครื่องมือต่าง ๆ ในตลาดสำหรับการรวมข้อมูล แต่ควรประเมินอย่างเหมาะสมก่อนการใช้งาน การรวมข้อมูลขนาดใหญ่เป็นงานที่ซับซ้อนเนื่องจากข้อมูลจากแหล่งต่าง ๆ มีรูปแบบที่แตกต่างกัน แต่จำเป็นอย่างยิ่งที่จะต้องได้รับผลการวิเคราะห์ที่ดี

อย่าเพิกเฉยต่อความปลอดภัยของข้อมูล

ความปลอดภัยของข้อมูลเป็นข้อพิจารณาที่สำคัญในการวางแผนข้อมูลขนาดใหญ่ ในขั้นต้น (ก่อนทำการประมวลผลใด ๆ ) ข้อมูลจะอยู่ในรูปแบบเพตาไบต์ดังนั้นการรักษาความปลอดภัยจึงไม่ได้นำไปใช้อย่างเคร่งครัด แต่หลังจากการประมวลผลบางอย่างคุณจะได้รับชุดย่อยของข้อมูลที่ให้ข้อมูลเชิงลึกบางอย่าง ณ จุดนี้ความปลอดภัยของข้อมูลกลายเป็นสิ่งจำเป็น ยิ่งมีการประมวลผลและปรับแต่งข้อมูลมากเท่าใดยิ่งมีคุณค่ามากขึ้นสำหรับองค์กร ข้อมูลผลลัพธ์ที่ได้รับการปรับช่องรับสัญญาณนี้เป็นทรัพย์สินทางปัญญาและต้องปลอดภัย การรักษาความปลอดภัยข้อมูลจะต้องดำเนินการเป็นส่วนหนึ่งของวงจรชีวิตข้อมูลขนาดใหญ่

อย่าเพิกเฉยต่อประสิทธิภาพของการวิเคราะห์ข้อมูลขนาดใหญ่

ผลลัพธ์ของการวิเคราะห์ข้อมูลขนาดใหญ่มีประโยชน์เฉพาะเมื่อให้ประสิทธิภาพที่ดีเท่านั้น ข้อมูลขนาดใหญ่ให้ข้อมูลเชิงลึกมากขึ้นตามการประมวลผลข้อมูลจำนวนมากด้วยความเร็วที่เร็วขึ้น ดังนั้นจึงเป็นสิ่งสำคัญในการจัดการอย่างมีประสิทธิภาพและประสิทธิผล หากประสิทธิภาพของข้อมูลขนาดใหญ่ไม่ได้รับการจัดการอย่างรอบคอบมันจะทำให้เกิดปัญหาและทำให้ความพยายามทั้งหมดไม่มีความหมาย

ในการสนทนาของเราเราได้มุ่งเน้นไปที่ dos และ donts ของการริเริ่มข้อมูลขนาดใหญ่ ข้อมูลขนาดใหญ่เป็นพื้นที่ที่กำลังเติบโตและเมื่อมีการดำเนินการ บริษัท หลายแห่งยังอยู่ในช่วงการวางแผน จำเป็นต้องเข้าใจแนวทางปฏิบัติที่ดีที่สุดของข้อมูลขนาดใหญ่เพื่อลดความเสี่ยงและข้อผิดพลาด จุดอภิปรายได้มาจากประสบการณ์โครงการจริงดังนั้นมันจะให้แนวทางบางอย่างสำหรับการทำให้กลยุทธ์ข้อมูลขนาดใหญ่ประสบความสำเร็จ