เนื้อหา
Takeaway:
ในการบำรุงรักษานักวิทยาศาสตร์ด้านข้อมูล บริษัท จำเป็นต้องให้ความสำคัญกับวัฒนธรรมและโครงสร้างองค์กรมากขึ้น
ในบรรดาเทคโนโลยีที่เพิ่งเริ่มต้นนักวิทยาศาสตร์ด้านข้อมูลเป็นคำศัพท์ที่ใช้กันทั่วไปมากขึ้นที่ใช้เพื่ออ้างถึงข้อมูลที่สามารถเชื่อมโยงพื้นที่การทำงานที่แยกออกมาของข้อมูลแบบดั้งเดิม นักวิทยาศาสตร์ด้านข้อมูลคือใครบางคนที่รู้สึกสบายใจที่ดำเนินการหลาย ๆ ด้าน (ถ้าไม่ใช่ทั้งหมด) ของโครงการด้านข้อมูลอัจฉริยะ:
- การได้มาซึ่งข้อมูล: สิ่งนี้อาจนำไปสู่การเขียนตัวแยกวิเคราะห์ที่กำหนดเองและซอฟต์แวร์รวบรวมข้อมูลเว็บหรือสคริปต์ที่กำหนดเป้าหมายบริการเว็บหรือ API เฉพาะสำหรับแหล่งข้อมูลที่ไม่ใช่แบบดั้งเดิม
- การจัดการข้อมูล: ETL, จัดการ, สืบค้นและบำรุงรักษาข้อมูลในฐานข้อมูล, ร้านค้าคีย์ - ค่าหรือ Hadoop
- การแสดงข้อมูล: การเปิดเผยรูปแบบผ่านการใช้ชุดเครื่องมือการสร้างภาพแบบคงที่และ / หรือแพลตฟอร์มแบบโต้ตอบบนพื้นฐานของ Flash, JavaScript หรือการประมวลผล
- การวิเคราะห์: สิ่งนี้มีตั้งแต่เทคนิคง่าย ๆ ไปจนถึงซับซ้อนในสถิติหลายตัวแปรการเรียนรู้ของเครื่องจักรและ NLP
- Insight: แยกสรุปและนำเสนอการค้นพบที่สำคัญให้กับผู้ชมในวงกว้าง
มีเครื่องมือทักษะและรายละเอียดทางเทคนิคมากมายและสามารถใช้เวลาหลายปีในการเรียนรู้แต่ละรายการที่ระบุไว้ด้านบน ในขณะที่นักวิทยาศาสตร์ด้านข้อมูลอาจไม่มีความรู้จากผู้เชี่ยวชาญอย่างแท้จริงในทุก ๆ ด้านเขาหรือเธอสามารถข้ามไปมาได้อย่างสะดวกสบายและทำงานพื้นฐานในทุกเรื่อง ผลที่ได้คือข้อมูลที่ดูว่องไวพอที่จะตรวจสอบโครงการข้อมูลอย่างรวดเร็วและสร้างคำตอบสำหรับคำถามระดับสูงจากการจัดการ (อ่านเพิ่มเติมเกี่ยวกับนักวิทยาศาสตร์ข้อมูลใน Data Scientists: The Rock Rock แห่งเทคโลก)
ในการบำรุงรักษานักวิทยาศาสตร์ด้านข้อมูล บริษัท จำเป็นต้องให้ความสำคัญกับวัฒนธรรมและโครงสร้างองค์กรมากขึ้น ผู้ปฏิบัติงานด้านข้อมูลจำนวนมากมีทักษะและการฝึกอบรมเพียงพอที่จะทำงานได้อย่างรวดเร็วในหลาย ๆ ด้านของระบบสารสนเทศ ปัญหาคือส่วนใหญ่ไม่ทำงานในสภาพแวดล้อมที่สนับสนุนให้พวกเขากลายเป็นนักวิทยาศาสตร์ข้อมูล พวกเขากำลังติดอยู่ในไซโลและ จำกัด อยู่เพียงหนึ่งหรือสองด้านของระบบสารสนเทศ บ่อยครั้งที่พวกเขาถูก จำกัด ให้ใช้เครื่องมือ "อนุมัติ" โดยผู้จัดการของพวกเขา
หลังจากทำงานใน บริษัท ทั้งขนาดใหญ่และขนาดเล็กชัดเจนว่าการแยกงานอย่างเข้มงวดเป็นอุปสรรคสำคัญที่นักวิทยาศาสตร์ข้อมูลต้องเผชิญ อาการที่พบบ่อยที่สุดคือการแยกระหว่างการวิเคราะห์ข้อมูลและการจัดการข้อมูล ใน บริษัท ขนาดใหญ่หลายแห่งนักวิเคราะห์ / นักสถิติส่วนใหญ่ต้องรอข้อมูลจากทีมคลังข้อมูลที่กำหนดและในหลายกรณีพวกเขารอข้อมูลจากเจ้าของคลังข้อมูลที่แตกต่างกันหลายแห่ง
วิธีการส่งเสริมวิทยาศาสตร์ข้อมูลในองค์กร
ในขณะนี้นักวิทยาศาสตร์ด้านข้อมูลเติบโตขึ้นใน บริษัท สตาร์ทอัพเล็ก ๆ บริษัท อินเทอร์เน็ตและองค์กรอื่น ๆ ที่ไม่ค่อยให้ความสำคัญกับบทบาทและภาระงานที่กำหนดไว้ แต่ไม่มีเหตุผลจริงๆว่าทำไมองค์กรขนาดใหญ่และผู้ใหญ่ไม่สามารถร่วมสนุกได้ (ไม่มีเหตุผลว่าทำไมนักสถิติของคุณไม่สามารถเรียนรู้วิธีเขียนเว็บแครปเปอร์แบบง่าย ๆ และทำไมคนฐานข้อมูลของคุณไม่สามารถเรียนรู้สถิติและการสร้างภาพง่าย ๆ ได้) ต่อไปนี้เป็นคำแนะนำเล็กน้อยเกี่ยวกับวิธีทำให้เกิดขึ้น:
เมื่อคุณมุ่งมั่นที่จะจัดตั้งทีมนักวิทยาศาสตร์ข้อมูลคุณสามารถเริ่มต้นด้วยการระบุพนักงานปัจจุบันที่อาจเหมาะสมกับโปรไฟล์ พวกเขาจะต้องมีใจที่เปิดกว้างมีการทำงานเป็นทีมและมีทักษะการเขียนโปรแกรมในด้านใดด้านหนึ่งที่อธิบายไว้ข้างต้น เป็นการดีที่คุณจะมีคนจากวิทยาการคอมพิวเตอร์สถิติ / เชิงปริมาณหรือภูมิหลังที่มุ่งเน้นข้อมูล สมาชิกในทีมจะต้องเต็มใจที่จะแบ่งปันเครื่องมือง่ายๆแฮ็คและเทคนิคกับคนอื่น การผสมข้ามพันธุ์จะเกิดขึ้นตามธรรมชาติถ้าสมาชิกในทีมตื่นเต้นกับการเรียนรู้จากกันและกัน พนักงานที่ไม่เต็มใจที่จะแบ่งปันเทคนิคเครื่องมือและแนวคิดต่าง ๆ จะขัดขวางความก้าวหน้า
คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์
เมื่อผู้จัดการได้รับเสียงกระหึ่มที่มีทีมเล่นกับแหล่งข้อมูลใหม่พวกเขาอาจพยายามทำให้เกิดอุปสรรค ("แล้วเรื่องความสมบูรณ์ของข้อมูลล่ะ? พวกเขาไม่ได้ใช้เทคนิคการเรียนรู้ / สถิติทางกลที่เหมาะสม! การออกแบบการทดลองนั้นผิด! รวมเข้ากับข้อมูลของเราหรือไม่ ") หากไม่มีการสนับสนุนทางการเมืองทีมนักวิทยาศาสตร์ด้านข้อมูลของคุณกำลังเผชิญกับไฟไหม้ที่เป็นมิตร สิ่งใหม่มีแนวโน้มที่จะถูกมองว่าเป็นภัยคุกคามดังนั้นจึงเป็นการดีที่สุดที่จะสร้างความมั่นใจให้กับผู้จัดการอย่างรวดเร็ว ข้อมูลเชิงลึกที่เปิดเผยโดยทีมนักวิทยาศาสตร์ข้อมูลขนาดเล็กของคุณสามารถใช้เพื่อแจ้งโครงการข้อมูล / การวิเคราะห์ที่เป็นทางการมากขึ้น นักวิทยาศาสตร์ด้านข้อมูลไม่ต้องการลดค่าสถิติ แต่อาจชี้ไปที่ชุดข้อมูลและคำถามที่แตกต่างกัน
ใช้ทีมเริ่มต้นของนักวิทยาศาสตร์ข้อมูลเป็นผู้เผยแพร่ศาสนา
หากคุณเลือกทีมเริ่มต้นของนักวิทยาศาสตร์ด้านข้อมูลอย่างถูกต้องพวกเขาควรจะนำเสนอสิ่งที่ค้นพบกับคนอื่น ๆ ใน บริษัท ของคุณ ยังดีกว่าพวกเขาจะกระตือรือร้นกับมัน! ใช้พวกมันเพื่อโน้มน้าวให้คนที่เหลือใน บริษัท มองความฉลาดของข้อมูลและทำให้ช้าลงไซโลเหล่านั้น
ฉันไม่ได้บอกว่าเครื่องมือการฝึกอบรมและองค์กรใหม่ ๆ จะไม่จำเป็นในที่สุดเมื่อคุณจัดตั้งทีมนักวิทยาศาสตร์ด้านข้อมูลของคุณเอง แต่ฉันคิดว่าการพูดถึงโครงสร้างทางวัฒนธรรมและองค์กรหลาย บริษัท สามารถใช้พนักงานของตนเองพร้อมกับเครื่องมือฟรีเพื่อสร้างทีมนักวิทยาศาสตร์ข้อมูลขนาดเล็ก ฉันพูดจากประสบการณ์การทำงานให้กับ บริษัท ขนาดใหญ่ - มีความสามารถและเทคนิคต่าง ๆ ที่ยากต่อการเรียนรู้ แต่ไซโลขององค์กรยากที่จะเอาชนะ อันดับของพวกเขานั้นมีกลุ่มผู้มีความสามารถที่พร้อมจะส่องแสงหากไม่ใช่โครงสร้างองค์กรที่เข้มงวดซึ่งจะ จำกัด สิ่งที่พวกเขาสามารถทำได้
เผยแพร่ซ้ำโดยได้รับอนุญาตจาก http://practicalquant.blogspot.ca และ Ben Lorica สามารถดูบทความต้นฉบับได้ที่นี่: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html