วิธีการบำรุงรักษานักวิทยาศาสตร์ข้อมูล

ผู้เขียน: Judy Howell
วันที่สร้าง: 26 กรกฎาคม 2021
วันที่อัปเดต: 21 มิถุนายน 2024
Anonim
PCCMS MED MOMENT EP 16 หลักสูตรวิทยาศาสตร์ข้อมูลสุขภาพ และหลักสูตรฟิสิกส์การแพทย์
วิดีโอ: PCCMS MED MOMENT EP 16 หลักสูตรวิทยาศาสตร์ข้อมูลสุขภาพ และหลักสูตรฟิสิกส์การแพทย์

เนื้อหา


Takeaway:

ในการบำรุงรักษานักวิทยาศาสตร์ด้านข้อมูล บริษัท จำเป็นต้องให้ความสำคัญกับวัฒนธรรมและโครงสร้างองค์กรมากขึ้น

ในบรรดาเทคโนโลยีที่เพิ่งเริ่มต้นนักวิทยาศาสตร์ด้านข้อมูลเป็นคำศัพท์ที่ใช้กันทั่วไปมากขึ้นที่ใช้เพื่ออ้างถึงข้อมูลที่สามารถเชื่อมโยงพื้นที่การทำงานที่แยกออกมาของข้อมูลแบบดั้งเดิม นักวิทยาศาสตร์ด้านข้อมูลคือใครบางคนที่รู้สึกสบายใจที่ดำเนินการหลาย ๆ ด้าน (ถ้าไม่ใช่ทั้งหมด) ของโครงการด้านข้อมูลอัจฉริยะ:

  1. การได้มาซึ่งข้อมูล: สิ่งนี้อาจนำไปสู่การเขียนตัวแยกวิเคราะห์ที่กำหนดเองและซอฟต์แวร์รวบรวมข้อมูลเว็บหรือสคริปต์ที่กำหนดเป้าหมายบริการเว็บหรือ API เฉพาะสำหรับแหล่งข้อมูลที่ไม่ใช่แบบดั้งเดิม
  2. การจัดการข้อมูล: ETL, จัดการ, สืบค้นและบำรุงรักษาข้อมูลในฐานข้อมูล, ร้านค้าคีย์ - ค่าหรือ Hadoop
  3. การแสดงข้อมูล: การเปิดเผยรูปแบบผ่านการใช้ชุดเครื่องมือการสร้างภาพแบบคงที่และ / หรือแพลตฟอร์มแบบโต้ตอบบนพื้นฐานของ Flash, JavaScript หรือการประมวลผล
  4. การวิเคราะห์: สิ่งนี้มีตั้งแต่เทคนิคง่าย ๆ ไปจนถึงซับซ้อนในสถิติหลายตัวแปรการเรียนรู้ของเครื่องจักรและ NLP
  5. Insight: แยกสรุปและนำเสนอการค้นพบที่สำคัญให้กับผู้ชมในวงกว้าง

มีเครื่องมือทักษะและรายละเอียดทางเทคนิคมากมายและสามารถใช้เวลาหลายปีในการเรียนรู้แต่ละรายการที่ระบุไว้ด้านบน ในขณะที่นักวิทยาศาสตร์ด้านข้อมูลอาจไม่มีความรู้จากผู้เชี่ยวชาญอย่างแท้จริงในทุก ๆ ด้านเขาหรือเธอสามารถข้ามไปมาได้อย่างสะดวกสบายและทำงานพื้นฐานในทุกเรื่อง ผลที่ได้คือข้อมูลที่ดูว่องไวพอที่จะตรวจสอบโครงการข้อมูลอย่างรวดเร็วและสร้างคำตอบสำหรับคำถามระดับสูงจากการจัดการ (อ่านเพิ่มเติมเกี่ยวกับนักวิทยาศาสตร์ข้อมูลใน Data Scientists: The Rock Rock แห่งเทคโลก)


ในการบำรุงรักษานักวิทยาศาสตร์ด้านข้อมูล บริษัท จำเป็นต้องให้ความสำคัญกับวัฒนธรรมและโครงสร้างองค์กรมากขึ้น ผู้ปฏิบัติงานด้านข้อมูลจำนวนมากมีทักษะและการฝึกอบรมเพียงพอที่จะทำงานได้อย่างรวดเร็วในหลาย ๆ ด้านของระบบสารสนเทศ ปัญหาคือส่วนใหญ่ไม่ทำงานในสภาพแวดล้อมที่สนับสนุนให้พวกเขากลายเป็นนักวิทยาศาสตร์ข้อมูล พวกเขากำลังติดอยู่ในไซโลและ จำกัด อยู่เพียงหนึ่งหรือสองด้านของระบบสารสนเทศ บ่อยครั้งที่พวกเขาถูก จำกัด ให้ใช้เครื่องมือ "อนุมัติ" โดยผู้จัดการของพวกเขา

หลังจากทำงานใน บริษัท ทั้งขนาดใหญ่และขนาดเล็กชัดเจนว่าการแยกงานอย่างเข้มงวดเป็นอุปสรรคสำคัญที่นักวิทยาศาสตร์ข้อมูลต้องเผชิญ อาการที่พบบ่อยที่สุดคือการแยกระหว่างการวิเคราะห์ข้อมูลและการจัดการข้อมูล ใน บริษัท ขนาดใหญ่หลายแห่งนักวิเคราะห์ / นักสถิติส่วนใหญ่ต้องรอข้อมูลจากทีมคลังข้อมูลที่กำหนดและในหลายกรณีพวกเขารอข้อมูลจากเจ้าของคลังข้อมูลที่แตกต่างกันหลายแห่ง

วิธีการส่งเสริมวิทยาศาสตร์ข้อมูลในองค์กร

ในขณะนี้นักวิทยาศาสตร์ด้านข้อมูลเติบโตขึ้นใน บริษัท สตาร์ทอัพเล็ก ๆ บริษัท อินเทอร์เน็ตและองค์กรอื่น ๆ ที่ไม่ค่อยให้ความสำคัญกับบทบาทและภาระงานที่กำหนดไว้ แต่ไม่มีเหตุผลจริงๆว่าทำไมองค์กรขนาดใหญ่และผู้ใหญ่ไม่สามารถร่วมสนุกได้ (ไม่มีเหตุผลว่าทำไมนักสถิติของคุณไม่สามารถเรียนรู้วิธีเขียนเว็บแครปเปอร์แบบง่าย ๆ และทำไมคนฐานข้อมูลของคุณไม่สามารถเรียนรู้สถิติและการสร้างภาพง่าย ๆ ได้) ต่อไปนี้เป็นคำแนะนำเล็กน้อยเกี่ยวกับวิธีทำให้เกิดขึ้น:


เมื่อคุณมุ่งมั่นที่จะจัดตั้งทีมนักวิทยาศาสตร์ข้อมูลคุณสามารถเริ่มต้นด้วยการระบุพนักงานปัจจุบันที่อาจเหมาะสมกับโปรไฟล์ พวกเขาจะต้องมีใจที่เปิดกว้างมีการทำงานเป็นทีมและมีทักษะการเขียนโปรแกรมในด้านใดด้านหนึ่งที่อธิบายไว้ข้างต้น เป็นการดีที่คุณจะมีคนจากวิทยาการคอมพิวเตอร์สถิติ / เชิงปริมาณหรือภูมิหลังที่มุ่งเน้นข้อมูล สมาชิกในทีมจะต้องเต็มใจที่จะแบ่งปันเครื่องมือง่ายๆแฮ็คและเทคนิคกับคนอื่น การผสมข้ามพันธุ์จะเกิดขึ้นตามธรรมชาติถ้าสมาชิกในทีมตื่นเต้นกับการเรียนรู้จากกันและกัน พนักงานที่ไม่เต็มใจที่จะแบ่งปันเทคนิคเครื่องมือและแนวคิดต่าง ๆ จะขัดขวางความก้าวหน้า

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

เมื่อผู้จัดการได้รับเสียงกระหึ่มที่มีทีมเล่นกับแหล่งข้อมูลใหม่พวกเขาอาจพยายามทำให้เกิดอุปสรรค ("แล้วเรื่องความสมบูรณ์ของข้อมูลล่ะ? พวกเขาไม่ได้ใช้เทคนิคการเรียนรู้ / สถิติทางกลที่เหมาะสม! การออกแบบการทดลองนั้นผิด! รวมเข้ากับข้อมูลของเราหรือไม่ ") หากไม่มีการสนับสนุนทางการเมืองทีมนักวิทยาศาสตร์ด้านข้อมูลของคุณกำลังเผชิญกับไฟไหม้ที่เป็นมิตร สิ่งใหม่มีแนวโน้มที่จะถูกมองว่าเป็นภัยคุกคามดังนั้นจึงเป็นการดีที่สุดที่จะสร้างความมั่นใจให้กับผู้จัดการอย่างรวดเร็ว ข้อมูลเชิงลึกที่เปิดเผยโดยทีมนักวิทยาศาสตร์ข้อมูลขนาดเล็กของคุณสามารถใช้เพื่อแจ้งโครงการข้อมูล / การวิเคราะห์ที่เป็นทางการมากขึ้น นักวิทยาศาสตร์ด้านข้อมูลไม่ต้องการลดค่าสถิติ แต่อาจชี้ไปที่ชุดข้อมูลและคำถามที่แตกต่างกัน

ใช้ทีมเริ่มต้นของนักวิทยาศาสตร์ข้อมูลเป็นผู้เผยแพร่ศาสนา

หากคุณเลือกทีมเริ่มต้นของนักวิทยาศาสตร์ด้านข้อมูลอย่างถูกต้องพวกเขาควรจะนำเสนอสิ่งที่ค้นพบกับคนอื่น ๆ ใน บริษัท ของคุณ ยังดีกว่าพวกเขาจะกระตือรือร้นกับมัน! ใช้พวกมันเพื่อโน้มน้าวให้คนที่เหลือใน บริษัท มองความฉลาดของข้อมูลและทำให้ช้าลงไซโลเหล่านั้น

ฉันไม่ได้บอกว่าเครื่องมือการฝึกอบรมและองค์กรใหม่ ๆ จะไม่จำเป็นในที่สุดเมื่อคุณจัดตั้งทีมนักวิทยาศาสตร์ด้านข้อมูลของคุณเอง แต่ฉันคิดว่าการพูดถึงโครงสร้างทางวัฒนธรรมและองค์กรหลาย บริษัท สามารถใช้พนักงานของตนเองพร้อมกับเครื่องมือฟรีเพื่อสร้างทีมนักวิทยาศาสตร์ข้อมูลขนาดเล็ก ฉันพูดจากประสบการณ์การทำงานให้กับ บริษัท ขนาดใหญ่ - มีความสามารถและเทคนิคต่าง ๆ ที่ยากต่อการเรียนรู้ แต่ไซโลขององค์กรยากที่จะเอาชนะ อันดับของพวกเขานั้นมีกลุ่มผู้มีความสามารถที่พร้อมจะส่องแสงหากไม่ใช่โครงสร้างองค์กรที่เข้มงวดซึ่งจะ จำกัด สิ่งที่พวกเขาสามารถทำได้


เผยแพร่ซ้ำโดยได้รับอนุญาตจาก http://practicalquant.blogspot.ca และ Ben Lorica สามารถดูบทความต้นฉบับได้ที่นี่: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html