12 เคล็ดลับสำคัญสำหรับการเรียนรู้วิทยาศาสตร์ข้อมูล

ผู้เขียน: Laura McKinney
วันที่สร้าง: 3 เมษายน 2021
วันที่อัปเดต: 1 กรกฎาคม 2024
Anonim
เคล็ดลับเรียนภาษาแบบ "เด็กน้อยร้อยภาษา" - ย่อโลก
วิดีโอ: เคล็ดลับเรียนภาษาแบบ "เด็กน้อยร้อยภาษา" - ย่อโลก

เนื้อหา


ที่มา: Artinspiring / Dreamstime.com

Takeaway:

เห็นได้ชัดว่านักวิทยาศาสตร์ด้านข้อมูลต้องการทักษะทางคณิตศาสตร์และการเขียนโปรแกรมที่แข็งแกร่ง แต่การสื่อสารและทักษะที่อ่อนนุ่มอื่น ๆ ก็เป็นสิ่งจำเป็นต่อความสำเร็จ

นักวิทยาศาสตร์ด้านข้อมูลอยู่ในอันดับที่ดีที่สุดสำหรับปี 2019 ในอเมริกาใน Glassdoor ด้วยเงินเดือนฐานเฉลี่ยอยู่ที่ $ 108,000 และอันดับความพึงพอใจในงาน 4.3 จาก 5 บวกกับจำนวนช่องว่างที่คาดการณ์ไว้ซึ่งไม่น่าแปลกใจ คำถามคือ: เราต้องทำอะไรเพื่อให้มีคุณสมบัติสำหรับงานนี้?

เพื่อหาคำตอบเรามองหาคำแนะนำที่มอบให้กับผู้ที่แสวงหาเส้นทางอาชีพนี้ ทักษะมากมายในการเขียนโปรแกรมและคณิตศาสตร์ แต่การคำนวณที่แข็งแกร่งเพียงอย่างเดียวไม่ได้เป็นการลดทอน นักวิทยาศาสตร์ด้านข้อมูลที่ประสบความสำเร็จจำเป็นต้องสามารถพูดคุยกับนักธุรกิจด้วยเงื่อนไขของตนเองซึ่งเรียกร้องให้มีความสามารถที่เกี่ยวข้องกับทักษะที่อ่อนนุ่มและความเป็นผู้นำ (หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับหน้าที่ของนักวิทยาศาสตร์ข้อมูลดูบทบาทหน้าที่: นักวิทยาศาสตร์ข้อมูล)

การสร้างรากฐานทางการศึกษา: สามเคล็ดลับเบื้องต้น

Drace Zhan นักวิทยาศาสตร์ด้านข้อมูลที่ NYC Data Science Academy เน้นย้ำถึงความจำเป็นในการสร้างรากฐานทางการศึกษาที่รวมถึงความจำเป็นด้านการเข้ารหัสและความสามารถทางคณิตศาสตร์:


  1. R / Python + SQL หากคุณไม่มีทักษะการเขียนรหัสคุณจำเป็นต้องใช้พลังเครือข่ายและพื้นที่อื่น ๆ จำนวนมากเพื่อชดเชยการขาดดุลนี้ ฉันเคยเห็นนักวิทยาศาสตร์ข้อมูลที่มีปัญหาทางคณิตศาสตร์ต่ำและมีประสบการณ์โดเมนน้อย แต่พวกเขาก็มีความสามารถในการเขียนโค้ดที่แข็งแกร่งอยู่เสมอ Python เป็นอุดมคติ แต่ R เป็นเครื่องมือถอยกลับที่ยอดเยี่ยม เป็นการดีที่สุดที่จะมีทั้งคู่ในคลังแสงของคุณ SQL เป็นสิ่งสำคัญอย่างยิ่งสำหรับนักวิเคราะห์ข้อมูล

  2. ทักษะทางคณิตศาสตร์ที่แข็งแกร่ง มีความเข้าใจที่ดีเกี่ยวกับวิธีการที่ใช้กันทั่วไปสองสามประการ: โมเดลเชิงเส้นทั่วไป, ต้นไม้ตัดสินใจ, ค่าเฉลี่ย K และการทดสอบทางสถิติดีกว่าการมีภาพรวมของแบบจำลองต่างๆหรือความเชี่ยวชาญเช่น RNN

สิ่งเหล่านี้เป็นทักษะที่สำคัญในการสร้างแม้ว่าผู้เชี่ยวชาญบางคนจะเพิ่มพวกเขา ตัวอย่างเช่นรายการ KDnuggets รวมถึงคอมโพเนนต์การเข้ารหัส Zhan ที่กล่าวถึงและเพิ่มสิ่งที่มีประโยชน์อื่น ๆ ที่ต้องทราบในด้านเทคนิครวมถึงแพลตฟอร์ม Hadoop Apache Spark, การสร้างภาพข้อมูล, ข้อมูลที่ไม่มีโครงสร้างการเรียนรู้ของเครื่องและ AI

แต่ถ้าเราใช้ตัวชี้นำของเราจากการสำรวจเครื่องมือที่ใช้บ่อยที่สุดที่ระบุให้ใช้ในชีวิตจริงโดยการสำรวจ Kaggle เราได้รับผลลัพธ์ที่แตกต่างกันบ้าง อย่างที่คุณเห็นจากกราฟของ 15 อันดับแรกด้านล่าง Python, R และ SQL สามารถสร้างสามอันดับแรกได้ง่าย ๆ แต่อันดับสี่คือสมุดบันทึก Jupyter ตามด้วย TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoSQL , MATLAB / Octave และ Java ทั้งหมดข้างหน้าของ Hadoop และ Spark นอกจากนี้อีกหนึ่งที่อาจทำให้คนแปลกใจคือ Excel Data Mining ของ Microsoft


รูปภาพมารยาทของ Kaggle

รายการ KDnuggets ยังมีคำแนะนำเกี่ยวกับการศึกษาในระบบ นักวิทยาศาสตร์ด้านข้อมูลส่วนใหญ่มีปริญญาขั้นสูง: 46 เปอร์เซ็นต์มีปริญญาเอกและ 88% ถือเป็นอย่างน้อยในระดับปริญญาโท ระดับปริญญาตรีที่พวกเขามีอยู่นั้นโดยทั่วไปจะแยกระหว่างสาขาที่เกี่ยวข้อง ประมาณหนึ่งในสามอยู่ในวิชาคณิตศาสตร์และสถิติซึ่งเป็นที่นิยมมากที่สุดสำหรับการติดตามอาชีพนี้ อันดับต่อไปที่ได้รับความนิยมมากที่สุดคือสาขาวิทยาการคอมพิวเตอร์ซึ่งจัดขึ้น 19 เปอร์เซ็นต์และสาขาวิศวกรรมเลือกได้ 16 เปอร์เซ็นต์ แน่นอนว่าเครื่องมือทางเทคนิคเฉพาะด้านวิทยาศาสตร์ข้อมูลมักไม่ได้รับการศึกษาในหลักสูตรปริญญา แต่ในค่าย boot เฉพาะหรือผ่านหลักสูตรออนไลน์

มากกว่าหลักสูตร: สองเคล็ดลับเพิ่มเติม

Hank Yun ผู้ช่วยวิจัยในแผนกการแพทย์ของ Weill Cornell Medicine และนักเรียนที่ NYC Data Science Academy แนะนำให้นักวิทยาศาสตร์ด้านข้อมูลที่ต้องการวางแผนรอบสิ่งที่พวกเขาจะทำงานและหาที่ปรึกษา เขาพูดว่า:

ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

อย่าทำผิดที่ฉันทำโดยบอกตัวเองว่าคุณรู้จักวิทยาศาสตร์ข้อมูลเพราะคุณเรียนและได้รับใบรับรอง นั่นเป็นการเริ่มต้นที่ดี แต่เมื่อคุณเริ่มเรียนให้ไปกับโครงการในใจ จากนั้นหาที่ปรึกษาในสนามและเริ่มโครงการความรักได้ทันที! เมื่อคุณสดคุณจะไม่ทราบว่าคุณไม่รู้อะไรมันจะช่วยได้เมื่อมีคนคอยแนะนำคุณเกี่ยวกับสิ่งที่สำคัญสำหรับคุณและสิ่งที่ไม่ คุณไม่ต้องการที่จะใช้เวลาในการศึกษามากมายโดยไม่ต้องแสดงอะไร!

การรู้ว่าเครื่องมือใดที่จะนำออกมาจากกล่องเครื่องมือของคุณ: เคล็ดลับที่จะอยู่ข้างหน้าของ Curve

เมื่อพิจารณาถึงความไม่เสมอภาคในการจัดอันดับเครื่องมือด้านข้อมูลบางคนอาจรู้สึกสับสนเกี่ยวกับสิ่งที่จะมุ่งเน้น Celeste Fralick หัวหน้านักวิทยาศาสตร์ข้อมูลของ McAfee บริษัท ซอฟต์แวร์ด้านความปลอดภัยกล่าวถึงปัญหาในบทความ CIO ที่ดูทักษะที่จำเป็นสำหรับนักวิทยาศาสตร์ด้านข้อมูลกล่าวว่า“ นักวิทยาศาสตร์ด้านข้อมูลจำเป็นต้องอยู่หน้าแนวโค้งในการวิจัยเช่นเดียวกับ เข้าใจเทคโนโลยีที่จะนำไปใช้เมื่อใด” นั่นหมายความว่าการไม่“ ล่อลวง”“ เซ็กซี่” และใหม่เมื่อปัญหาจริง” ต้องการสิ่งที่มากกว่า “ การตระหนักถึงต้นทุนการคำนวณต่อระบบนิเวศการตีความความล่าช้าแบนด์วิธและเงื่อนไขขอบเขตของระบบอื่น ๆ - รวมถึงความสมบูรณ์ของลูกค้า - ช่วยให้นักวิทยาศาสตร์ข้อมูลเข้าใจเทคโนโลยีที่จะนำไปใช้”

ทักษะอ่อนที่จำเป็น: อีกหกเคล็ดลับ

ประเด็นที่ Fralick นำเสนอนั้นเกี่ยวข้องกับทักษะที่ไม่ใช่เทคนิคที่งานนักวิทยาศาสตร์ด้านข้อมูลต้องการ นั่นคือเหตุผลที่รายการ KDnuggets รวมถึงสี่สิ่งเหล่านี้: ความอยากรู้ทางปัญญา, การทำงานเป็นทีม, ทักษะการสื่อสารและความเฉียบแหลมทางธุรกิจ Zhan ยังรวมถึงทักษะที่อ่อนนุ่มที่สำคัญในเคล็ดลับของเขาสำหรับนักวิทยาศาสตร์ข้อมูลระบุ "ทักษะการสื่อสาร" เช่น KDnuggets แต่ใช้ "ความเชี่ยวชาญด้านโดเมน" แทน "ความเฉียบแหลมทางธุรกิจ" สิ่งที่มันถูกเรียกมันหมายถึงการประยุกต์ใช้วิทยาศาสตร์ข้อมูล ธุรกิจ (หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับทักษะการสื่อสารโปรดดูความสำคัญของทักษะการสื่อสารสำหรับช่างเทคนิค)

Olivia Parr-Rud นำเสนอสปินของเธอเองเพิ่มทักษะที่อ่อนนุ่มอีกสองอย่างโดยเน้นถึงบทบาทของความคิดสร้างสรรค์พูดว่า“ ฉันคิดว่าวิทยาศาสตร์ข้อมูลเป็นศิลปะมากพอ ๆ กับวิทยาศาสตร์” สิ่งที่ต้องใช้การวาดบน จุดแข็งของสมองทั้งสองด้าน “ หลายคนพูดถึงวิทยาศาสตร์ข้อมูลเป็นอาชีพที่ใช้สมองซีกซ้ายเป็นหลัก ฉันพบว่าการประสบความสำเร็จนักวิทยาศาสตร์ด้านข้อมูลต้องใช้สมองทั้งหมด”

เธออธิบายว่าความก้าวหน้าในสาขานั้นไม่เพียง แต่ต้องมีความสามารถด้านเทคนิค แต่ยังมีความคิดสร้างสรรค์และวิสัยทัศน์ที่จำเป็นสำหรับการเป็นผู้นำ:

งานสมองซีกซ้าย / เชิงเส้นส่วนใหญ่สามารถทำงานแบบอัตโนมัติหรือเป็นงานที่ไม่เกี่ยวข้อง เพื่อให้ได้เปรียบในการแข่งขันในฐานะนักวิทยาศาสตร์ด้านข้อมูลเราจะต้องสามารถจดจำรูปแบบและสังเคราะห์ข้อมูลจำนวนมากโดยใช้สมองทั้งสองด้านของเรา และเราต้องเป็นนักคิดเชิงนวัตกรรม ผลลัพธ์ที่ดีที่สุดหลายอย่างเกิดจากการรวมกันของสมองซีกซ้ายและขวา

เธอยังเน้นว่าทำไมการสื่อสารวิสัยทัศน์อย่างชัดเจนจึงเป็นสิ่งจำเป็น:

ในฐานะนักวิทยาศาสตร์ด้านข้อมูลเป้าหมายของเราคือการใช้ข้อมูลเพื่อช่วยให้ลูกค้าของเราเติบโตกำไร ผู้บริหารส่วนใหญ่ไม่เข้าใจสิ่งที่เราทำหรือวิธีการที่เราทำ ดังนั้นเราต้องคิดเหมือนผู้นำและสื่อสารข้อค้นพบและคำแนะนำในภาษาที่ผู้มีส่วนได้เสียของเราเข้าใจและไว้วางใจ

โหลข้อมูล

เคล็ดลับที่สำคัญประกอบด้วยเครื่องมือทักษะและความสามารถทางเทคนิคจำนวนมากขึ้นรวมถึงคุณสมบัติเชิงปริมาณที่น้อยลงเช่นความถนัดในการสร้างสรรค์และความเป็นผู้นำ ท้ายที่สุดมันไม่ใช่แค่เกมตัวเลข เนื่องจากวิทยาศาสตร์ข้อมูลไม่เพียงเกี่ยวกับการสร้างแบบจำลองในสุญญากาศเท่านั้น แต่ยังมีแอพพลิเคชั่นที่ใช้งานได้จริงเพื่อแก้ไขปัญหาในชีวิตจริงสำหรับธุรกิจผู้ที่จะประสบความสำเร็จในสาขานี้ไม่เพียงต้องการเทคโนโลยีระดับสูงเท่านั้น สมาชิกต่าง ๆ ของทีมในที่ทำงาน