นักวิทยาศาสตร์ข้อมูล: ดาวหินดวงใหม่แห่งโลกเทค

ผู้เขียน: Robert Simon
วันที่สร้าง: 24 มิถุนายน 2021
วันที่อัปเดต: 1 กรกฎาคม 2024
Anonim
รอสเวลแห่งเมืองจีน China Roswell
วิดีโอ: รอสเวลแห่งเมืองจีน China Roswell

เนื้อหา


ที่มา: Onradio / iStockphoto

Takeaway:

บทบาทนักวิทยาศาสตร์ด้านข้อมูลกำลังกลายเป็นที่ต้องการอย่างรวดเร็วที่สุดในอาชีพด้านเทคโนโลยีของโลก เราถามนักวิทยาศาสตร์ด้านข้อมูล Jake Porway จาก The New York Times เกี่ยวกับวิธีที่เขาได้งานของเขาและเคล็ดลับของเขาสำหรับความสำเร็จในสาขานี้

บทบาทนักวิทยาศาสตร์ข้อมูลกำลังกลายเป็นอาชีพที่เป็นที่ต้องการมากที่สุดในโลกของเทคโนโลยีอย่างรวดเร็ว บริษัท อย่าง Google, Amazon และ LinkedIn กำลังใช้นักวิทยาศาสตร์ด้านข้อมูลเพื่อช่วยให้พวกเขาสามารถรักษาความได้เปรียบด้านนวัตกรรมในยุคข้อมูลดิจิทัล และตอนนี้ผู้ที่ชื่นชอบข้อมูลและเทคโนโลยีต่างก็ต้องการที่จะเป็นนักวิทยาศาสตร์ด้านข้อมูลเช่นเดียวกับที่นักดนตรีบางคนปรารถนาที่จะเป็นร็อคสตาร์ บางทีนั่นอาจเป็นเหตุผลที่บางคนอ้างถึงนักวิทยาศาสตร์ด้านข้อมูลว่าเป็นดาวร็อคใหม่ของยุคเทคโนโลยี

น่าเสียดายที่บทบาทนี้ยังใหม่อยู่เรื่อย ๆ ซึ่งยังคงมีระดับความสับสนอยู่ซึ่งหมายความว่านักวิทยาศาสตร์ด้านข้อมูลหลายคนกำลังขับรถทัวร์ไปตามถนนที่ผิด นักวิทยาศาสตร์ด้านข้อมูลสมควรได้รับชื่อเสียงจาก Rock Star หรือไม่? เราดำดิ่งสู่โลกของวิทยาศาสตร์ข้อมูลด้วยการสัมภาษณ์กับ Jake Porway นักวิทยาศาสตร์ด้านข้อมูลจากห้องปฏิบัติการวิจัยและพัฒนาที่ The New York Times


นักวิทยาศาสตร์ด้านข้อมูล: Techs Rock Stars?

เหตุใดนักวิทยาศาสตร์ด้านข้อมูลจึงถูกเรียกว่าดาวหินดวงใหม่ของโลกเทคโนโลยี การเปรียบเทียบนี้จะไปลึกกว่าความต้องการข้อมูลที่ต้องการเสียง ultracool อาชีพนักวิทยาศาสตร์ด้านข้อมูลเช่นเดียวกับร็อคสตาร์รวมถึงความหลากหลายอิสรภาพทางศิลปะและการปรับตัว และเช่นเดียวกับดาราร็อคของโลกแห่งความบันเทิงนักวิทยาศาสตร์ด้านข้อมูลที่ดีที่สุดมักจะได้รับการติดตามจากผู้คนจากทุกอุตสาหกรรมข้อมูลและเทคโนโลยี

นักวิทยาศาสตร์ข้อมูลทำอะไรที่แตกต่างกันมาก เช่นเดียวกับนักดนตรีที่ใช้เครื่องดนตรีเครื่องมือและเทคนิคที่แตกต่างกันในการเล่นดนตรีสไตล์ที่แตกต่างจากแจ๊สและโลหะตายนักวิทยาศาสตร์ด้านข้อมูลก็เชี่ยวชาญในเครื่องมือและฟิลด์เฉพาะ มีสไตล์ที่เกี่ยวข้องเช่นกัน และไม่มีวิธีที่ถูกหรือผิดในการทำงานอย่างใดอย่างหนึ่ง - มันเกี่ยวกับผลกระทบที่งานมีต่อผู้อื่น

เมื่อเดอะบีทเทิลส์แต่งเพลงไม่มีคนเพียงคนเดียวที่บอกว่าจะเล่นโน้ตทุกอันในเครื่องดนตรีทุกชิ้นอย่างไร พวกเขามารวมกันและติดขัด ผ่านการค้นพบที่สร้างสรรค์พวกเขาพบเพลงที่ใช้งานได้ มันเหมือนกันสำหรับนักวิทยาศาสตร์ข้อมูล พวกเขาจะต้องรู้สึกถึงจังหวะเข้ามาในร่องและประสานทางออก สิ่งนี้เป็นไปได้ด้วยอิสรภาพในเชิงศิลปะที่ถูกต้องเท่านั้นที่จะลองใช้วิธีการเครื่องมือและเทคนิคใด ๆ ก็ตามที่อาจเกิดขึ้นในใจในขณะนี้ - และความคล่องตัวในการเปลี่ยนแปลงเมื่อสิ่งที่ดูเหมือนไม่สำคัญ


เมื่อนักวิทยาศาสตร์ด้านข้อมูลเชี่ยวชาญพื้นฐานที่สำคัญเขาหรือเธอจะสามารถปรับตัวได้และเพิ่มความมั่นใจในการจัดหาโซลูชั่นในด้านอื่น ๆ เราพูดถึงพื้นฐานที่สำคัญเหล่านี้ในภายหลัง จุดที่ทำให้ที่นี่คือเมื่อคุณหลักวิทยาศาสตร์ข้อมูลคุณสามารถใช้บทบาทกับสาขาใด ๆ ที่คุณต้องการเพราะข้อมูลมีอยู่ทุกที่

เป้าหมายสูงสุดของนักวิทยาศาสตร์ด้านข้อมูลคือการสร้างมูลค่ามหาศาลสำหรับคนจำนวนมากที่สุดเท่าที่จะเป็นไปได้ ในขณะที่นักวิทยาศาสตร์ด้านข้อมูลทำงานอยู่เบื้องหลังมันไม่ต่างกับการเล่นกับผู้ชมจำนวนมาก: ยิ่งคุณทำงานได้ดีเท่าไรคุณก็ยิ่งเข้าถึงผู้คนมากขึ้นเท่านั้นและยิ่งได้รับผลตอบแทนมากเท่าไหร่

นักวิทยาศาสตร์ข้อมูลทำอะไร

ดังนั้นนักวิทยาศาสตร์ข้อมูลทำอะไรกันแน่ ให้ผ่านสิ่งนี้ไปด้วยตัวอย่างที่เราทุกคนอาจเกี่ยวข้องกัน

ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

ให้บอกว่าคุณรู้ตัวอยู่วันหนึ่งว่าคุณไม่มีพลังงานเท่ากันในวันที่คุณเคยทำ ดังนั้นคุณจึงตั้งเป้าหมายว่าจะมีพลังงานมากขึ้นในระหว่างวัน ตอนนี้มันเป็นเป้าหมายที่กว้างและคลุมเครือ ดังนั้นขั้นตอนแรกในฐานะนักวิทยาศาสตร์ด้านข้อมูลคือการลบความคลุมเครือบางส่วนและวัดปริมาณความสามารถในการวัดเป้าหมายได้ มีวิธีการนี้ เราจะไม่เข้าไปดูรายละเอียดที่นี่ แต่ให้บอกว่าคุณตั้งทฤษฎีว่าคุณไม่ได้นอนหลับเพียงพอและให้เป้าหมายย่อยในการนอนหลับแปดชั่วโมงในแต่ละคืน

แม้ว่าเป้าหมายนี้จะวัดได้มากกว่าและคลุมเครือน้อยกว่า แต่ก็มีความท้าทายของตัวเอง คุณไม่สามารถเริ่มจับเวลาได้เมื่อคุณหลับและแม้ว่าคุณจะเริ่มจับเวลาหลังจากที่คุณกระโดดเข้านอนคุณอาจไม่หลับทันที นอกจากนี้มันยากที่จะบัญชีสำหรับเวลาที่คุณตื่นขึ้นมากลางดึก ในที่สุดก็มีประเภทของการนอนหลับที่แตกต่างกันเช่นการนอนหลับลึกและการนอนหลับเบา บรรทัดล่างคือมันยากที่จะวัดการนอนหลับที่ถูกต้องและดังนั้นจึงยากยิ่งขึ้นในการวัดผลกระทบต่อระดับพลังงานของคุณ

แล้วคุณจะทำอย่างไร ในฐานะนักวิทยาศาสตร์ข้อมูลคุณต้องหาเทคโนโลยีล่าสุดและพบว่ามีอุปกรณ์ตรวจสอบการนอนหลับและถ้าคุณใช้อุปกรณ์ดังกล่าวในการวัดและบันทึกการนอนของคุณคุณจะสามารถรับข้อมูลที่แม่นยำมากขึ้นเกี่ยวกับการนอนของคุณและรวบรวมข้อมูลนั้นเมื่อเวลาผ่านไปเพื่อทำกราฟ

เพียงอย่างเดียวนี้จะช่วยให้คุณเข้าใจถึงสิ่งที่เกิดขึ้น การนำเสนอด้วยภาพจะทำให้คุณตระหนักถึงความชัดเจนและทิศทาง คุณจะสามารถดูว่าคุณบรรลุเป้าหมายการนอนหลับ 8 ชั่วโมงต่อคืนหรือไม่และที่สำคัญคุณสามารถลงมือปฏิบัติหากคุณไม่ได้นอน

นี่เป็นงานพื้นฐานของนักวิทยาศาสตร์ด้านข้อมูล: เพื่อนำวิธีการใหม่ในการวัดและแสดงข้อมูลเพื่อให้มีการรับรู้ความชัดเจนและทิศทางที่มากขึ้นสำหรับผู้ที่มองมัน

แต่นักวิทยาศาสตร์ด้านข้อมูลที่ดีไม่ได้หยุดอยู่แค่นั้น เมื่อรวบรวมข้อมูลแล้วจะสามารถรวมเข้ากับกิจกรรมที่วัดได้อื่น ๆ ที่คุณทำตลอดทั้งวัน รวมเข้ากับผลผลิตของคุณตามข้อมูลจากระบบการจัดการงานของคุณ ผสานรวมเข้ากับอารมณ์ของคุณโดยอิงจากทวีตและการอัปเดตสถานะ บูรณาการกับสุขภาพของคุณขึ้นอยู่กับการเข้าชมโรงยิมหรือการลดน้ำหนัก ด้วยปริมาณของข้อมูลที่มีอยู่แล้วและความสะดวกในการบันทึกข้อมูลความเป็นไปได้ไม่มีที่สิ้นสุด

วิธีการเป็นนักวิทยาศาสตร์ข้อมูล

สนใจอาชีพด้านวิทยาศาสตร์ข้อมูลหรือไม่? เนื่องจากวิทยาศาสตร์ข้อมูลเป็นเรื่องใหม่เราจึงขอให้นักวิทยาศาสตร์ด้านข้อมูลเพื่อความเข้าใจด้านนี้ Jake Porway เป็นนักวิทยาศาสตร์ด้านข้อมูลที่ The New York Times และเป็นผู้ก่อตั้ง DataKind (ซึ่งรู้จักกันในชื่อ Data Without Borders) ซึ่งตรงกับองค์กรไม่แสวงหาผลกำไรที่ต้องการวิทยาการข้อมูลกับนักวิทยาศาสตร์ด้านข้อมูลอิสระและมืออาชีพด้าน Bono Porway มีพื้นหลังวิทยาศาสตร์คอมพิวเตอร์และปริญญาเอก ในสถิติจาก UCLA นี่คือสิ่งที่เขาพูดเกี่ยวกับการเข้าสู่วิทยาศาสตร์ข้อมูลวิธีการทำงานได้ดีและวิธีหลีกเลี่ยงข้อผิดพลาดที่สำคัญในสาขา

1. รับทักษะที่ถูกต้อง

จากข้อมูลของ Porway การเข้าไปในสนามทำให้สิ่งสำคัญสามอย่าง:

  • ทักษะการใช้คอมพิวเตอร์ในทางปฏิบัติ
  • ทักษะทางสถิติ
  • ความปรารถนาที่จะเรียนรู้

“ คุณต้องสามารถเขียนสคริปต์เพื่อขูดข้อมูลรวมทั้งเขียนอัลกอริธึมที่คุณคิดไว้ในหัวของคุณได้” Porway กล่าว "คุณควรทราบสถิติพื้นฐานของคุณ (และอื่น ๆ เป็นอย่างดี) หากคุณสามารถประเมินได้ว่าแบบจำลองที่คุณกำลังสร้างหรืออัลกอริทึมที่คุณเขียนกำลังทำสิ่งที่คุณต้องการหรือไม่"

2. ทำการเชื่อมต่อ

ก่อนที่จะเข้าร่วมในห้องวิจัยและพัฒนา R&D ของ New York Times Porway ทำงานด้านการเรียนรู้ด้วยเครื่องและการมองเห็นคอมพิวเตอร์และใช้เวลามากในการหาหุ่นยนต์เพื่อระบุกับระเบิดและบินเครื่องบิน ที่?) มันไม่ได้จนกว่าเขาจะลงที่ The New York Times ว่าเขาจะต้องขยายไปสู่งานด้านวิทยาศาสตร์ข้อมูลที่กว้างขึ้นนั่นคือ Project Cascade ซึ่งติดตามการเชื่อมโยงจากการตีพิมพ์ผ่านโซเชียลมีเดีย

สิ่งที่สำคัญที่สุดที่ต้องลงสนาม Porway กล่าวคือต้องเรียนรู้

"เข้าสู่โครงการวิทยาศาสตร์ข้อมูล!" Porway กล่าว "ดาวน์โหลดข้อมูลหยิบ R ขึ้นมาแล้วเริ่มเล่น ... Id บอกว่าจะให้ความสำคัญกับการใช้ R ควบคู่ไปกับหนังสือสถิติพื้นฐานเพื่อแนะนำคุณในการสำรวจข้อมูลบางอย่างทักษะการเรียนรู้และการคำนวณของเครื่องจะมาพร้อมกับสิ่งนั้น หลักสูตรนี้ขึ้นอยู่กับประสบการณ์ที่ผ่านมาของคุณ - หากคุณเป็นนักสถิติอยู่แล้วให้ไปรับ Python สักอัน!) "

จากนั้นถึงเวลาที่จะทำการเชื่อมต่อบางอย่าง Porway แนะนำกลุ่มพบปะสังสรรค์ในท้องถิ่น - เนื่องจากการเป็นส่วนหนึ่งของชุมชนวิทยาศาสตร์ข้อมูลคือ "วิธีที่เร็วที่สุดที่จะรู้ว่าคุณไม่รู้อะไร" และในสาขาที่มีการพัฒนาอยู่ตลอดเวลานั่นสำคัญ

3. เข้าสู่เกม

Porway มีปริญญาเอก ในสถิติจาก UCLA แต่เขาเน้นว่าคุณไม่จำเป็นต้องใช้เพื่อทำงานที่ดี

“ มันอาจช่วยได้ แต่อย่าคิดว่าคุณต้องออกไปข้างนอกและทำอีกห้าปีของโรงเรียนเพื่อให้สามารถเรียกตัวคุณเองว่าเป็นนักวิทยาศาสตร์ด้านข้อมูลได้” Porway กล่าว

วิทยาศาสตร์ข้อมูลเป็นสาขาที่ค่อนข้างใหม่ ซึ่งหมายความว่าผู้ที่ต้องการลงสนามต้องเข้าหาด้วยใจที่เปิดกว้าง

“ นักวิทยาศาสตร์ด้านข้อมูลที่ Foursquare จะดูแตกต่างจากนักวิทยาศาสตร์ด้านข้อมูลที่ Goldman Sachs มาก” Porway กล่าว

4. โยกบทบาทใหม่ของคุณ

วิทยาศาสตร์ข้อมูลเป็นเรื่องเกี่ยวกับการทำให้เป้าหมายชัดเจนขึ้นตรวจสอบสมมติฐานประเมินหลักฐานและประเมินข้อสรุป แต่มีปริศนาชิ้นเล็ก ๆ ชิ้นหนึ่งที่หลายคนมองข้าม คุณสามารถคาดเดาว่ามันคืออะไร? ตามข้อมูลของ Porway ส่วนประกอบลับคือการคิดเชิงวิพากษ์

"มันแยกแฮ็กเกอร์ออกจากนักวิทยาศาสตร์ตัวจริงสำหรับฉัน" Porway กล่าว "คุณต้องประหลาดใจกับจำนวนครั้งที่ฉันเคยเห็นใครบางคนสร้างแบบจำลองและรายงานผลลัพธ์โดยไม่ทราบว่าพวกเขาไม่ได้คิดเชิงวิเคราะห์ว่าข้อมูลมาจากที่ใดหรือมาจากการออกแบบของพวกเขาถูกต้องหรือไม่ ของกระบวนการของคุณและทุกหมายเลขที่คุณคิดขึ้นมา "

ถนนสู่ข้อมูลขนาดใหญ่

Porway กล่าวว่าเมื่อเขาตระหนักถึงความสามารถในการใช้ข้อมูลจำนวนมหาศาลเพื่อให้เครื่องจักรสอนตนเองมันทำให้เขารู้สึก ความหลงใหล - และการศึกษาและทักษะของเขา - ที่ช่วยให้เขาเป็นผู้นำในด้านวิทยาศาสตร์ข้อมูล หากคุณต้องการโยกย้ายข้อมูลขนาดใหญ่ให้หาหนังสือเล่มหนึ่งดาวน์โหลดข้อมูลและเริ่มเล่น คุณไม่เคยรู้เลยว่าข้อมูลดิบที่กองหน้าจะเปิดขึ้น

สำหรับบทสัมภาษณ์เต็มรูปแบบให้ไปที่ DataScientists.Net