วิทยาศาสตร์ข้อมูลหรือการเรียนรู้ของเครื่อง? นี่คือวิธีการสังเกตเห็นความแตกต่าง

ผู้เขียน: Laura McKinney
วันที่สร้าง: 3 เมษายน 2021
วันที่อัปเดต: 1 กรกฎาคม 2024
Anonim
EP2 : คณิตวันละนิด "Pnr กับ Cnr ใช้ต่างยังไง (ข้อสงสัยยอดฮิต)" By พี่ปั้น SmartMathPro
วิดีโอ: EP2 : คณิตวันละนิด "Pnr กับ Cnr ใช้ต่างยังไง (ข้อสงสัยยอดฮิต)" By พี่ปั้น SmartMathPro

เนื้อหา


ที่มา: Elnur / Dreamstime.com

Takeaway:

วิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องนั้นแตกต่างกันในวิธีการที่สำคัญ ในบางวิธีเราสามารถมองได้ว่าเป็นเซตย่อยของอีกอัน ทั้งสองมีความสำคัญในความก้าวหน้าด้านไอทีในปัจจุบัน

ในโลกใหม่ของปัญญาประดิษฐ์และการจัดการข้อมูลมันเป็นเรื่องง่ายที่จะสับสนโดยคำศัพท์บางคำที่ใช้บ่อยที่สุดในโลกไอที

ตัวอย่างเช่นวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องมีส่วนเกี่ยวข้องกับกันและกัน ไม่น่าแปลกใจที่คนจำนวนมากที่มีเพียงความรู้ที่ผ่านไปในสาขาวิชาเหล่านี้จะมีปัญหาในการหาวิธีที่พวกเขาแตกต่างจากคนอื่น

นี่คือวิธีที่ดีที่สุดในการแยกวิทยาศาสตร์ข้อมูลออกจากการเรียนรู้ของเครื่องเป็นหลักการและวิธีการทางเทคโนโลยี

วิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่อง: คำศัพท์กว้างและแคบ

ประการแรกวิทยาศาสตร์ข้อมูลเป็นกลุ่มเทคโนโลยีที่กว้างขวางและครอบคลุมซึ่งครอบคลุมโครงการและการสร้างสรรค์หลายประเภท (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับงานที่เกี่ยวข้องกับงานวิทยาศาสตร์ข้อมูลดูที่บทบาทหน้าที่: นักวิทยาศาสตร์ข้อมูล)


วิทยาศาสตร์ข้อมูลเป็นหลักปฏิบัติของการทำงานกับข้อมูลขนาดใหญ่ มันปรากฏว่าเป็นกฎของมัวร์และการเพิ่มจำนวนของอุปกรณ์จัดเก็บข้อมูลที่มีประสิทธิภาพมากขึ้นทำให้ บริษัท และบุคคลอื่น ๆ ได้รับข้อมูลจำนวนมหาศาล จากนั้นแพลตฟอร์มข้อมูลขนาดใหญ่และเครื่องมือเช่น Hadoop เริ่มนิยามใหม่การคำนวณโดยการเปลี่ยนวิธีการจัดการข้อมูล ขณะนี้ด้วยระบบคลาวด์และการบรรจุตู้คอนเทนเนอร์รวมถึงโมเดลใหม่ล่าสุดข้อมูลขนาดใหญ่ได้กลายเป็นตัวขับเคลื่อนหลักของวิธีการทำงานและใช้ชีวิตของเรา

ในรูปแบบที่ง่ายที่สุดวิทยาศาสตร์ข้อมูลเป็นวิธีที่เราจัดการข้อมูลนั้นจากการทำความสะอาดและการปรับแต่งให้เป็นข้อมูลเชิงลึก

คำจำกัดความของการเรียนรู้ของเครื่องนั้นแคบกว่ามาก ในการเรียนรู้ของเครื่องจักรเทคโนโลยีจะใช้ข้อมูลและผ่านอัลกอริธึมเพื่อจำลองกระบวนการรับรู้ของมนุษย์ที่อธิบายว่า“ การเรียนรู้” กล่าวอีกนัยหนึ่งคือเมื่อนำข้อมูลไปใช้และฝึกอบรมในคอมพิวเตอร์ ที่เทคโนโลยีดูเหมือนว่าจะได้เรียนรู้จากกระบวนการที่โปรแกรมเมอร์วางไว้

ชุดทักษะการเรียนรู้วิทยาศาสตร์ข้อมูลและเครื่องจักร

อีกวิธีหนึ่งในการเปรียบเทียบวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องจักรคือการดูทักษะต่าง ๆ ที่มีค่าที่สุดสำหรับมืออาชีพในสาขาใดสาขาหนึ่งเหล่านี้


ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

มีมติทั่วไปที่นักวิทยาศาสตร์ด้านข้อมูลได้รับประโยชน์จากทักษะการวิเคราะห์เชิงลึกและคณิตศาสตร์ประสบการณ์ตรงกับเทคโนโลยีฐานข้อมูลและความรู้ภาษาโปรแกรมเช่น Python หรือแพ็คเกจอื่น ๆ ที่ใช้สำหรับการแยกวิเคราะห์ข้อมูลขนาดใหญ่

“ ใครก็ตามที่สนใจในการสร้างอาชีพที่แข็งแกร่งใน (วิทยาศาสตร์ข้อมูล) ควรได้รับทักษะที่สำคัญในสามแผนก: การวิเคราะห์การเขียนโปรแกรมและความรู้เกี่ยวกับโดเมน” Srihari Sasikumar เขียนที่ Simplilearn เขียน “ การลึกลงไปหนึ่งระดับทักษะต่อไปนี้จะช่วยให้คุณสามารถสร้างโพรงในฐานะนักวิทยาศาสตร์ด้านข้อมูล: มีความรู้อย่างมากเกี่ยวกับ Python, SAS, R (และ) Scala ประสบการณ์ตรงในการเข้ารหัสฐานข้อมูล SQL ความสามารถในการทำงานกับข้อมูลที่ไม่มีโครงสร้างจาก แหล่งข้อมูลต่าง ๆ เช่นวิดีโอและโซเชียลมีเดียเข้าใจฟังก์ชั่นการวิเคราะห์ที่หลากหลาย (และ) ความรู้เกี่ยวกับการเรียนรู้ของเครื่อง”

ในด้านการเรียนรู้ของเครื่องผู้เชี่ยวชาญมักจะอ้างถึงทักษะการสร้างแบบจำลองข้อมูลความน่าจะเป็นและความรู้ด้านสถิติและทักษะการเขียนโปรแกรมที่กว้างขึ้นเป็นเครื่องมือที่มีประโยชน์ในชุดเครื่องมือของวิศวกรการเรียนรู้ของเครื่อง

วิธีการสังเกตการเรียนรู้ของเครื่อง

กุญแจสำคัญคือทุกสิ่งประกอบด้วยงานด้านวิทยาศาสตร์ข้อมูล แต่มันไม่ได้เรียนรู้ด้วยเครื่องจักรเว้นแต่ว่าคุณจะมีระบบการปกครองที่เข้มงวดมาก ๆ เพื่อช่วยให้คอมพิวเตอร์เรียนรู้จากอินพุต

เมื่ออยู่ในสถานที่มันทำสำหรับระบบที่มีความสามารถที่น่าประหลาดใจบางอย่างที่สามารถมีผลกระทบมากมายในชีวิตของเรา

“ สิ่งที่เราทำเกี่ยวกับการเรียนรู้ของเครื่องเกิดขึ้นใต้พื้นผิว” Jeff Bezos ผู้ก่อตั้ง Amazon กล่าวว่ามีรายงานว่าชี้ให้เห็นถึงการใช้งานบางอย่างของระบบประเภทนี้ “ การเรียนรู้ของเครื่องจักรทำให้อัลกอริทึมของเราสำหรับการพยากรณ์ความต้องการการจัดอันดับการค้นหาผลิตภัณฑ์คำแนะนำผลิตภัณฑ์และข้อเสนอตำแหน่งการขายสินค้าการตรวจจับการฉ้อโกงการแปลและอื่น ๆ อีกมากมาย แม้ว่าจะมองเห็นได้น้อยลงผลกระทบจากการเรียนรู้ของเครื่องส่วนใหญ่จะเป็นแบบนี้ - เงียบ ๆ แต่มีความหมายในการปรับปรุงการทำงานของแกนหลัก "

หนึ่งในตัวอย่างที่มีประโยชน์ที่สุดที่นี่คือการเกิดขึ้นของเครือข่ายประสาทเทียม - เป็นวิธีการทั่วไปและเป็นที่นิยมในการตั้งค่ากระบวนการเรียนรู้ของเครื่อง

ในรูปแบบพื้นฐานที่สุดโครงข่ายประสาทประกอบด้วยชั้นของเซลล์ประสาทเทียม แต่ละเซลล์ประสาทเทียมมีหน้าที่การทำงานเทียบเท่ากับเซลล์ประสาทชีวภาพ - แต่แทนที่จะซิงก์และ dendrites มันมีอินพุตฟังก์ชั่นการเปิดใช้งานและเอาท์พุทในที่สุด

เครือข่ายนิวรัลถูกสร้างขึ้นเพื่อทำหน้าที่เหมือนสมองมนุษย์และผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่องมักใช้โมเดลนี้เพื่อสร้างผลลัพธ์การเรียนรู้ของเครื่อง

อย่างไรก็ตามนั่นไม่ใช่วิธีเดียวในการเรียนรู้ของเครื่อง โครงการการเรียนรู้ของเครื่องพื้นฐานเพิ่มเติมบางอย่างเพียงแสดงคอมพิวเตอร์ที่มีรูปถ่ายที่หลากหลาย (หรือจัดหาให้กับข้อมูลดิบอื่น ๆ ) ป้อนความคิดผ่านกระบวนการของการใช้การเรียนรู้ของเครื่องภายใต้การดูแลและข้อมูลฉลากและคอมพิวเตอร์สามารถแยกแยะระหว่าง รูปร่างหรือรายการต่าง ๆ ในเขตข้อมูลที่มองเห็น (สำหรับข้อมูลเบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่องตรวจสอบการเรียนรู้ของเครื่อง 101)

สองสาขาวิชาที่ทันสมัย

สรุปแล้วการเรียนรู้ของเครื่องเป็นส่วนที่มีค่าของวิทยาศาสตร์ข้อมูล แต่วิทยาศาสตร์ข้อมูลแสดงถึงขอบเขตที่กว้างใหญ่และการเรียนรู้ด้วยคอมพิวเตอร์ที่เกิดขึ้น

คุณสามารถพูดได้ว่าการเรียนรู้ของเครื่องจะไม่เกิดขึ้นหากไม่มีข้อมูลขนาดใหญ่ ข้อมูลขนาดใหญ่นั้นไม่ได้สร้างการเรียนรู้ของเครื่อง แต่ - หลังจากที่เราได้รวบรวมข้อมูลจำนวนมากจนเราแทบไม่รู้ว่าจะทำอย่างไรกับมันจิตใจชั้นยอดเกิดขึ้นกับกระบวนการจำลองทางชีวภาพเหล่านี้เป็นวิธีที่เร็วมาก ของการให้ข้อมูลเชิงลึก

สิ่งที่ควรทราบอีกประการหนึ่งคือวิทยาศาสตร์ข้อมูลสามารถนำไปใช้ได้สองวิธีใหญ่ ๆ คือเราสามารถใช้การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ทำให้คอมพิวเตอร์คิดสำหรับเราหรือเราสามารถนำวิทยาศาสตร์ข้อมูลกลับมาเป็นแนวทางที่เป็นมนุษย์มากกว่า คอมพิวเตอร์นำเสนอผลลัพธ์เพียงอย่างเดียวและเมื่อเราเป็นผู้ตัดสินใจ

นั่นคือการนำผู้เชี่ยวชาญบางคนรวมถึงนักประดิษฐ์ชั้นนำของวันนี้เพื่อเรียกร้องให้มีการบัญชีที่มีชีวิตชีวามากขึ้นเกี่ยวกับวิธีการที่เราใช้เทคโนโลยีเหล่านี้

"(AI) มีความสามารถมากกว่าที่ใคร ๆ ก็รู้อย่างมากมายและอัตราการพัฒนานั้นเพิ่มขึ้นอย่างมาก" Elon Musk ได้รับการกล่าวอ้างขณะที่เตือนว่าการเรียนรู้ของเครื่องและโปรแกรม AI ต้องมีการดูแล

ไม่ว่าในกรณีใดวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องเป็นส่วนสำคัญของความก้าวหน้าที่เราเป็นสังคมกำลังทำในเทคโนโลยีวันนี้