Apache Pig

ผู้เขียน: Robert Simon
วันที่สร้าง: 16 มิถุนายน 2021
วันที่อัปเดต: 13 พฤษภาคม 2024
Anonim
Hadoop Pig Tutorial | What is Pig In Hadoop? | Hadoop Tutorial For Beginners | Simplilearn
วิดีโอ: Hadoop Pig Tutorial | What is Pig In Hadoop? | Hadoop Tutorial For Beginners | Simplilearn

เนื้อหา

คำจำกัดความ - Apache Pig แปลว่าอะไร?

Apache Pig เป็นแพลตฟอร์มที่ใช้ในการวิเคราะห์ชุดข้อมูลขนาดใหญ่ ประกอบด้วยภาษาระดับสูงเพื่อแสดงโปรแกรมวิเคราะห์ข้อมูลพร้อมกับโครงสร้างพื้นฐานเพื่อประเมินโปรแกรมเหล่านี้ หนึ่งในคุณสมบัติที่สำคัญที่สุดของ Pig คือโครงสร้างของมันตอบสนองต่อการขนานอย่างมีนัยสำคัญ


Pig ทำงานบนแพลตฟอร์ม Hadoop เขียนข้อมูลและอ่านข้อมูลจาก Hadoop Distributed File System (HDFS) และดำเนินการประมวลผลด้วยงาน MapReduce หนึ่งงานหรือมากกว่า Apache Pig มีให้ในรูปแบบโอเพ่นซอร์ส

Apache Pig เป็นที่รู้จักกันในชื่อ Pig Programming Language หรือ Hadoop Pig

ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณในการโยกย้ายและดำเนินธุรกิจจากคลาวด์อย่างไร

Techopedia อธิบาย Apache Pig

Apache Pig มีสองส่วนคือ Pig language language และ Pig engine ภาษา Pig Latin เป็นภาษาสคริปต์ที่อนุญาตให้ผู้ใช้แสดงวิธีการไหลของข้อมูลจากอินพุตหนึ่งอินพุตหรือมากกว่าต้องถูกอ่านและประมวลผลและตำแหน่งที่ต้องเก็บไว้

คุณสมบัติหลักบางประการของ Pig Latin มีดังนี้:

  • ง่ายต่อการเขียนโปรแกรม: งานที่สลับซับซ้อนซึ่งประกอบด้วยการแปลงข้อมูลที่เชื่อมต่อกันหลายอย่างจะถูกเข้ารหัสอย่างชัดเจนว่าเป็นลำดับการไหลของข้อมูล ทำให้ง่ายต่อการเขียนทำความเข้าใจและบำรุงรักษา
  • ความเป็นไปได้ในการปรับให้เหมาะสม: วิธีการเข้ารหัสงานช่วยให้ระบบปรับการดำเนินการอัตโนมัติให้เหมาะสม สิ่งนี้ช่วยให้ผู้ใช้ใส่ใจกับซีแมนทิกส์แทนประสิทธิภาพ
  • ความสามารถในการขยาย: ผู้ใช้ได้รับอนุญาตให้สร้างฟังก์ชั่นของตัวเองสำหรับการดำเนินการตามวัตถุประสงค์พิเศษ เอ็นจิ้น Pig มีหน้าที่ในการประมวลผลการไหลของข้อมูลที่เขียนใน Pig Latin เหมือนกับการออกแบบระบบการจัดการฐานข้อมูลเชิงสัมพันธ์มาตรฐาน (RDBMS) Apache Pig ประกอบด้วยตัวแยกวิเคราะห์ตัวเพิ่มประสิทธิภาพและตัวตรวจสอบชนิดนอกเหนือจากตัวดำเนินการที่ดำเนินการประมวลผลข้อมูล Pig ไม่มีการทำธุรกรรมแคตาล็อกข้อมูลหรือความสามารถในการจัดการกับการจัดเก็บข้อมูลโดยตรงหรือใช้กรอบการดำเนินการ