ฐานข้อมูลกราฟ: วิธีคิดใหม่เกี่ยวกับข้อมูล

ผู้เขียน: Louise Ward
วันที่สร้าง: 5 กุมภาพันธ์ 2021
วันที่อัปเดต: 28 มิถุนายน 2024
Anonim
เทคนิคทำกราฟและPivot จากฐานข้อมูลจำนวนมาก
วิดีโอ: เทคนิคทำกราฟและPivot จากฐานข้อมูลจำนวนมาก

เนื้อหา


ที่มา: Blueximages / Dreamstime.com

Takeaway:

มีการใช้ฐานข้อมูลกราฟในหลายอุตสาหกรรมเพื่อให้สามารถวิเคราะห์ความสัมพันธ์ระหว่างข้อมูล

ความสำคัญของข้อมูลขนาดใหญ่มีมากขึ้นเรื่อย ๆ อย่างไรก็ตามเพื่อให้ได้ประโยชน์สูงสุดจากข้อมูล บริษัท ต้องสามารถค้นหาข้อมูลเชิงลึกที่สามารถนำไปใช้ได้จริง ในการค้นหาข้อมูลเชิงลึกที่มีประสิทธิภาพจำเป็นต้องมีทั้งข้อความค้นหาที่ลึกและการวิเคราะห์ที่ดีสำหรับข้อมูลที่ส่งคืน เคียวรี SQL แบบดั้งเดิมเผชิญกับข้อ จำกัด เมื่อกล่าวถึงคิวรีที่ซับซ้อนและหลายชั้นและ จำกัด เป้าหมายของ บริษัท ในการเรียกข้อมูลที่มีความหมาย

ฐานข้อมูลกราฟช่วยให้ บริษัท ต่างๆสามารถเปิดใช้งานแบบสอบถามที่ซับซ้อนและหลายชั้นซึ่งสามารถตอบได้ทันทีในขณะที่ฐานข้อมูล SQL แบบดั้งเดิมจะพบว่าเป็นเรื่องยากมากที่จะตอบแบบสอบถามดังกล่าว ข้อความค้นหาที่ซับซ้อนกำลังส่งคืนข้อมูลเชิงลึกที่ไม่เคยมีมาก่อนและมีคุณค่า มีการใช้ฐานข้อมูลกราฟในหลายอุตสาหกรรมเช่นโซเชียลมีเดียการดูแลสุขภาพและการหาคู่ออนไลน์ ดูเหมือนว่าฐานข้อมูลกราฟกำลังให้วิธีการใหม่ในการค้นหาข้อมูล

ฐานข้อมูลกราฟคืออะไร?

ฐานข้อมูลกราฟใช้เพื่อจัดเก็บข้อมูลเกี่ยวกับเอนทิตีที่แตกต่างกันความสัมพันธ์แผนที่ข้ามเอนทิตีและความสัมพันธ์แบบสอบถามระหว่างเอนทิตี ในการต่อต้านนี้หน่วยงานอาจมีหลายสิ่งหลายอย่างเช่นมนุษย์ บริษัท สัตว์และรถยนต์ เอนทิตีสามารถมีความสัมพันธ์เฉพาะกับเอนทิตีอื่น ตัวอย่างเช่น Martin ซึ่งเป็นเอนทิตีเป็นเพื่อนของ Jim ซึ่งเป็นเอนทิตีอื่น Martin สามารถเป็นเจ้าของรถยนต์ BMW ได้ ในทั้งสองตัวอย่าง Martin, Jim และ BMW เป็นนิติบุคคลที่มีความสัมพันธ์เฉพาะระหว่างพวกเขา "มาร์ตินเป็นเพื่อนของจิม" หมายถึงมิตรภาพคือความสัมพันธ์ระหว่างสองหน่วยงาน ในทำนองเดียวกัน "มาร์ตินเป็นเจ้าของ BMW" หมายความว่าการเป็นเจ้าของคือความสัมพันธ์ระหว่างมาร์ตินกับ BMW ของเขา ในสำนวนฐานข้อมูลกราฟความสัมพันธ์เป็นที่รู้จักกันเป็นขอบ ความสัมพันธ์จะแสดงในรูปแบบของกราฟและด้วยเหตุนี้แนวคิดนี้เรียกว่าฐานข้อมูลกราฟ (หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับฐานข้อมูลกราฟดูที่ฐานข้อมูลกราฟนำระบบเครือข่ายมาสู่ข้อมูลได้อย่างไร)


แนวคิดของฐานข้อมูลกราฟกำลังถูกนำไปใช้ในอุตสาหกรรมต่างๆเช่นการดูแลสุขภาพสื่อสังคมออนไลน์และอีคอมเมิร์ซ ตัวอย่างที่ให้ไว้ก่อนหน้าในบทความนี้นั้นเรียบง่ายและตรงไปตรงมา แต่กรณีการใช้งานที่นำมาใช้ในอุตสาหกรรมนั้นมีความซับซ้อนสูง นำตัวอย่างของเว็บไซต์อีคอมเมิร์ซที่ให้คำแนะนำแก่ลูกค้า เว็บไซต์ให้คำแนะนำผลิตภัณฑ์ที่เหมาะสำหรับลูกค้าอย่างไร เว็บไซต์ทราบความต้องการและความชอบของลูกค้าอย่างไร กุญแจอยู่ในผลิตภัณฑ์ที่ลูกค้ากำลังดูหากลูกค้ากำลังดูหนังสือเกี่ยวกับการจัดการทรัพยากรมนุษย์ตรรกะการแนะนำใหม่ของเว็บไซต์จะค้นหาลูกค้ารายอื่นที่เคยดูหรือซื้อหนังสือเล่มเดียวกัน ในขณะเดียวกันลอจิกยังกำหนดหนังสือที่คล้ายกันหรือที่เกี่ยวข้องอื่น ๆ ที่ผู้ใช้รายอื่นที่มีความสนใจเหมือนกันได้ดูหรือซื้อและแนะนำให้ผู้ใช้หนังสือที่คล้ายกัน

ฐานข้อมูลกราฟทำงานอย่างไร

ให้เราดูฐานข้อมูลกราฟอย่างใกล้ชิดด้วยความช่วยเหลือของตัวอย่าง สมมติว่าผู้ผลิตสมาร์ทโฟนต้องการเปิดสมาร์ทโฟนด้วยคุณสมบัติขั้นสูงหลายอย่าง การจัดการผลิตภัณฑ์จะตัดสินใจเกี่ยวกับคุณสมบัติหลังจากกำหนดความต้องการและความชอบของกลุ่มเป้าหมายซึ่งเป็นผู้บริหารองค์กร ผู้ผลิตสมาร์ทโฟนมีฐานข้อมูลอย่างน้อยหนึ่งฐานที่รวบรวมและจัดเก็บข้อมูลในโปรไฟล์ผู้บริหารจากแหล่งข้อมูลหลายแห่ง ตอนนี้ผู้จัดการผลิตภัณฑ์สร้างโครงสร้างข้อมูลกราฟตามข้อมูลซึ่งมีลักษณะดังนี้:


จากภาพด้านบนผู้จัดการผลิตภัณฑ์จะได้รับข้อสรุปหรือการตัดสินใจทางธุรกิจต่อไปนี้:

  • Steve เป็นผู้จัดการฝ่ายทรัพยากรบุคคลที่ใช้ผู้ส่งสารอย่างกว้างขวาง การเชื่อมต่อของเขาในแผนกทรัพยากรบุคคลอาจใช้ผู้ส่งสารเนื่องจากโปรไฟล์งานของพวกเขา ดังนั้นผู้ส่งสารที่ดีในสมาร์ทโฟนอาจมีความสำคัญ
  • เหตุผลหลักที่เดบร้าและเทรเวอร์เพื่อนสามีของเธอบ่อยครั้งที่ฟอรัมป้องกันไวรัสอาจเป็นปัญหาด้านความปลอดภัยในสมาร์ทโฟนหรือคอมพิวเตอร์ ดังนั้นสมาร์ทโฟนใหม่จึงมีคุณสมบัติความปลอดภัยในตัว
  • อับราฮัมใช้ Fitbit ซึ่งระบุว่าเขาตรวจสอบความฟิตของเขา ดังนั้นมันจะเป็นคุณสมบัติที่ดีถ้าสมาร์ทโฟนใหม่สามารถซิงค์ข้อมูลจากอุปกรณ์ Fitbit และแสดงผลได้อย่างเป็นมิตรกับผู้ใช้

ตัวอย่างข้างต้นแสดงให้เห็นว่าสามารถใช้ข้อมูลกราฟเพื่อแก้ปัญหาทางธุรกิจได้อย่างไร

ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

กรณีศึกษา

กรณีศึกษาด้านล่างแสดงให้เห็นว่าฐานข้อมูลกราฟช่วยแก้ปัญหาที่ซับซ้อนในอุตสาหกรรมการหาคู่ออนไลน์และการหางานออนไลน์ได้อย่างไร

กรณีศึกษา - การหาคู่ออนไลน์

ปัญหา: พอร์ทัลหาคู่ออนไลน์ต้องการค้นหาการจับคู่ที่เหมาะสมสำหรับสมาชิกของพวกเขา ในการทำเช่นนั้นพอร์ทัลต้องการข้อมูลเกี่ยวกับสมาชิกคนอื่น ๆ ของเว็บไซต์ที่อาจมีรสนิยมความชอบภูมิหลังและข้อมูลอื่น ๆ ที่คล้ายคลึงกัน

วิธีการแก้: พอร์ทัลออนไลน์หลายแห่งใช้ฐานข้อมูลกราฟเพื่อเดินทางผ่านรายละเอียดของสมาชิกหลายล้านคนและกัดเซาะข้อมูล ตามที่เว็บไซต์เตรียมการแข่งขันขึ้นอยู่กับรสนิยมการศึกษางานอดิเรกและรายละเอียดอื่น ๆ เว็บไซต์พิจารณาว่าส่วนกำหนดค่าเหล่านี้มีแนวโน้มที่จะตรงกับโปรไฟล์ที่เฉพาะเจาะจงมากที่สุดและให้คำแนะนำตามนั้น

กรณีศึกษา - เว็บไซต์เครือข่ายมืออาชีพ

ปัญหา: เว็บไซต์เครือข่ายมืออาชีพเช่น LinkedIn ต้องการแนะนำการเชื่อมต่อและงานที่เหมาะสมที่สุดตามพารามิเตอร์หลายประการเช่นโปรไฟล์, มุมมองการเชื่อมต่อ, มุมมองโปรไฟล์และสมาชิกกลุ่มซึ่งสะท้อนถึงความสนใจและความชอบ

วิธีการแก้: ในการทำเช่นนี้เว็บไซต์เครือข่ายดังกล่าวจะเดินทางผ่านการเชื่อมต่อหลายชั้นเช่นการเชื่อมต่อการเชื่อมต่อการเชื่อมต่อเป็นต้น จากนั้นกราฟเชิงตรรกะจะค้นหาความสนใจของมืออาชีพทั่วไปอาชีพโปรไฟล์งานสมาชิกกลุ่มและข้อมูลอื่น ๆ และจากการค้นพบให้คำแนะนำเกี่ยวกับทั้งเครือข่ายและงาน

ข้อเท็จจริงและตัวเลขจากอุตสาหกรรม

ข้อเท็จจริงและตัวเลขด้านล่างแสดงให้เห็นว่าฐานข้อมูลกราฟได้รับการรับรองทั่วทั้งอุตสาหกรรม:

  • บริษัท กว่า 2,000 แห่งทั่วโลกกว่า 30 แห่งที่รวมถึง Wal-Mart, eBay, Lufthansa และ Deutsche Telekom ได้นำ Neo4j ซึ่งเป็นฐานข้อมูลกราฟที่ได้รับความนิยมมากที่สุดที่สร้างโดย Neo Technology
  • ผู้สังเกตการณ์ในอุตสาหกรรม DB-Engines ได้กล่าวถึงความนิยมและการยอมรับของฐานข้อมูลกราฟ "DBMSs ของกราฟกำลังได้รับความนิยมเร็วกว่าหมวดฐานข้อมูลอื่น ๆ " เนื่องจากมีการเติบโตเกือบ 300 เปอร์เซ็นต์ตั้งแต่เดือนมกราคม 2013
  • ตั้งแต่พฤษภาคม 2013 เว็บไซต์หาคู่ออนไลน์สำคัญ ๆ หลายแห่งเริ่มนำฐานข้อมูลกราฟมาใช้
  • LinkedIn มีทีมงานขนาดใหญ่ที่ทำงานเกี่ยวกับระบบฐานข้อมูลกราฟที่เป็นกรรมสิทธิ์
  • ขึ้นอยู่กับฐานข้อมูลกราฟอย่างกว้างขวางและยังปล่อย FlockDB ซึ่งเป็นฐานข้อมูลกราฟโอเพ่นซอร์ส (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับฐานข้อมูลโอเพ่นซอร์สดูที่เหตุใดฐานข้อมูลโอเพ่นซอร์สกำลังได้รับความนิยม)
  • ด้วยเป้าหมายของการสร้างฐานข้อมูลกราฟที่ใช้งานง่ายสำหรับผู้ใช้ระดับองค์กร Teradata ได้เปิดตัว SQL ชนิดใหม่ที่รู้จักกันในชื่อ SQL-GR

ข้อสรุป

ฐานข้อมูลกราฟแสดงวิธีใหม่ในการดูข้อมูลขนาดใหญ่ มีประโยชน์ชัดเจนของข้อมูลกราฟ:

  1. ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ (RDBMS) ไม่สามารถประมวลผลข้อมูลจำนวนมากได้ในระยะเวลาอันสั้น นอกจากนี้ยังไม่สามารถจัดระเบียบข้อมูลจำนวนมากได้ ฐานข้อมูลกราฟสามารถสำรวจความสัมพันธ์ระหว่างเอนทิตีและจัดระเบียบข้อมูลอย่างมีเหตุผล
  2. ฐานข้อมูลกราฟมีประสิทธิภาพอย่างมากในการดึงข้อมูลที่เกี่ยวข้องหลังจากกำจัดสิ่งแปลกปลอมและความสัมพันธ์หลายอย่าง ตามที่ระบุไว้ก่อนหน้าพวกเขาสามารถสอบถามและส่งคืนข้อมูลเชิงลึกที่มีค่าอย่างยิ่งซึ่งระบบ BI สามารถนำเสนอในลักษณะที่ใช้งานง่าย

ดูเหมือนว่ามันเป็นเพียงเรื่องของเวลาก่อนที่อุตสาหกรรมอื่น ๆ ที่จัดการกับข้อมูลจำนวนมากเช่นธนาคารและการเงิน, ยา, การป้องกันและข่าวกรองก็จะใช้ฐานข้อมูลกราฟ ในความเป็นจริงการตรวจจับอาชญากรรมและการระบุการฉ้อโกงประกันด้วยความช่วยเหลือของเครือข่ายความสัมพันธ์และเอนทิตีที่มีข้อมูลกราฟแน่ใจว่าเป็นงานที่น่าสนใจ