แคตตาล็อกข้อมูลและการเติบโตของตลาดการเรียนรู้ของเครื่อง

ผู้เขียน: Roger Morrison
วันที่สร้าง: 28 กันยายน 2021
วันที่อัปเดต: 21 มิถุนายน 2024
Anonim
8 ขั้นตอนสำคัญในการสร้างธุรกิจให้ประสบความสำเร็จ[ใช้ได้กับทุกธุรกิจ]
วิดีโอ: 8 ขั้นตอนสำคัญในการสร้างธุรกิจให้ประสบความสำเร็จ[ใช้ได้กับทุกธุรกิจ]

เนื้อหา


ที่มา: Nmedia / Dreamstime.com

Takeaway:

ตลาด MLDC กำลังเติบโตและองค์กรที่ต้องการใช้ประโยชน์จากข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพด้วยการเรียนรู้ของเครื่องควรตระหนักถึงชื่ออันดับต้น ๆ ในสาขาและการจัดอันดับส่วนบุคคล

นี่คืออายุของข้อมูลขนาดใหญ่ เราได้รับข้อมูลจำนวนมากและธุรกิจพบว่าเป็นความท้าทายในการจัดการและแยกค่าออกมา

การไหลของข้อมูลขนาดใหญ่ในปัจจุบันไม่เพียงสร้างความหลากหลายความหลากหลายและความเร็ว แต่ยังมีความซับซ้อน ตามที่ระบุโดย SAS ในประวัติข้อมูลขนาดใหญ่และข้อควรพิจารณาในปัจจุบันที่เป็นปัจจัยของสตรีม "จากหลายแหล่งซึ่งทำให้การเชื่อมโยงจับคู่ล้างข้อมูลและแปลงข้อมูลข้ามระบบทำได้ยาก" (ต้องการเรียนรู้เพิ่มเติมเกี่ยวกับข้อมูลขนาดใหญ่หรือไม่ลองใช้ (บิ๊ก) ดาต้าบิ๊กฟิวเจอร์)

การค้นหาข้อมูลเชิงลึกที่มีค่าไม่ใช่คำถามของการรวบรวมข้อมูลให้ได้มากที่สุดเท่าที่จะเป็นไปได้ แต่เป็นการค้นหาข้อมูลที่ถูกต้อง มันเป็นไปไม่ได้ที่จะทำงานผ่านมันด้วยกระบวนการแบบแมนนวล นี่คือเหตุผลที่ธุรกิจจำนวนมากขึ้น "หันมาใช้แคตาล็อกข้อมูลเพื่อให้เป็นประชาธิปไตยในการเข้าถึงข้อมูลเปิดใช้งานความรู้ข้อมูลเกี่ยวกับเผ่าเพื่อดูแลข้อมูลใช้นโยบายข้อมูลและเปิดใช้งานข้อมูลทั้งหมดเพื่อมูลค่าทางธุรกิจอย่างรวดเร็ว"


นี่คือที่ซึ่งแคตตาล็อกข้อมูล (บางครั้งเรียกว่าแคตตาล็อกข้อมูล) ใส่ในภาพ ตามที่นิยามไว้ที่นี่พวกเขาให้อำนาจ "ผู้ใช้ในการสำรวจแหล่งข้อมูลที่ต้องการและทำความเข้าใจกับแหล่งข้อมูลที่สำรวจและในเวลาเดียวกันก็ช่วยให้องค์กรได้รับประโยชน์มากขึ้นจากการลงทุนในปัจจุบัน" อีกวิธีหนึ่งที่ทำได้คือการเปิดใช้งานการเข้าถึงข้อมูลที่มากขึ้นในหมู่ผู้ใช้ประเภทต่างๆที่สามารถใช้ประโยชน์หรือให้ข้อมูลได้

ความจำเป็นทางเศรษฐศาสตร์

เมื่อสังเกตเห็นความต้องการที่เพิ่มขึ้นอย่างมากสำหรับแคตตาล็อกข้อมูล ณ สิ้นปี 2560 การ์ตเนอร์ได้ขนานนามพวกเขาว่า "the black new" พวกเขาได้รับการยอมรับว่าเป็นวิธีแก้ปัญหาที่รวดเร็วและประหยัด "เพื่อจัดทำรายการสินค้าและจำแนกองค์กรที่กระจายข้อมูลมากขึ้นและจัดระเบียบสินทรัพย์ข้อมูลและจัดทำแผนที่ห่วงโซ่อุปทานข้อมูล" ความจำเป็นสำหรับสิ่งนี้เกิดขึ้นเนื่องจากการเพิ่มขึ้นของ "infonomics" ซึ่งเรียกร้องให้ใช้ความพิถีพิถันในการติดตามข้อมูลเช่นเดียวกับการจัดการทรัพย์สินทางธุรกิจอื่น ๆ (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับซัพพลายเชนให้ดูว่าการเรียนรู้ของเครื่องจักรสามารถปรับปรุงประสิทธิภาพของซัพพลายเชนได้อย่างไร)


การ์ทเนอร์จับมือกับ The Forrester Wave ™: แคตตาล็อกข้อมูลการเรียนรู้ของเครื่อง, ไตรมาสที่ 2 ปี 2018 กว่าครึ่งหนึ่งของผู้เข้าร่วมการสำรวจในรายงานกล่าวว่าพวกเขาวางแผนที่จะสร้างการติดตั้งแคตาล็อกข้อมูล มีแนวโน้มว่าพวกเขาจะถูกกระตุ้นด้วยความจริงที่ว่าแต่ละคนมีข้อมูลอย่างน้อยเจ็ดทะเลสาบในองค์กรของพวกเขา ตามที่การ์ทเนอร์ใช้กับแคตาล็อกข้อมูลอธิบายว่าแคตตาล็อกข้อมูลมีประโยชน์อย่างยิ่งสำหรับการดึง "คอนความหมายและคุณค่าของข้อมูล" ซึ่งโดยทั่วไปแล้วจะอยู่ในรูปแบบที่ไม่เป็นความลับในทะเลสาบข้อมูล

Forrester รายงานว่ามากกว่าหนึ่งในสามของข้อมูลและผู้มีอำนาจตัดสินใจด้านการวิเคราะห์กำลังเผชิญกับข้อมูล 1,000TB หรือมากกว่าในปี 2017 จำนวนที่รายงานระหว่าง 10 ถึง 14 เปอร์เซ็นต์ในปีก่อน การจัดการข้อมูลในระดับนั้นเป็นความท้าทายที่เพิ่มขึ้นหรือโดยเฉพาะกับความท้าทายสองประการ:

“ 1) การรวมกระบวนการทางธุรกิจที่มีอยู่เข้ากับแหล่งข้อมูลเพื่อวิเคราะห์และใช้ข้อมูลเชิงลึกและ 2) การจัดหาการรวบรวมการจัดการและการควบคุมข้อมูลเมื่อมีการเติบโต”

ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

แคตาล็อกข้อมูลสามารถทำธุรกิจอะไรได้บ้าง

การ์ตเนอร์ระบุวิธีเฉพาะที่แคตตาล็อกข้อมูลสามารถปรับปรุงการไหลของข้อมูลและประสิทธิภาพขององค์กร:

  • การรวบรวมและการสื่อสารคลังข้อมูลสินทรัพย์ที่เป็นปัจจุบันที่องค์กรสามารถใช้ได้

  • การสร้างคำศัพท์ทั่วไปของคำศัพท์ทางธุรกิจที่กำหนดการตีความหมายและความหมายของข้อมูลองค์กรดังนั้นจึงเป็นวิธีการไกล่เกลี่ยและการแก้ไขความไม่สอดคล้องกันที่กำหนด

  • การเปิดใช้งานสภาพแวดล้อมการทำงานร่วมกันแบบไดนามิกและคล่องตัวเพื่อให้ธุรกิจและเพื่อนร่วมงานไอทีสามารถแสดงความคิดเห็นในเอกสารและแบ่งปันข้อมูล

  • ให้ความโปร่งใสในการใช้ข้อมูลพร้อมการวิเคราะห์สายเลือดและผลกระทบ

  • การติดตามตรวจสอบและติดตามข้อมูลเพื่อสนับสนุนกระบวนการกำกับดูแลข้อมูล

  • การจับข้อมูลเมตาเพื่อปรับปรุงการวิเคราะห์ข้อมูลการใช้และการใช้ซ้ำภายในการเพิ่มประสิทธิภาพการสืบค้นและการรับรองข้อมูล

  • การรวมข้อมูลในการใช้งานทางธุรกิจโดยการรวบรวมการสื่อสารและการวิเคราะห์ข้อมูลที่มีอยู่ที่ไหนมันมาจากอะไรข้อเสียที่จะใช้ในทำไมมันเป็นสิ่งที่จำเป็นวิธีการไหลระหว่างกระบวนการและระบบที่รับผิดชอบต่อมันหมายถึงอะไร และมันมีคุณค่าอะไรบ้าง

การได้รับข้อมูลที่ถูกระบุและเข้าถึงได้โดยบุคคลสำคัญในองค์กรนั้นเป็นสิ่งสำคัญรายงานของการ์ตเนอร์กล่าวว่าไม่ใช่เพียงเพื่อค้นหาวิธีการ "สร้างรายได้จากสินทรัพย์ข้อมูลสำหรับผลลัพธ์ทางธุรกิจดิจิทัล" แต่เพื่อให้สอดคล้องกับกฎระเบียบ โดยเฉพาะเช่นพระราชบัญญัติประกันสุขภาพและความรับผิดชอบ (HIPAA) หรือลักษณะทั่วไปที่มากกว่าเช่นกฎการคุ้มครองข้อมูลทั่วไป (GDPR)

การเพิ่มการเรียนรู้ของเครื่อง

แต่ไม่มีสิ่งใดที่ปราศจากข้อเสีย สำหรับแคตตาล็อกข้อมูลปัญหาที่เกิดขึ้นนั้นเกิดจากกระบวนการที่ช้าและน่าเบื่อในการสร้างมันขึ้นมาด้วยตัวเองพร้อมกับเมทาดาทาทั้งหมดที่จำเป็นต้องมี นี่คือที่มาของส่วนประกอบการเรียนรู้ของเครื่อง

แค็ตตาล็อกข้อมูลที่ Forrester ประเมินนั้นเรียกว่า MLDCs เพราะมันควบคุมพลังของการเรียนรู้ของเครื่องจักรซึ่งเป็นหนึ่งในองค์ประกอบของ AI ตามที่อธิบายไว้ในบล็อกโพเดียมซึ่งทำให้สามารถ "สร้างที่เก็บถาวรของเมทาดาทาแล้วใช้ ML / AI เพื่อค้นหาและเปิดเผยข้อมูลเชิงลึกที่เป็นประโยชน์เกี่ยวกับสินทรัพย์ข้อมูลที่ซ่อนอยู่"

วิธีการเลือก

เพื่อช่วยให้องค์กรประเมินว่าควรเลือกธุรกิจใดธุรกิจหนึ่ง Forrester ได้นำคะแนนการประเมิน 29 ข้อไปใช้กับ 12 MLDC ชั้นนำ มันระบุผู้นำในตลาดนี้: IBM, Relito, Unifi Software, Alation และ Collibra นักแสดงที่แข็งแกร่งที่พบคือ Informatica, Oracle, Waterline Data, Infogix, Cambridge Semantics และ Cloudera Hortonworks ยืนอยู่คนเดียวในอันดับของ "คู่แข่ง"

อย่างไรก็ตามไม่ควรมีการจัดอันดับโดยรวมเพียงอย่างเดียว รายงานจะทำลายจุดแข็งและจุดอ่อนของแต่ละคน ดังนั้นหากคุณลักษณะเฉพาะเช่นการวิจัยและพัฒนามีความสำคัญสูงสุดสำหรับองค์กรมันอาจพิจารณา Hortonworks ว่าเท่ากับ IBM และ Colilbra สำหรับแง่มุมนั้นเพราะทั้งสามมีคะแนนสูงสุดห้าในคุณภาพนั้นซึ่งเป็น ดีกว่า Alation และ Coloudera สองคะแนนและดีกว่า Cambridge Semantics สี่จุด

ดังนั้นรายงาน Forrester ให้คำแนะนำแก่ผู้ที่ใช้รายงานเพื่อเป็นแนวทางในการไม่ถือว่า บริษัท ที่อยู่ในอันดับต้น ๆ เป็นตัวเลือกที่ดีที่สุดสำหรับทุกคน พวกเขาควรให้ความสำคัญกับการแยกย่อยของการประเมินเพื่อค้นหาสิ่งที่ตรงตามข้อกำหนดเฉพาะของพวกเขา