สร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ

ผู้เขียน: Eugene Taylor
วันที่สร้าง: 9 สิงหาคม 2021
วันที่อัปเดต: 22 มิถุนายน 2024
Anonim
Building a Business Driven Data Architecture
วิดีโอ: Building a Business Driven Data Architecture

Takeaway: Host Rebecca Jozwiak กล่าวถึงโซลูชั่นสถาปัตยกรรมข้อมูลกับ Eric Little of OSTHUS, Malcolm Chisholm จาก First San Francisco Partners และ Ron Huizenga จาก IDERA




คุณยังไม่ได้เข้าสู่ระบบโปรดเข้าสู่ระบบหรือลงทะเบียนเพื่อดูวิดีโอ

รีเบคก้า Jozwiak: ท่านสุภาพบุรุษและสุภาพสตรีสวัสดีและยินดีต้อนรับสู่ Hot Technologies ประจำปี 2559 วันนี้เรากำลังพูดถึง "การสร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ" เป็นหัวข้อที่น่าสนใจอย่างแน่นอน ชื่อของฉันคือรีเบคก้า Jozwiak ฉันจะเป็นโฮสต์ของคุณสำหรับการออกอากาศทางเว็บในวันนี้ เราทวีตพร้อมแฮชแท็กของ # HotTech16 ดังนั้นหากคุณเข้าร่วมแล้วโปรดเข้าร่วมในส่วนนั้นด้วย หากคุณมีข้อสงสัยโปรดไปที่คำถามและคำตอบที่ด้านล่างขวาของหน้าจอและเราจะทำให้แน่ใจว่าพวกเขาจะได้รับคำตอบ ถ้าไม่เราจะตรวจสอบให้แน่ใจว่าแขกของเราได้รับพวกเขามาให้คุณ

ดังนั้นวันนี้เรามีผู้เล่นตัวจริงที่น่าสนใจมากมาย วันนี้เรามีนักตีอย่างหนักมากมาย เรามี Eric Little, รองประธานด้านวิทยาศาสตร์ข้อมูลจาก OSTHUS เรามี Malcolm Chisholm ประธานเจ้าหน้าที่ฝ่ายนวัตกรรมซึ่งเป็นชื่อที่ยอดเยี่ยมมากสำหรับ First San Francisco Partners และเรามี Ron Huizenga ผู้จัดการผลิตภัณฑ์อาวุโสจาก IDERA และคุณรู้ไหม IDERA เป็นชุดโซลูชั่นการจัดการข้อมูลและการสร้างแบบจำลองที่สมบูรณ์แบบจริงๆ และวันนี้เขาจะให้ตัวอย่างแก่เราเกี่ยวกับวิธีการทำงานของเขา แต่ก่อนที่เราจะไปถึงจุดนั้น Eric Little ฉันจะส่งบอลให้คุณ


Eric Little: โอเคขอบคุณมาก ดังนั้นฉันจะผ่านสองสามหัวข้อที่นี่ที่ฉันคิดว่าจะเกี่ยวข้องกับการพูดคุยของรอนเล็กน้อยและหวังว่าจะเป็นเวทีสำหรับหัวข้อเหล่านี้ด้วยเช่นกันถาม - ตอบ

ดังนั้นสิ่งที่ฉันสนใจในสิ่งที่ IDERA ทำคือฉันคิดว่าพวกเขาชี้ให้เห็นอย่างถูกต้องว่าสภาพแวดล้อมที่ซับซ้อนกำลังขับเคลื่อนคุณค่าทางธุรกิจจำนวนมากในปัจจุบัน และโดยสภาพแวดล้อมที่ซับซ้อนเราหมายถึงสภาพแวดล้อมข้อมูลที่ซับซ้อน และเทคโนโลยีกำลังเคลื่อนไหวอย่างรวดเร็วและยากที่จะติดตามในสภาพแวดล้อมทางธุรกิจของวันนี้ ดังนั้นคนที่ทำงานในพื้นที่เทคโนโลยีมักจะเห็นว่าคุณมีลูกค้าที่กำลังแก้ไขปัญหาด้วย“ ฉันจะใช้ข้อมูลขนาดใหญ่ได้อย่างไร ฉันจะรวมความหมายได้อย่างไร ฉันจะเชื่อมโยงข้อมูลใหม่นี้เข้ากับข้อมูลเก่าของฉันได้อย่างไร” และต่อ ๆ ไปและสิ่งเหล่านี้นำเราไปสู่ข้อมูลขนาดใหญ่ทั้งสี่นี้ที่ผู้คนคุ้นเคยกันดีและฉันเข้าใจว่าอาจมีมากกว่าสี่ บางครั้ง - ฉันเคยเห็นมากถึงแปดหรือเก้า - แต่โดยปกติแล้วเมื่อผู้คนพูดถึงสิ่งต่าง ๆ เช่นข้อมูลขนาดใหญ่หรือถ้าคุณกำลังพูดถึงข้อมูลขนาดใหญ่คุณมักจะมองสิ่งที่เป็นระดับองค์กร ผู้คนก็จะบอกว่าโอเคลองนึกถึงปริมาณข้อมูลของคุณซึ่งปกติแล้วจะเป็นจุดสนใจนั่นก็คือคุณมีเท่าไหร่ ความเร็วของข้อมูลเกี่ยวข้องกับความเร็วที่ฉันสามารถเคลื่อนที่ไปรอบ ๆ หรือว่าเร็วแค่ไหนที่ฉันสามารถสืบค้นหรือรับคำตอบและอื่น ๆ และโดยส่วนตัวแล้วฉันคิดว่าด้านซ้ายของสิ่งนั้นคือสิ่งที่ถูกแก้ไขและจัดการอย่างรวดเร็วโดยวิธีการที่แตกต่างกันมากมาย แต่ทางด้านขวาฉันเห็นความสามารถมากมายสำหรับการปรับปรุงและเทคโนโลยีใหม่มากมายที่กำลังมาถึงเบื้องหน้า และนั่นเกี่ยวข้องกับคอลัมน์ที่สามนั่นคือความหลากหลายของข้อมูล


ดังนั้นในคำอื่น ๆ บริษัท ส่วนใหญ่ในปัจจุบันกำลังดูข้อมูลที่มีโครงสร้างกึ่งโครงสร้างและไม่มีโครงสร้าง ข้อมูลรูปภาพเริ่มเป็นประเด็นร้อนเพื่อให้สามารถใช้การมองเห็นคอมพิวเตอร์ดูที่พิกเซลสามารถขูด NLP การแยกเอนทิตีคุณมีข้อมูลกราฟที่ออกมาจากแบบจำลองทางสถิติหรือแบบจำลองเชิงความหมาย คุณมีข้อมูลเชิงสัมพันธ์ที่มีอยู่ในตารางและอื่น ๆ ดังนั้นการดึงข้อมูลทั้งหมดเข้าด้วยกันและประเภทที่แตกต่างกันเหล่านี้เป็นความท้าทายที่ยิ่งใหญ่และคุณจะเห็นสิ่งนี้ได้ใน Gartner และคนอื่น ๆ ที่ติดตามแนวโน้มในอุตสาหกรรม

แล้วสิ่งสุดท้ายที่ผู้คนพูดถึงในข้อมูลขนาดใหญ่มักจะเป็นความคิดที่ไม่ชัดเจนซึ่งเป็นความไม่แน่นอนของข้อมูลของคุณ, ความคลุมเครือของมัน คุณรู้ได้ดีแค่ไหนเกี่ยวกับข้อมูลของคุณคุณเข้าใจว่ามีอะไรอยู่ในนั้นและคุณรู้ได้อย่างไร ความสามารถในการใช้สถิติและความสามารถในการใช้ข้อมูลบางประเภทเกี่ยวกับสิ่งที่คุณอาจรู้หรือใช้ข้อผิดพลาดบางอย่างอาจมีค่า ดังนั้นความสามารถในการดูข้อมูลด้วยวิธีนี้ในแง่ของจำนวนเงินที่คุณมีความเร็วในการเคลื่อนย้ายไปรอบ ๆ หรือรับข้อมูลทุกประเภทของข้อมูลที่คุณอาจมีในองค์กรของคุณและคุณมั่นใจว่าคุณอยู่ที่ไหน มันคืออะไรมันคืออะไรคุณภาพมันอยู่ในและอื่น ๆ สิ่งนี้ต้องการความพยายามขนาดใหญ่และมีการประสานงานระหว่างบุคคลจำนวนมากในการจัดการข้อมูลอย่างมีประสิทธิภาพ ดังนั้นการสร้างแบบจำลองข้อมูลจึงมีความสำคัญมากขึ้นในโลกปัจจุบัน โมเดลข้อมูลที่ดีนั้นกำลังขับเคลื่อนความสำเร็จอย่างมากในแอปพลิเคชันระดับองค์กร

คุณมีแหล่งข้อมูลจากแหล่งข้อมูลต่าง ๆ เช่นที่เรากำลังพูดซึ่งต้องการการรวมกลุ่มที่แตกต่างกันมากมาย ดังนั้นการดึงข้อมูลทั้งหมดเข้าด้วยกันจึงเป็นประโยชน์อย่างมากในการเรียกใช้คิวรีตัวอย่างเช่นข้ามแหล่งข้อมูลหลายประเภทและดึงข้อมูลกลับมา แต่เพื่อที่จะทำเช่นนั้นคุณต้องมีกลยุทธ์การทำแผนที่ที่ดีดังนั้นการทำแผนที่ข้อมูลประเภทนั้นและการติดตามการแมปเหล่านั้นอาจเป็นความท้าทายที่แท้จริง แล้วคุณมีปัญหานี้แล้วฉันจะเชื่อมโยงข้อมูลดั้งเดิมของฉันกับแหล่งข้อมูลใหม่เหล่านี้ได้อย่างไร สมมติว่าฉันมีกราฟฉันจะนำข้อมูลเชิงสัมพันธ์ทั้งหมดมาใส่ในกราฟหรือไม่? โดยปกติแล้วไม่ใช่ความคิดที่ดี แล้วผู้คนจะสามารถจัดการตัวแบบข้อมูลเหล่านี้ทั้งหมดที่เกิดขึ้นได้อย่างไร? การวิเคราะห์จะต้องดำเนินการบนแหล่งข้อมูลและชุดค่าผสมต่าง ๆ เหล่านี้จำนวนมาก ดังนั้นคำตอบที่ออกมาจากนี้คำตอบที่ผู้คนจำเป็นต้องตัดสินใจทางธุรกิจที่ดีจริงๆจึงเป็นสิ่งสำคัญ

ดังนั้นนี่ไม่ใช่แค่การสร้างเทคโนโลยีเพื่อประโยชน์ของเทคโนโลยีมันคือสิ่งที่ฉันกำลังจะทำฉันจะทำอะไรได้บ้างฉันจะใช้การวิเคราะห์แบบไหนและความสามารถตามที่ฉันได้ทำไปแล้ว พูดถึงเพื่อดึงสิ่งนี้เข้าด้วยกันเพื่อรวมเข้าด้วยกันมันสำคัญมากจริงๆ และการวิเคราะห์ประเภทหนึ่งเหล่านี้ก็จะทำงานในสิ่งต่างๆเช่นการค้นหาแบบติดต่อกับภายนอกและการสืบค้น นั่นคือการต้องกลายเป็นจริง โดยปกติแล้วแบบสอบถามของคุณจะต้องมีการข้ามเธรดในแหล่งข้อมูลหลายประเภทและดึงข้อมูลกลับมาในความน่าเชื่อถือ

องค์ประกอบสำคัญอย่างหนึ่งที่มักจะโดยเฉพาะอย่างยิ่งผู้คนกำลังมองหาสิ่งสำคัญเช่นเทคโนโลยีความหมาย - และนี่คือสิ่งที่ฉันหวังว่ารอนจะพูดถึงวิธีการ IDERA - วิธีที่คุณแยกหรือจัดการ model model ของข้อมูลของคุณจาก data layer นั้นจากข้อมูลดิบ? ลงมาที่ชั้นข้อมูลคุณอาจมีฐานข้อมูลคุณอาจมีข้อมูลเอกสารคุณอาจมีข้อมูลสเปรดชีตคุณอาจมีข้อมูลภาพ หากคุณอยู่ในพื้นที่เช่นอุตสาหกรรมยาคุณจะได้รับข้อมูลทางวิทยาศาสตร์จำนวนมาก จากนั้นคนส่วนใหญ่มักจะมองหาวิธีสร้างแบบจำลองที่ช่วยให้พวกเขาสามารถรวมข้อมูลนั้นได้อย่างรวดเร็วและเมื่อคุณกำลังมองหาข้อมูลตอนนี้คุณไม่ต้องการดึงข้อมูลทั้งหมดลงในเลเยอร์แบบจำลองของคุณ สิ่งที่คุณกำลังดูที่เลเยอร์โมเดลที่ต้องทำคือให้สิ่งที่เป็นตัวแทนของคุณคำศัพท์สามัญประเภททั่วไปของเอนทิตีและความสัมพันธ์และความสามารถในการเข้าถึงข้อมูลที่เป็นจริง ดังนั้นต้องบอกว่ามันคืออะไรและต้องบอกว่ามันอยู่ที่ไหนและต้องบอกว่าจะไปดึงมันกลับมาได้อย่างไร

ดังนั้นนี่จึงเป็นวิธีการที่ประสบความสำเร็จในการขับเคลื่อนเทคโนโลยีความหมายไปข้างหน้าซึ่งเป็นพื้นที่ที่ฉันทำงานเป็นจำนวนมาก ดังนั้นคำถามที่ฉันต้องการโพสต์ให้รอนและฉันคิดว่าจะมีประโยชน์ในส่วนของคำถาม & คำตอบคือการดูว่าแพลตฟอร์ม IDERA นี้ประสบความสำเร็จได้อย่างไร เลเยอร์โมเดลแยกจากชั้นข้อมูลจริงหรือไม่ พวกเขารวมมากขึ้น? มันทำงานอย่างไรและผลลัพธ์และประโยชน์บางประการที่พวกเขาเห็นจากวิธีการของพวกเขาคืออะไร ดังนั้นข้อมูลอ้างอิงก็มีความสำคัญเช่นกัน ดังนั้นหากคุณจะมีโมเดลข้อมูลเหล่านี้หากคุณจะสามารถรวมกลุ่มและค้นหาสิ่งต่าง ๆ ได้คุณจะต้องมีข้อมูลอ้างอิงที่ดี แต่ปัญหาคือข้อมูลอ้างอิงนั้นยากที่จะรักษา ดังนั้นการตั้งชื่อมาตรฐานในตัวเองบ่อยครั้งจึงเป็นเรื่องยาก กลุ่มหนึ่งจะเรียกสิ่งที่เป็น X และกลุ่มหนึ่งจะเรียกสิ่งที่ว่า Y และตอนนี้คุณมีปัญหาว่าจะมีคนค้นหา X และ Y ได้อย่างไรเมื่อพวกเขากำลังมองหาข้อมูลประเภทนี้ เนื่องจากคุณไม่ต้องการให้ข้อมูลเพียงบางส่วนกับพวกเขาคุณจึงต้องการให้ทุกสิ่งที่เกี่ยวข้องกับพวกเขา ในขณะเดียวกันการเปลี่ยนแปลงข้อกำหนดซอฟต์แวร์จะเลิกใช้แล้วคุณจะติดตามและรักษาข้อมูลอ้างอิงนั้นตลอดเวลาอย่างไร

และอีกครั้งเทคโนโลยีความหมายโดยเฉพาะอย่างยิ่งการใช้สิ่งต่าง ๆ เช่น taxonomies และคำศัพท์พจนานุกรมข้อมูลได้จัดทำวิธีการพื้นที่มาตรฐานในการทำสิ่งนี้ซึ่งมีความแข็งแกร่งสูงจริง ๆ มันใช้มาตรฐานบางประเภท แต่ชุมชนฐานข้อมูลได้ทำสิ่งนี้เพื่อ เวลานานเช่นกันในรูปแบบที่แตกต่างกัน ฉันคิดว่าหนึ่งในกุญแจที่นี่คือการคิดเกี่ยวกับวิธีการใช้แบบจำลองความสัมพันธ์เอนทิตี้ของวิธีการใช้แบบจำลองกราฟหรือวิธีการบางอย่างที่นี่ซึ่งจะทำให้คุณมีวิธีเว้นระยะมาตรฐานในการจัดการข้อมูลอ้างอิงของคุณ และแน่นอนว่าเมื่อคุณมีข้อมูลอ้างอิงแล้วกลยุทธ์การแมปต้องจัดการชื่อและเอนทิตีที่หลากหลาย ดังนั้นผู้เชี่ยวชาญเฉพาะด้านมักต้องการใช้คำศัพท์ของตนเอง

ดังนั้นความท้าทายในเรื่องนี้อยู่เสมอคุณจะให้ข้อมูลกับใครได้บ้าง แต่ทำให้มันเกี่ยวข้องกับวิธีที่พวกเขาพูดถึงมัน ดังนั้นกลุ่มหนึ่งอาจมีวิธีหนึ่งในการดูบางอย่างเช่นคุณอาจเป็นนักเคมีที่ทำงานกับยาเสพติดและคุณอาจเป็นนักชีววิทยาเชิงโครงสร้างที่ทำงานกับยาตัวเดียวกันและคุณอาจมีชื่อแตกต่างกันสำหรับหน่วยงานประเภทเดียวกัน ที่เกี่ยวข้องกับสาขาของคุณ คุณต้องหาวิธีที่จะนำคำศัพท์ส่วนบุคคลเหล่านั้นมาใช้ร่วมกันเพราะวิธีการอื่นคือคุณต้องบังคับให้คนเลิกใช้และใช้คนอื่นซึ่งพวกเขาไม่ชอบ อีกจุดหนึ่งที่นี่คือการจัดการคำพ้องความหมายจำนวนมากได้ยากดังนั้นจึงมีคำที่แตกต่างกันมากมายในข้อมูลของคนจำนวนมากที่สามารถอ้างถึงสิ่งเดียวกัน คุณมีปัญหาในการอ้างอิงที่นั่นโดยใช้ชุดความสัมพันธ์แบบหนึ่งต่อหนึ่ง ข้อกำหนดเฉพาะแตกต่างกันไปในแต่ละอุตสาหกรรมดังนั้นหากคุณกำลังคิดหาวิธีแก้ปัญหาสำหรับการจัดการข้อมูลประเภทนี้แบบพกพาง่ายแค่ไหนจากโครงการหนึ่งหรือแอปพลิเคชันหนึ่งไปอีกแอปหนึ่ง นั่นอาจเป็นความท้าทายอีกประการหนึ่ง

ระบบอัตโนมัติมีความสำคัญและเป็นความท้าทาย มีราคาแพงในการจัดการข้อมูลอ้างอิงด้วยตนเอง การทำแผนที่ด้วยตนเองมีค่าใช้จ่ายสูงและมีค่าใช้จ่ายสูงที่ผู้เชี่ยวชาญด้านเนื้อหาหยุดทำงานประจำวันและต้องเข้าไปแก้ไขพจนานุกรมข้อมูลและคำจำกัดความที่อัปเดตใหม่ ๆ อยู่เรื่อย ๆ คำศัพท์ที่ทำซ้ำได้แสดงค่ามาก ดังนั้นสิ่งเหล่านี้จึงเป็นคำศัพท์ที่บ่อยครั้งซึ่งคุณสามารถค้นหาได้จากภายนอกองค์กรของคุณ ตัวอย่างเช่นหากคุณทำงานกับน้ำมันดิบจะมีคำศัพท์บางประเภทที่คุณสามารถยืมมาจากพื้นที่โอเพนซอร์ซกับเภสัชศาสตร์เหมือนกับอุตสาหกรรมธนาคารและการเงินเหมือนกับในพื้นที่เหล่านี้มากมาย ผู้คนกำลังนำคำศัพท์ทั่วไปที่ใช้ซ้ำได้แบบจำลองได้มาใช้ซ้ำเพื่อให้คนใช้

และอีกครั้งเมื่อดูที่เครื่องมือ IDERA ฉันอยากรู้ว่าพวกเขาจัดการเรื่องนี้อย่างไรในแง่ของการใช้มาตรฐานหลายประเภท ในโลกความหมายคุณมักจะเห็นสิ่งต่าง ๆ เช่นแบบจำลอง SKOS ที่ให้มาตรฐานอย่างน้อยกว้างกว่า / แคบกว่าความสัมพันธ์และสิ่งเหล่านั้นอาจทำได้ยากในแบบจำลอง ER แต่คุณรู้หรือไม่เป็นไปไม่ได้มันแค่ขึ้นอยู่กับว่า เครื่องจักรและการเชื่อมโยงที่คุณสามารถจัดการกับระบบประเภทเหล่านั้นได้

ดังนั้นในที่สุดฉันก็อยากจะเปรียบเทียบเครื่องยนต์ความหมายบางอย่างที่ฉันเห็นในอุตสาหกรรมและถามรอนกับเขาสักหน่อยเพื่อพูดคุยเกี่ยวกับวิธีการที่ระบบ IDERA ใช้ร่วมกับเทคโนโลยีความหมายใด ๆมันสามารถรวมกับร้านค้าสามฐานข้อมูลกราฟ? มันง่ายแค่ไหนที่จะใช้แหล่งข้อมูลภายนอกเพราะสิ่งต่าง ๆ เหล่านั้นในโลกความหมายสามารถยืมโดยใช้ SPARQL Endpoint ได้? คุณสามารถนำเข้าโมเดล RDF หรือนกฮูกโดยตรงในแบบจำลองของคุณ - อ้างอิงกลับไปที่พวกเขา - ตัวอย่างเช่นยีน ontology หรือ ontology โปรตีนที่สามารถอาศัยอยู่ที่ไหนสักแห่งในพื้นที่ของตัวเองด้วยโครงสร้างการกำกับของตัวเองและฉันสามารถนำเข้าทั้งหมดหรือ ส่วนหนึ่งของสิ่งที่ฉันต้องการในโมเดลของฉันเอง และฉันอยากรู้ว่า IDERA เข้าถึงปัญหานี้อย่างไร คุณต้องรักษาทุกอย่างภายในหรือมีวิธีที่จะไปใช้รูปแบบมาตรฐานอื่น ๆ และดึงพวกเขาในและวิธีการทำงานอย่างไร และสิ่งสุดท้ายที่ฉันพูดถึงที่นี่คืองานที่ทำด้วยมือเกี่ยวข้องกับการสร้างอภิธานศัพท์และที่เก็บข้อมูลเมตาอย่างไร

ดังนั้นฉันจึงรู้ว่ารอนจะแสดงการสาธิตบางอย่างให้เราเห็นเกี่ยวกับสิ่งต่าง ๆ เหล่านี้ซึ่งน่าสนใจจริงๆ แต่ปัญหาที่ฉันมักจะเห็นการให้คำปรึกษากับลูกค้าก็คือว่ามีข้อผิดพลาดเกิดขึ้นมากมายถ้าคนเขียนคำจำกัดความของตัวเองหรือเมตาดาต้าของตัวเอง ดังนั้นคุณจะได้รับการสะกดผิดคุณจะได้รับข้อผิดพลาดไขมันนิ้วนั่นเป็นสิ่งหนึ่ง คุณยังทำให้คนที่อาจนำบางสิ่งมาจากคุณรู้เพียงแค่วิกิพีเดียหรือแหล่งที่ไม่จำเป็นต้องมีคุณภาพที่คุณอาจต้องการในคำนิยามของคุณหรือคำจำกัดความของคุณมาจากมุมมองของคนคนหนึ่งเท่านั้นดังนั้นจึงไม่สมบูรณ์และไม่ชัดเจน กระบวนการกำกับดูแลทำงานอย่างไร แน่นอนว่าการกำกับดูแลนั้นเป็นประเด็นที่ใหญ่มาก ๆ ทุกครั้งที่คุณพูดถึงข้อมูลอ้างอิงและทุกครั้งที่คุณพูดถึงว่าข้อมูลนี้จะสอดคล้องกับข้อมูลหลักของใครบางคนได้อย่างไรพวกเขาจะใช้เมทาดาทาของพวกเขาอย่างไร เป็นต้น

ดังนั้นฉันแค่อยากจะเอาหัวข้อเหล่านี้ออกไป สิ่งเหล่านี้เป็นสิ่งที่ฉันเห็นในพื้นที่ธุรกิจในการให้คำปรึกษาที่หลากหลายและพื้นที่ที่แตกต่างกันมากมายและฉันสนใจที่จะดูว่ารอนจะแสดงให้เราเห็นด้วย IDERA เพื่อชี้ให้เห็นหัวข้อเหล่านี้บางอย่าง . ขอบคุณมาก ๆ

รีเบคก้า Jozwiak: ขอบคุณมากเอริคและฉันชอบความคิดเห็นของคุณว่าข้อผิดพลาดมากมายสามารถเกิดขึ้นได้หากผู้คนกำลังเขียนคำจำกัดความหรือข้อมูลเมตาของตนเอง ฉันรู้ว่าในโลกสื่อสารมวลชนมีมนต์ที่ว่า "หลาย ๆ ตาทำให้เกิดข้อผิดพลาดเล็กน้อย" แต่เมื่อมันเข้าสู่การใช้งานจริงมือจำนวนมากในโถคุกกี้ก็มีแนวโน้มที่จะทำให้คุณมีคุกกี้แตกมากใช่ไหม?

Eric Little: ใช่และเชื้อโรค

รีเบคก้า Jozwiak: ใช่. ด้วยสิ่งที่ฉันจะไปข้างหน้าและผ่านมันไปที่ Malcolm Chisholm Malcolm พื้นเป็นของคุณ

Malcolm Chisholm: ขอบคุณมากรีเบคก้า ฉันอยากจะดูเล็กน้อยเกี่ยวกับสิ่งที่เอริคพูดถึงและเพิ่มการสังเกตบางอย่างที่รอนรู้ว่าอาจสนใจที่จะตอบสนองด้วยการพูดถึง“ ไปสู่สถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ ” - การขับเคลื่อนธุรกิจหมายถึงอะไรและทำไมจึงมีความสำคัญ หรือมันเป็นแค่รูปแบบหนึ่งของการโฆษณา ฉันไม่คิดว่ามันจะเป็น

ถ้าเราดูว่าเกิดอะไรขึ้นตั้งแต่นั้นมาคุณรู้ไหมว่าคอมพิวเตอร์เมนเฟรมพร้อมให้บริการแก่ บริษัท ต่างๆเช่นในปี 1964 ถึงปัจจุบันเราจะเห็นว่ามีการเปลี่ยนแปลงมากมาย และการเปลี่ยนแปลงเหล่านี้ฉันจะสรุปว่าเป็นการเปลี่ยนจากการเป็นศูนย์กลางของกระบวนการไปสู่การเป็นศูนย์กลางข้อมูล และนั่นคือสิ่งที่ทำให้สถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจมีความสำคัญและมีความเกี่ยวข้องในทุกวันนี้ และฉันก็คิดว่ามันไม่ได้เป็นเพียงแค่คำศัพท์ แต่เป็นสิ่งที่เป็นจริงอย่างแน่นอน

แต่เราสามารถชื่นชมมันได้อีกเล็กน้อยหากเราดำดิ่งลงไปในประวัติศาสตร์ดังนั้นย้อนเวลากลับไปสู่ยุค 1960 และหลังจากนั้นไม่นานเมนเฟรมก็มีอิทธิพล สิ่งเหล่านี้ทำให้เกิดการใช้พีซีที่คุณเคยก่อจลาจลต่อผู้ใช้เมื่อพีซีเข้ามาการจลาจลต่อต้านระบบไอทีจากส่วนกลางที่พวกเขาคิดว่าไม่ได้เติมเต็มความต้องการของพวกเขา นั่นทำให้เกิดการกระจายการคำนวณอย่างรวดเร็วเมื่อพีซีเชื่อมโยงเข้าด้วยกัน จากนั้นอินเทอร์เน็ตก็เริ่มเกิดขึ้นซึ่งทำให้ขอบเขตขององค์กรไม่ชัดเจน - ตอนนี้มันสามารถโต้ตอบกับบุคคลภายนอกในแง่ของการแลกเปลี่ยนข้อมูลซึ่งไม่เคยเกิดขึ้นมาก่อน และตอนนี้เราได้เข้าสู่ยุคของคลาวด์และข้อมูลขนาดใหญ่ที่ซึ่งคลาวด์เป็นแพลตฟอร์มซึ่งเป็นโครงสร้างพื้นฐานการซื้อขายสินค้าโภคภัณฑ์จริง ๆ ดังนั้นเราจึงออกจากที่เคยเป็นมามันเป็นเรื่องของความจำเป็นในการใช้ศูนย์ข้อมูลขนาดใหญ่ เรามีความจุของคลาวด์ที่พร้อมใช้งานสำหรับเราและสอดคล้องกับข้อมูลขนาดใหญ่ที่เอริคมีอยู่คุณจึงพูดคุยอย่างละเอียด และโดยรวมเมื่อเราเห็นว่าการเปลี่ยนแปลงของเทคโนโลยีเกิดขึ้นมันกลายเป็นศูนย์กลางข้อมูลมากขึ้นเราใส่ใจกับข้อมูลมากขึ้น เช่นเดียวกับอินเทอร์เน็ตการแลกเปลี่ยนข้อมูลเป็นอย่างไร ด้วยข้อมูลขนาดใหญ่วีของตัวเองอย่างน้อยสี่ตัว

ในเวลาเดียวกันและที่สำคัญกว่านั้นกรณีการใช้งานทางธุรกิจก็เปลี่ยนไป เมื่อมีการนำคอมพิวเตอร์มาใช้เป็นครั้งแรกพวกเขาจะถูกใช้เพื่อทำให้เป็นอัตโนมัติเช่นหนังสือและบันทึก และทุกสิ่งที่เป็นกระบวนการแบบแมนนวลที่เกี่ยวข้องกับบัญชีแยกประเภทหรือสิ่งต่าง ๆ เช่นนั้นถูกตั้งโปรแกรมไว้ที่บ้าน สิ่งนั้นเปลี่ยนไปในยุค 80 เพื่อความพร้อมใช้งานของแพ็คเกจปฏิบัติงาน คุณไม่จำเป็นต้องเขียนบัญชีเงินเดือนของคุณเองอีกต่อไปคุณสามารถซื้อสิ่งที่ทำ ส่งผลให้มีการปรับลดขนาดใหญ่ในเวลาหรือการปรับโครงสร้างในแผนกไอทีจำนวนมาก แต่แล้วระบบธุรกิจอัจฉริยะด้วยสิ่งต่าง ๆ เช่นคลังข้อมูลปรากฏส่วนใหญ่ในยุค 90 ตามมาด้วยรูปแบบธุรกิจดอทคอมซึ่งแน่นอนว่ามันเป็นความบ้าคลั่งที่ยิ่งใหญ่ จากนั้น MDM ด้วย MDM คุณจะเริ่มเห็นว่าเราไม่ได้คิดเกี่ยวกับระบบอัตโนมัติ เราแค่มุ่งเน้นไปที่การดูแลข้อมูลเป็นข้อมูล จากนั้นทำการวิเคราะห์ซึ่งแสดงถึงมูลค่าที่คุณจะได้รับจากข้อมูล และภายในการวิเคราะห์คุณจะเห็น บริษัท ที่ประสบความสำเร็จอย่างมากซึ่งรูปแบบธุรกิจหลักหมุนรอบข้อมูล Google จะเป็นส่วนหนึ่งของสิ่งนั้น แต่คุณสามารถโต้เถียงได้ว่า Walmart คืออะไร

ตอนนี้ธุรกิจกำลังคิดถึงข้อมูลจริงๆ เราจะได้รับประโยชน์จากข้อมูลได้อย่างไร? ข้อมูลสามารถขับเคลื่อนธุรกิจกลยุทธ์และเราอยู่ในยุคทองของข้อมูลได้อย่างไร เมื่อพิจารณาแล้วสิ่งที่เกิดขึ้นในแง่ของสถาปัตยกรรมข้อมูลของเราหากข้อมูลไม่ได้รับการพิจารณาว่าเป็นเพียงความสิ้นเปลืองอีกต่อไปที่มาจากส่วนท้ายของแอปพลิเคชัน แต่เป็นศูนย์กลางของโมเดลธุรกิจของเราจริงๆ ส่วนหนึ่งของปัญหาที่เราประสบความสำเร็จคือไอทีติดอยู่กับวงจรชีวิตของการพัฒนาระบบซึ่งเป็นผลมาจากการที่ต้องจัดการอย่างรวดเร็วกับขั้นตอนการทำงานอัตโนมัติในยุคแรก ๆ ของไอทีและทำงานใน โครงการเป็นสิ่งที่คล้ายกัน สำหรับไอที - และนี่คือภาพล้อเลียนนิดหน่อย - แต่สิ่งที่ฉันพยายามจะพูดคืออุปสรรคบางประการในการรับสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจนั้นเป็นเพราะเรายอมรับวัฒนธรรมในด้านไอทีอย่างไร้เหตุผล ซึ่งเกิดขึ้นตั้งแต่อายุยังน้อย

ดังนั้นทุกอย่างเป็นโครงการ บอกรายละเอียดความต้องการของคุณให้ฉันฟัง หากสิ่งต่าง ๆ ไม่ทำงานอาจเป็นเพราะคุณไม่ได้บอกความต้องการของคุณ นั่นไม่ได้ผลกับข้อมูลในวันนี้เพราะเราไม่ได้เริ่มต้นด้วยกระบวนการที่ไม่ได้ทำเองโดยอัตโนมัติหรือคุณรู้ไหมการแปลงทางเทคนิคของกระบวนการทางธุรกิจเราเริ่มต้นบ่อยครั้งมากด้วยข้อมูลการผลิตที่มีอยู่แล้วที่เรากำลังพยายามอยู่ เพื่อรับคุณค่าจาก แต่ไม่มีใครที่สนับสนุนโครงการที่เน้นข้อมูลเป็นศูนย์กลางเข้าใจข้อมูลนั้นอย่างลึกซึ้ง เราต้องทำการค้นหาข้อมูลเราต้องทำการวิเคราะห์แหล่งข้อมูล และนั่นไม่ตรงกับการพัฒนาระบบจริง ๆ แล้วคุณรู้ไหมว่าวงจรชีวิตของ SDLC ซึ่ง Agile ที่ฉันจะรักษาไว้นั้นเป็นรุ่นที่ดีกว่า

และสิ่งที่กำลังมุ่งเน้นคือเทคโนโลยีและฟังก์ชั่นไม่ใช่ข้อมูล ตัวอย่างเช่นเมื่อเราทำการทดสอบในขั้นตอนการทดสอบปกติแล้วการทำงานของฉันจะเป็นเช่นนั้น ETL ของฉันจะพูด แต่เราจะไม่ทดสอบข้อมูล เราไม่ได้ทดสอบสมมติฐานของเราเกี่ยวกับแหล่งข้อมูลที่เข้ามาหากเราทำเราอาจจะมีรูปร่างที่ดีขึ้นและในฐานะคนที่ทำโครงการคลังข้อมูลและประสบกับการเปลี่ยนแปลงขั้นต้นทำให้ ETL ของฉันพัง และในความเป็นจริงสิ่งที่เราต้องการดูคือการทดสอบเป็นขั้นตอนเบื้องต้นในการตรวจสอบคุณภาพข้อมูลการผลิตอย่างต่อเนื่อง ดังนั้นเราจึงมีทัศนคติมากมายที่นี่เป็นเรื่องยากที่จะบรรลุสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจเพราะเราอยู่ภายใต้ยุคของกระบวนการเป็นศูนย์กลาง เราจำเป็นต้องเปลี่ยนไปใช้ข้อมูลเป็นศูนย์กลาง และนี่ไม่ใช่การเปลี่ยนแปลงโดยรวมคุณรู้ว่ายังมีกระบวนการทำงานอีกมากที่ต้องทำ แต่เราไม่ได้คิดในแง่ของข้อมูลเป็นศูนย์กลางเมื่อเราต้องการและสถานการณ์ที่เกิดขึ้นเมื่อเราจริง ๆ จำเป็นต้องทำเช่นนั้น

ตอนนี้ธุรกิจตระหนักถึงคุณค่าของข้อมูลพวกเขาต้องการปลดล็อกข้อมูลดังนั้นเราจะทำอย่างไร ดังนั้นเราจะทำการเปลี่ยนแปลงอย่างไร เราใส่ข้อมูลที่เป็นหัวใจของกระบวนการพัฒนา และเราปล่อยให้ผู้นำธุรกิจพร้อมด้วยข้อกำหนดด้านข้อมูล และเราเข้าใจว่าไม่มีใครเข้าใจแหล่งข้อมูลที่มีอยู่ในตอนเริ่มโครงการ คุณสามารถยืนยันได้ว่าโครงสร้างข้อมูลและข้อมูลนั้นมาถึงที่นั่นผ่านทางไอทีและการดำเนินงานตามลำดับดังนั้นเราจึงควรรู้ แต่จริงๆแล้วเราไม่ได้ทำ นี่คือการพัฒนาข้อมูลเป็นศูนย์กลาง ดังนั้นเราต้องคิดว่าเราทำที่ไหนและทำอย่างไรเราจะสร้างแบบจำลองข้อมูลในโลกของข้อมูลเป็นศูนย์กลางเราจะต้องมีข้อเสนอแนะลูปให้กับผู้ใช้ในแง่ของการปรับแต่งความต้องการข้อมูลของพวกเขาในขณะที่เราทำการค้นหาข้อมูล คาดการณ์การวิเคราะห์ข้อมูลต้นฉบับและในขณะที่เราค่อยๆได้รับความมั่นใจมากขึ้นเกี่ยวกับข้อมูลของเรา และตอนนี้ฉันกำลังพูดถึงโครงการแบบดั้งเดิมมากขึ้นเช่นฮับ MDM หรือคลังข้อมูลไม่จำเป็นต้องเป็นโครงการข้อมูลขนาดใหญ่ถึงแม้ว่าโครงการนี้จะยังอยู่ก็ตาม ดังนั้นลูปป้อนกลับเหล่านั้นจึงรวมตัวสร้างข้อมูลคุณค่อย ๆ พัฒนารูปแบบข้อมูลของพวกเขาและโต้ตอบกับผู้ใช้เพื่อให้แน่ใจว่าข้อกำหนดด้านข้อมูลได้รับการปรับปรุงตามสิ่งที่เป็นไปได้สิ่งที่มีอยู่จากแหล่งข้อมูลตามที่พวกเขาเข้าใจดีขึ้น มันไม่ใช่กรณีของรูปแบบข้อมูลอีกต่อไปคุณรู้ไหมว่าในสถานะที่ไม่ได้อยู่ที่นั่นหรือทำเสร็จสมบูรณ์มันค่อย ๆ นำมาซึ่งความสำคัญของมัน

ในทำนองเดียวกันยิ่งไปกว่านั้นเรายังมีการประกันคุณภาพที่เราพัฒนากฎสำหรับการทดสอบคุณภาพข้อมูลเพื่อให้แน่ใจว่าข้อมูลนั้นอยู่ในพารามิเตอร์ที่เราตั้งสมมติฐานไว้ เข้าไปข้างในเอริคหมายถึงการเปลี่ยนแปลงข้อมูลอ้างอิงซึ่งอาจเกิดขึ้น คุณไม่ต้องการเป็นผู้ตกเป็นเหยื่อของการเปลี่ยนแปลงที่ไม่มีการจัดการในพื้นที่ดังกล่าวดังนั้นกฎการประกันคุณภาพสามารถเข้าสู่กระบวนการหลังการผลิตการตรวจสอบคุณภาพข้อมูลอย่างต่อเนื่อง ดังนั้นคุณสามารถเริ่มต้นดูว่าเราจะเป็นศูนย์กลางของข้อมูลหรือไม่วิธีที่เราพัฒนา data-centric นั้นแตกต่างจาก SDLC และ Agile ที่มีฟังก์ชั่นการใช้งานค่อนข้างมาก จากนั้นเราก็ต้องใส่ใจกับมุมมองทางธุรกิจเช่นกัน เรามี - และสะท้อนสิ่งที่ Eric พูดอีกครั้ง - เรามีตัวแบบข้อมูลที่กำหนด data story blue สำหรับฐานข้อมูลของเรา แต่ในขณะเดียวกันเราต้องการตัวแบบแนวคิดเหล่านั้นมุมมองทางธุรกิจของข้อมูลที่ยังไม่ได้ทำ ที่ผ่านมา. บางครั้งเราคิดว่าคิดว่าแบบจำลองข้อมูลสามารถทำได้ทั้งหมด แต่เราจำเป็นต้องมีมุมมองแนวคิดความหมายและดูข้อมูลทำให้มันผ่านเลเยอร์นามธรรมซึ่งแปลโมเดลการจัดเก็บข้อมูลเป็นธุรกิจ ดู. และอีกครั้งทุกสิ่งที่ Eric กำลังพูดถึงในแง่ของความหมายกลายเป็นสิ่งสำคัญที่จะทำเช่นนั้นดังนั้นเราจึงมีงานสร้างแบบจำลองเพิ่มเติม ฉันคิดว่านั่นน่าสนใจถ้าคุณได้รับการจัดอันดับในฐานะผู้สร้างแบบจำลองข้อมูลอย่างที่ฉันทำและสิ่งใหม่ ๆ

และในที่สุดฉันก็อยากจะบอกว่าสถาปัตยกรรมที่ใหญ่กว่านั้นก็ต้องสะท้อนความเป็นจริงใหม่นี้เช่นกัน ตัวอย่างเช่นลูกค้าเก่า MDM เป็นประเภทโอเคให้ได้รับข้อมูลลูกค้าของเราเป็นศูนย์กลางที่เราสามารถรับรู้ได้ในแง่ของคุณภาพข้อมูลสำหรับแอปพลิเคชันแบ็คออฟฟิศ ซึ่งจากมุมมองกลยุทธ์ทางธุรกิจเป็นชนิดของหาว อย่างไรก็ตามในวันนี้เรากำลังดูฮับ MDM ของลูกค้าที่มีข้อมูลโปรไฟล์ลูกค้าเพิ่มเติมในพวกเขาไม่ใช่แค่ข้อมูลคงที่ซึ่งจะมีส่วนต่อประสานสองทิศทางกับแอปพลิเคชันธุรกรรมของลูกค้า ใช่พวกเขายังคงสนับสนุน back office แต่ตอนนี้เรารู้เกี่ยวกับพฤติกรรมเหล่านี้ของลูกค้าของเราเช่นกัน นี่มันแพงกว่าการสร้าง นี่คือการสร้างที่ซับซ้อนมากขึ้น แต่ขับเคลื่อนด้วยธุรกิจในลักษณะที่ MDM ลูกค้าดั้งเดิมไม่ได้เป็น คุณกำลังปิดการวางแนวธุรกิจกับการออกแบบที่เรียบง่ายซึ่งง่ายต่อการใช้งาน แต่สำหรับธุรกิจนี่คือสิ่งที่พวกเขาต้องการเห็น เราอยู่ในยุคใหม่จริงๆและฉันคิดว่ามีหลายระดับที่เราต้องตอบสนองต่อสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจและฉันคิดว่ามันเป็นเวลาที่น่าตื่นเต้นมากที่จะทำสิ่งต่างๆ

ดังนั้นขอขอบคุณกลับไปหาคุณรีเบคก้า

รีเบคก้า Jozwiak: ขอบคุณ Malcolm และฉันสนุกกับสิ่งที่คุณพูดเกี่ยวกับแบบจำลองข้อมูลจะต้องดึงความเห็นทางธุรกิจเพราะสิ่งที่คุณพูดนั้นแตกต่างจากที่คุณพูดที่ซึ่งไอทีกุมบังเหียนมานานและมันก็ไม่ใช่กรณีนั้นอีกต่อไปและวัฒนธรรม ไม่จำเป็นต้องเปลี่ยน และฉันค่อนข้างมั่นใจว่ามีสุนัขอยู่เบื้องหลังที่เห็นด้วยกับคุณ 100% และด้วยการที่ฉันจะส่งบอลให้รอน ฉันตื่นเต้นมากที่จะได้เห็นตัวอย่างของคุณ รอนพื้นเป็นของคุณ

Ron Huizenga: ขอบคุณมากและก่อนที่เราจะกระโดดลงไปฉันจะผ่านสไลด์สองสามครั้งและจากนั้นตัวอย่างเล็กน้อยเพราะเอริคและมัลคอล์มชี้ให้เห็นว่านี่เป็นหัวข้อที่กว้างและลึกมากและกับสิ่งที่เรา เรากำลังพูดถึงวันนี้เราแค่ขูดพื้นผิวของมันเพราะมีหลายด้านและหลายสิ่งหลายอย่างที่เราต้องพิจารณาและมองจากสถาปัตยกรรมที่ขับเคลื่อนด้วยธุรกิจ และวิธีการของเราคือการสร้างมูลค่าที่แท้จริงจากโมเดลให้เป็นจริงเพราะคุณสามารถใช้มันเป็นยานพาหนะในการสื่อสารเช่นเดียวกับเลเยอร์เพื่อเปิดใช้งานระบบอื่น ๆ ไม่ว่าคุณกำลังทำสถาปัตยกรรมที่มุ่งเน้นการบริการหรือสิ่งอื่น ๆ แบบจำลองจะกลายเป็นสัดส่วนหลักของสิ่งที่เกิดขึ้นด้วยข้อมูลเมตาทั้งหมดที่อยู่รอบ ๆ และข้อมูลที่คุณมีในธุรกิจของคุณ

แม้ว่าสิ่งที่ฉันต้องการจะพูดคือเกือบจะก้าวถอยหลังไปแล้วเพราะมัลคอล์มได้สัมผัสกับประวัติความเป็นมาของวิธีการแก้ปัญหาที่มีวิวัฒนาการและประเภทของสิ่งนั้น วิธีหนึ่งที่จะชี้ให้เห็นถึงความสำคัญของการมีสถาปัตยกรรมข้อมูลเสียงเป็นกรณีการใช้งานที่ฉันเคยพบบ่อยเมื่อฉันปรึกษาก่อนที่จะเข้ามามีบทบาทในการจัดการผลิตภัณฑ์และนั่นคือฉันจะเข้าสู่องค์กร ไม่ว่าพวกเขาจะทำการเปลี่ยนแปลงทางธุรกิจหรือเพียงแค่แทนที่ระบบที่มีอยู่แล้วและสิ่งนั้น ๆ และมันก็เห็นได้อย่างรวดเร็วว่าองค์กรยากจนเข้าใจข้อมูลของตัวเองได้อย่างไร หากคุณใช้กรณีการใช้งานเฉพาะอย่างเช่นกรณีนี้ไม่ว่าคุณจะเป็นที่ปรึกษาหรืออาจเป็นบุคคลที่เพิ่งเริ่มต้นกับองค์กรหรือองค์กรของคุณได้รับการสร้างขึ้นในช่วงหลายปีที่ผ่านมาด้วยการซื้อ บริษัท ที่แตกต่างกัน ขึ้นกับสภาพแวดล้อมที่ซับซ้อนมากอย่างรวดเร็วด้วยจำนวนของเทคโนโลยีที่แตกต่างกันใหม่เช่นเดียวกับเทคโนโลยีแบบดั้งเดิมโซลูชั่น ERP และทุกอย่างอื่น

ดังนั้นสิ่งหนึ่งที่เราสามารถทำได้จริง ๆ ด้วยวิธีการสร้างแบบจำลองของเราคือการตอบคำถามว่าฉันจะเข้าใจเรื่องทั้งหมดนี้ได้อย่างไร? เราสามารถเริ่มรวบรวมข้อมูลเข้าด้วยกันเพื่อให้ธุรกิจสามารถใช้ประโยชน์จากข้อมูลที่เรามีอย่างถูกต้อง และมันออกมาเป็นสิ่งที่เรามีอยู่ในสภาพแวดล้อมเหล่านั้น? ฉันจะใช้โมเดลเพื่อขับเคลื่อนข้อมูลที่ฉันต้องการและเข้าใจข้อมูลนั้นดีกว่าได้อย่างไร จากนั้นเราก็มีข้อมูลเมตาแบบดั้งเดิมสำหรับสิ่งต่าง ๆ ทั้งหมดเช่นแบบจำลองข้อมูลเชิงสัมพันธ์และเราเคยเห็นสิ่งต่าง ๆ เช่นคำจำกัดความและพจนานุกรมข้อมูลคุณรู้ประเภทข้อมูลและประเภทของสิ่งนั้น แต่แล้วข้อมูลเมตาเพิ่มเติมที่คุณต้องการจับเพื่อให้ความหมายมากกว่านั้นจริงๆ เช่นเอนทิตีที่เป็นตัวเลือกจริง ๆ ที่ควรเป็นออบเจ็กต์ข้อมูลอ้างอิงซึ่งควรเป็นออบเจ็กต์การจัดการข้อมูลหลักและประเภทของสิ่งเหล่านั้นและรวมเข้าด้วยกัน และข้อมูลไหลผ่านองค์กรอย่างไร ข้อมูลไหลจากการที่พวกเขาบริโภคจากมุมมองกระบวนการ แต่ยังรวมถึงสายดาต้าในแง่ของการเดินทางของข้อมูลผ่านธุรกิจของเราและวิธีที่มันทำผ่านระบบต่าง ๆ หรือผ่านแหล่งข้อมูลดังนั้นเราจึงรู้ เมื่อเราสร้างโซลูชัน I หรือสิ่งต่าง ๆ เหล่านั้นเรากำลังใช้ข้อมูลที่ถูกต้องสำหรับงานที่ทำอยู่

และที่สำคัญมากคือเราจะทำให้ผู้มีส่วนได้ส่วนเสียทั้งหมดร่วมมือกันได้อย่างไรและโดยเฉพาะอย่างยิ่งผู้มีส่วนได้เสียทางธุรกิจเพราะพวกเขาเป็นคนที่ให้ความหมายที่แท้จริงแก่เราว่าข้อมูลนั้นคืออะไร ธุรกิจ ณ สิ้นวันเป็นเจ้าของข้อมูล พวกเขาให้คำจำกัดความสำหรับคำศัพท์และสิ่งต่าง ๆ ที่เอริคพูดถึงดังนั้นเราจึงจำเป็นต้องมีที่สำหรับผูกทั้งหมดไว้ด้วยกัน และวิธีที่เราทำคือการสร้างแบบจำลองข้อมูลและสถาปัตยกรรมพื้นที่เก็บข้อมูลของเรา

ฉันจะสัมผัสบางสิ่ง ฉันจะพูดเกี่ยวกับ ER / Studio Enterprise Team Edition โดยพื้นฐานแล้วฉันจะพูดถึงผลิตภัณฑ์สถาปัตยกรรมข้อมูลที่เราทำการสร้างแบบจำลองข้อมูลและสิ่งประเภทนั้น แต่มีส่วนประกอบอื่น ๆ อีกมากมายของชุดที่ฉันจะได้สัมผัสในเวลาสั้น ๆ คุณจะเห็นตัวอย่างหนึ่งของสถาปนิกธุรกิจซึ่งเราสามารถทำแบบจำลองแนวคิด แต่เราสามารถทำแบบจำลองกระบวนการทางธุรกิจและเราสามารถผูกแบบจำลองกระบวนการเหล่านั้นเข้ากับลิงก์ข้อมูลจริงที่เรามีในแบบจำลองข้อมูลของเรา มันช่วยให้เรานำเนคไทนั้นมารวมกัน ผู้ออกแบบซอฟต์แวร์อนุญาตให้เราสร้างสิ่งก่อสร้างเพิ่มเติมเช่นการสร้างแบบจำลอง UML บางประเภทและสิ่งต่าง ๆ เหล่านั้นเพื่อให้การสนับสนุน logics แก่ระบบและกระบวนการอื่น ๆ ที่เรากำลังพูดถึง แต่ที่สำคัญอย่างยิ่งเมื่อเราเลื่อนลงมาเรามีที่เก็บข้อมูลและเซิร์ฟเวอร์ทีมและฉันจะพูดถึงสิ่งนั้นในฐานะที่เป็นสองเท่าของสิ่งเดียวกัน พื้นที่เก็บข้อมูลเป็นที่ที่เราจัดเก็บข้อมูลเมตาดาต้าที่มีรูปแบบทั้งหมดรวมทั้งข้อมูลเมตาธุรกิจทั้งหมดในแง่ของอภิธานศัพท์ทางธุรกิจและข้อกำหนด และเนื่องจากเรามีสภาพแวดล้อมแบบอิงพื้นที่เก็บข้อมูลเราจึงสามารถเชื่อมต่อสิ่งต่าง ๆ เหล่านี้ทั้งหมดเข้าด้วยกันในสภาพแวดล้อมเดียวกันนั้นและจากนั้นเราสามารถทำให้สิ่งเหล่านั้นพร้อมสำหรับการบริโภคได้ไม่เพียง แต่สำหรับคนทางด้านเทคนิคเท่านั้น และนั่นคือวิธีที่เราเริ่มผลักดันการทำงานร่วมกัน

และสิ่งสุดท้ายที่ฉันจะพูดถึงก็คือเมื่อคุณเดินเข้าไปในสภาพแวดล้อมเหล่านี้ไม่ใช่เพียงแค่ฐานข้อมูลที่คุณมีอยู่ คุณจะมีฐานข้อมูลจำนวนมากที่เก็บข้อมูลคุณจะมีจำนวนมากสิ่งที่ฉันจะเรียกว่าสิ่งประดิษฐ์ดั้งเดิม บางทีคนอาจใช้ Visio หรือไดอะแกรมอื่น ๆ เพื่อทำแผนที่สิ่งต่าง ๆ บางทีพวกเขาอาจมีเครื่องมือสร้างแบบจำลองอื่น ๆ และสิ่งนั้นดังนั้นสิ่งที่เราสามารถทำได้กับ MetaWizard นั้นจะดึงข้อมูลบางส่วนนั้นและนำมาไว้ในแบบจำลองของเราทำให้เป็นปัจจุบันและสามารถใช้งานได้บริโภคในแบบปัจจุบันอีกครั้งแทนที่จะแค่นั่งอยู่ตรงนั้น ตอนนี้มันกลายเป็นส่วนหนึ่งของแบบจำลองการทำงานของเราซึ่งสำคัญมาก

เมื่อคุณเดินเข้าไปในองค์กรอย่างที่ฉันพูดระบบที่แตกต่างออกไปจำนวนมากมีโซลูชัน ERP จำนวนมากโซลูชันของแผนกที่ไม่ตรงกัน หลายองค์กรกำลังใช้โซลูชัน SaaS ซึ่งควบคุมและจัดการจากภายนอกด้วยดังนั้นเราจึงไม่ควบคุมฐานข้อมูลและสิ่งต่าง ๆ เหล่านั้นในโฮสต์บนโฮสต์เหล่านั้น แต่เรายังจำเป็นต้องทราบว่าข้อมูลนั้นมีลักษณะอย่างไรและแน่นอน ข้อมูลเมตาที่อยู่รอบ ๆ สิ่งที่เราพบคือระบบมรดกที่ล้าสมัยจำนวนมากที่ยังไม่ได้รับการกำจัดเพราะวิธีการใช้โครงการที่มัลคอล์มเคยพูดถึง เป็นเรื่องที่น่าอัศจรรย์ว่าองค์กรต่างๆจะหมุนเวียนโครงการในช่วงไม่กี่ปีที่ผ่านมาพวกเขาจะแทนที่ระบบหรือโซลูชัน แต่มีงบประมาณโครงการไม่เพียงพอที่จะเหลือไว้สำหรับการรื้อถอนโซลูชันที่ล้าสมัยดังนั้นตอนนี้พวกเขากำลังเข้าใกล้ และเราต้องหาสิ่งที่เราสามารถกำจัดได้จริงในสภาพแวดล้อมของเรารวมถึงสิ่งที่เป็นประโยชน์ต่อไป และนั่นก็เชื่อมโยงกับกลยุทธ์การรื้อถอนที่ไม่ดี นั่นเป็นส่วนหนึ่งและพัสดุของสิ่งเดียวกัน

สิ่งที่เราค้นพบเพราะมีองค์กรจำนวนมากที่ถูกสร้างขึ้นจากโซลูชันที่แตกต่างกันทั้งหมดนี้คือเราเห็นอินเทอร์เฟซแบบจุดต่อจุดจำนวนมากที่มีข้อมูลจำนวนมากเคลื่อนย้ายไปมาในหลาย ๆ ที่ เราจำเป็นต้องสามารถหาเหตุผลเข้าข้างตนเองและหาว่าสายข้อมูลที่ฉันพูดถึงมาก่อนเพื่อให้เราสามารถมีกลยุทธ์ที่เหนียวแน่นมากขึ้นเช่นการใช้สถาปัตยกรรมที่มุ่งเน้นบริการรถบัสบริการขององค์กรและสิ่งต่าง ๆ เหล่านั้นเพื่อส่งข้อมูลที่ถูกต้อง ในรูปแบบการเผยแพร่และสมัครสมาชิกที่เราใช้อย่างถูกต้องทั่วธุรกิจของเรา และแน่นอนว่าเรายังต้องทำการวิเคราะห์บางประเภทไม่ว่าเราจะใช้คลังข้อมูลดาต้ามาร์ทกับ ETL แบบดั้งเดิมหรือใช้ชลข้อมูลใหม่บางส่วน ทุกอย่างลงมาในสิ่งเดียวกัน มันคือข้อมูลทั้งหมดไม่ว่าจะเป็นข้อมูลขนาดใหญ่ไม่ว่าจะเป็นข้อมูลดั้งเดิมในฐานข้อมูลเชิงสัมพันธ์เราจำเป็นต้องรวบรวมข้อมูลทั้งหมดเข้าด้วยกันเพื่อให้เราสามารถจัดการและรู้ว่าเรากำลังทำอะไรกับโมเดลของเรา

อีกครั้งความซับซ้อนที่เรากำลังจะทำคือเรามีหลายขั้นตอนที่เราต้องการจะทำ ก่อนอื่นคุณเดินเข้ามาและคุณอาจจะไม่ได้รู้ว่าภูมิทัศน์ข้อมูลนั้นเป็นอย่างไร ในเครื่องมือสร้างแบบจำลองข้อมูลเช่น ER / Studio Data Architect คุณจะต้องทำวิศวกรรมย้อนกลับเป็นจำนวนมากในแง่ของการชี้ไปที่แหล่งข้อมูลที่อยู่ข้างนอกนำพวกเขาเข้าด้วยกัน แบบจำลองที่แสดงถึงธุรกิจทั้งหมด สิ่งสำคัญคือเราต้องการที่จะย่อยสลายแบบจำลองเหล่านั้นเช่นกันตามสายธุรกิจเพื่อให้เราสามารถเชื่อมโยงกับพวกมันในกลุ่มเล็ก ๆ ซึ่งนักธุรกิจของเราสามารถเกี่ยวข้องและนักวิเคราะห์ธุรกิจและผู้มีส่วนได้เสียอื่น ๆ ที่ทำงานอยู่ บนมัน

มาตรฐานการตั้งชื่อมีความสำคัญอย่างยิ่งและฉันกำลังพูดถึงเรื่องนี้ในสองสามวิธีที่แตกต่างกันที่นี่ มาตรฐานการตั้งชื่อในแง่ของวิธีที่เราตั้งชื่อสิ่งต่าง ๆ ในแบบจำลองของเรา มันค่อนข้างง่ายที่จะทำในแบบจำลองเชิงตรรกะที่เรามีแบบแผนการตั้งชื่อที่ดีและพจนานุกรมข้อมูลที่ดีสำหรับแบบจำลองของเรา แต่จากนั้นเราจะเห็นแบบแผนการตั้งชื่อแบบต่าง ๆ สำหรับแบบจำลองทางกายภาพเหล่านี้จำนวนมากที่เรานำเข้ามา วิศวกรรมย้อนกลับบ่อยครั้งที่เราเห็นชื่อย่อและสิ่งที่ฉันจะพูดถึง และเราจำเป็นต้องแปลชื่อเหล่านั้นกลับเป็นชื่อภาษาอังกฤษที่มีความหมายซึ่งมีความหมายต่อธุรกิจเพื่อให้เราสามารถเข้าใจว่าชิ้นข้อมูลเหล่านี้คืออะไรที่เรามีในสภาพแวดล้อม แล้วการแมปสากลก็คือวิธีที่เรารวมมันเข้าด้วยกัน

นอกเหนือจากนั้นเราจะจัดทำเอกสารและกำหนดเพิ่มเติมและนั่นคือสิ่งที่เราสามารถจำแนกข้อมูลของเราเพิ่มเติมด้วยสิ่งที่เรียกว่า Attachments ซึ่งเราจะแสดงสไลด์ให้คุณดู จากนั้นปิดวงเราต้องการใช้ความหมายทางธุรกิจนั้นซึ่งเป็นที่ที่เราผูกไว้ในอภิธานศัพท์ทางธุรกิจของเราและสามารถเชื่อมโยงมันกับสิ่งประดิษฐ์รูปแบบที่แตกต่างกันของเราดังนั้นเรารู้เมื่อเราพูดถึงคำศัพท์ทางธุรกิจ ดำเนินการในข้อมูลของเราทั่วทั้งองค์กร และสุดท้ายนี้ฉันได้พูดคุยเกี่ยวกับความจริงที่ว่าเราต้องการทั้งหมดนี้เพื่อเป็นพื้นที่เก็บข้อมูลที่มีการทำงานร่วมกันและความสามารถในการเผยแพร่จำนวนมากดังนั้นผู้มีส่วนได้เสียของเราจึงสามารถใช้ประโยชน์ได้ ฉันจะพูดเกี่ยวกับวิศวกรรมย้อนกลับอย่างรวดเร็วพอสมควร ฉันได้ให้ความสำคัญกับคุณอย่างรวดเร็วแล้ว ฉันจะแสดงให้คุณเห็นในตัวอย่างจริงเพื่อแสดงให้คุณเห็นบางสิ่งที่เราสามารถนำเข้าไปได้

และฉันต้องการพูดคุยเกี่ยวกับรูปแบบและไดอะแกรมต่าง ๆ ที่เราจะผลิตในสถานการณ์ประเภทนี้ เห็นได้ชัดว่าเราจะทำแบบจำลองแนวคิดในหลายกรณี ฉันจะไม่ใช้เวลามากกับเรื่องนั้น ฉันต้องการพูดคุยเกี่ยวกับแบบจำลองเชิงตรรกะแบบจำลองทางกายภาพและแบบจำลองชนิดพิเศษที่เราสามารถสร้างได้ และเป็นสิ่งสำคัญที่เราสามารถสร้างสิ่งเหล่านี้ทั้งหมดในแพลตฟอร์มการสร้างแบบจำลองเดียวกันเพื่อให้เราสามารถรวมเข้าด้วยกัน ซึ่งรวมถึงโมเดลมิติและโมเดลที่ใช้แหล่งข้อมูลใหม่บางส่วนเช่น NoSQL ที่ฉันจะแสดงให้คุณเห็น แล้วโมเดลเชื้อสายข้อมูลมีหน้าตาเป็นอย่างไร? และเราจะรวมข้อมูลนั้นเป็นแบบจำลองกระบวนการทางธุรกิจได้อย่างไรสิ่งที่เราจะพูดถึงต่อไป

ฉันจะเปลี่ยนไปใช้สภาพแวดล้อมการสร้างแบบจำลองที่นี่เพียงเพื่อให้ภาพรวมที่สูงและรวดเร็วมาก และฉันเชื่อว่าคุณน่าจะเห็นหน้าจอของฉันได้แล้ว ก่อนอื่นฉันต้องการพูดคุยเกี่ยวกับตัวแบบข้อมูลแบบดั้งเดิม และวิธีที่เราต้องการจัดระเบียบแบบจำลองเมื่อเรานำมันเข้ามาคือเราต้องการที่จะย่อยสลายมัน ดังนั้นสิ่งที่คุณเห็นที่นี่ทางด้านซ้ายมือคือเรามีโมเดลเชิงตรรกะและแบบฟิสิคัลในไฟล์โมเดลนี้โดยเฉพาะ สิ่งต่อไปคือเราสามารถแยกย่อยสลายไปตามการย่อยสลายทางธุรกิจดังนั้นนั่นคือสาเหตุที่คุณเห็นโฟลเดอร์ สีฟ้าอ่อนเป็นแบบจำลองเชิงตรรกะและสีเขียวเป็นแบบจำลองทางกายภาพ และเรายังสามารถเจาะลึกได้ดังนั้นภายใน ER / Studio หากคุณมีการสลายตัวทางธุรกิจคุณสามารถไปที่ระดับลึกหรือโมเดลย่อยได้มากเท่าที่คุณต้องการและการเปลี่ยนแปลงที่คุณทำในระดับต่ำจะสะท้อนให้เห็นถึงระดับที่สูงขึ้นโดยอัตโนมัติ ระดับ ดังนั้นมันจึงกลายเป็นสภาพแวดล้อมการสร้างแบบจำลองที่ทรงพลังอย่างรวดเร็ว

สิ่งที่ฉันต้องการชี้ให้เห็นว่าสิ่งที่สำคัญมากในการเริ่มดึงข้อมูลนี้เข้าด้วยกันคือเราสามารถมีแบบจำลองทางกายภาพหลายรูปแบบที่สอดคล้องกับแบบจำลองตรรกะหนึ่งเช่นกัน บ่อยครั้งที่คุณอาจมีแบบจำลองเชิงตรรกะ แต่คุณอาจมีแบบจำลองทางกายภาพบนแพลตฟอร์มที่แตกต่างกันและประเภทของสิ่งนั้น อาจเป็นหนึ่งในอินสแตนซ์ของ SQL Server หรืออาจเป็นอีกอินสแตนซ์ของ Oracle เรามีความสามารถในการเชื่อมโยงทั้งหมดเข้าด้วยกันในสภาพแวดล้อมการสร้างแบบจำลองเดียวกัน สิ่งที่ฉันได้ที่นี่คือโมเดลคลังข้อมูลจริงที่สามารถทำได้อีกครั้งอยู่ในสภาพแวดล้อมการสร้างแบบจำลองเดียวกันหรือเราสามารถเก็บไว้ในที่เก็บและเชื่อมโยงกับสิ่งต่าง ๆ ได้เช่นกัน

สิ่งที่ฉันต้องการแสดงให้คุณเห็นในเรื่องนี้คือสิ่งอื่น ๆ และรูปแบบอื่น ๆ ของโมเดลที่เราเข้าร่วม ดังนั้นเมื่อเราเข้าสู่โมเดลข้อมูลแบบดั้งเดิมเช่นนี้เราจะเคยเห็นเอนทิตีทั่วไปที่มีคอลัมน์และเมตาดาต้าและประเภทของสิ่งนั้น แต่มุมมองนั้นแตกต่างกันอย่างรวดเร็วเมื่อเราเริ่มจัดการกับเทคโนโลยี NoSQL ที่ใหม่กว่าเหล่านี้ หรือเป็นบางคนที่ยังคงต้องการเรียกพวกเขาว่าเป็นเทคโนโลยีข้อมูลขนาดใหญ่

ดังนั้นตอนนี้สมมติว่าเราได้รับ Hive ในสภาพแวดล้อมของเราแล้ว หากเราย้อนกลับวิศวกรจากสภาพแวดล้อม Hive และเราสามารถส่งต่อและย้อนกลับวิศวกรรมจาก Hive ด้วยเครื่องมือสร้างแบบจำลองที่เหมือนกันนี้เราจะเห็นสิ่งที่แตกต่างกันเล็กน้อย เรายังคงเห็นข้อมูลทั้งหมดตามที่สร้างไว้ แต่ TDL ของเราแตกต่างกัน พวกคุณที่เคยเห็น SQL สิ่งที่คุณจะเห็นในตอนนี้คือ Hive QL ซึ่งคล้ายกับ SQL มาก แต่ใช้เครื่องมือเดียวกับที่คุณสามารถเริ่มทำงานกับภาษาสคริปต์ที่แตกต่างกันได้ ดังนั้นคุณสามารถสร้างแบบจำลองในสภาพแวดล้อมนี้สร้างมันออกมาในสภาพแวดล้อม Hive แต่ที่สำคัญในสถานการณ์ที่ฉันได้อธิบายไว้คุณสามารถย้อนกลับวิศวกรรมทั้งหมดเข้าด้วยกันและทำความเข้าใจกับมันและเริ่มต่อเข้าด้วยกันเช่นกัน .

มาลองอีกอันที่แตกต่างกันหน่อย MongoDB เป็นอีกแพลตฟอร์มหนึ่งที่เราให้การสนับสนุน และเมื่อคุณเริ่มเข้าสู่สภาพแวดล้อมประเภท JSON ที่คุณมีร้านขายเอกสาร JSON เป็นสัตว์ที่แตกต่างกันและมีโครงสร้างในสิ่งนั้นซึ่งไม่สอดคล้องกับแบบจำลองเชิงสัมพันธ์ ในไม่ช้าคุณจะเริ่มจัดการกับแนวคิดเช่นวัตถุฝังตัวและอาร์เรย์ของวัตถุที่ฝังตัวเมื่อคุณเริ่มซักถาม JSON และแนวคิดเหล่านั้นไม่มีอยู่ในสัญกรณ์เชิงสัมพันธ์แบบดั้งเดิม สิ่งที่เราทำที่นี่คือเราได้ขยายสัญลักษณ์และแคตาล็อกของเราเพื่อให้สามารถจัดการกับมันในสภาพแวดล้อมเดียวกัน

หากคุณมองไปทางซ้ายตรงนี้แทนที่จะมองสิ่งต่าง ๆ เช่นเอนทิตีและตารางเราเรียกมันว่าวัตถุ และคุณเห็นสัญลักษณ์ต่าง ๆ คุณยังคงเห็นรูปแบบการอ้างอิงทั่วไปที่นี่ แต่เอนทิตีสีน้ำเงินที่ฉันแสดงในแผนภาพนี้เป็นวัตถุฝังตัวจริง ๆ และเราแสดงความสำคัญต่าง ๆ กัน cardinality เพชรหมายถึงว่ามันเป็นวัตถุที่ปลายด้านหนึ่ง แต่ความสำคัญของหนึ่งในนั้นหมายถึงว่าเรามีภายในผู้เผยแพร่ถ้าเราทำตามความสัมพันธ์นั้นเรามีวัตถุที่อยู่ฝังตัว ในการซักถาม JSON เราพบว่ามันเป็นโครงสร้างของวัตถุที่ฝังอยู่ในผู้อุปถัมภ์ แต่จริงๆแล้วมันฝังตัวเป็นอาร์เรย์ของวัตถุ เราเห็นว่าไม่เพียง แต่ผ่านตัวเชื่อมต่อเท่านั้น แต่ถ้าคุณดูเอนทิตีที่แท้จริงคุณจะเห็นว่าคุณเห็นที่อยู่ภายใต้ผู้มีพระคุณซึ่งจัดเป็นอาร์เรย์ของวัตถุด้วย คุณได้รับมุมมองที่สื่อความหมายอย่างมากว่าคุณจะนำสิ่งนั้นเข้ามาได้อย่างไร

และอีกครั้งตอนนี้สิ่งที่เราเห็นในไม่กี่วินาทีก็คือโมเดลเชิงสัมพันธ์ดั้งเดิมที่มีหลายระดับเราสามารถทำสิ่งเดียวกันกับ Hive ได้เราสามารถทำสิ่งเดียวกันกับ MongoDB และแหล่งข้อมูลขนาดใหญ่อื่น ๆ เช่น ดี. สิ่งที่เราสามารถทำได้และฉันจะแสดงให้คุณเห็นอย่างรวดเร็วนี้คือฉันพูดคุยเกี่ยวกับความจริงของการนำสิ่งต่าง ๆ มาจากพื้นที่อื่น ๆ ฉันจะสมมติว่าฉันกำลังจะนำเข้าโมเดลจากฐานข้อมูลหรือวิศวกรรมย้อนกลับ แต่ฉันจะนำมันมาจากข้อมูลเมตาภายนอก เพียงเพื่อให้คุณได้รับมุมมองที่รวดเร็วของสิ่งต่าง ๆ ที่เราสามารถนำเข้ามาได้

อย่างที่คุณเห็นเรามีสิ่งต่าง ๆ มากมายที่เราสามารถนำข้อมูลเมตามาสู่สภาพแวดล้อมการสร้างแบบจำลองของเรา เริ่มจากสิ่งต่าง ๆ เช่น Amazon Redshift, Cassandra, แพลตฟอร์มข้อมูลขนาดใหญ่อื่น ๆ มากมายดังนั้นคุณจะเห็นรายการเหล่านี้มากมาย นี่คือตามลำดับตัวอักษร เราเห็นแหล่งข้อมูลขนาดใหญ่จำนวนมากและสิ่งนั้น ๆ นอกจากนี้เรายังเห็นสภาพแวดล้อมการสร้างแบบจำลองแบบดั้งเดิมหรือแบบเก่าจำนวนมากซึ่งเราสามารถนำข้อมูลเมตานั้นผ่าน หากฉันไปถึงที่นี่ - และฉันจะไม่ใช้เวลากับพวกเขาทุกคน - เราเห็นสิ่งต่าง ๆ มากมายที่เราสามารถนำมาได้จากในแง่ของการสร้างแบบจำลองแพลตฟอร์มและแพลตฟอร์มข้อมูล และสิ่งที่สำคัญมากที่ต้องตระหนักถึงที่นี่ก็เป็นอีกส่วนหนึ่งที่เราสามารถทำได้เมื่อเราเริ่มพูดคุยเกี่ยวกับ data lineage ใน Enterprise Team Edition เราสามารถสอบถามแหล่ง ETL ได้ไม่ว่าจะเป็นการแมป Talend หรือ SQL Server Information Services เราสามารถ ที่จริงแล้วนำมาใช้ในการเริ่มแผนภาพสายดาต้าของเราเช่นกันและวาดภาพของสิ่งที่เกิดขึ้นในการเปลี่ยนแปลงเหล่านั้น โดยสิ้นเชิงจากกล่องเรามีสะพานที่แตกต่างกันกว่า 130 แห่งซึ่งเป็นส่วนหนึ่งของผลิตภัณฑ์ Enterprise Team Edition ดังนั้นจริง ๆ แล้วมันช่วยให้เราสามารถรวบรวมสิ่งประดิษฐ์ทั้งหมดในสภาพแวดล้อมแบบจำลองเดียวได้อย่างรวดเร็ว

ท้ายสุด แต่ไม่ท้ายสุดฉันต้องการพูดคุยเกี่ยวกับความจริงที่ว่าเราไม่สามารถมองเห็นความจริงที่ว่าเราต้องการสิ่งก่อสร้างประเภทอื่นหากเรากำลังทำคลังข้อมูลหรือการวิเคราะห์ประเภทใด ๆ เรายังต้องการมีความสามารถในการทำสิ่งต่าง ๆ เช่นแบบจำลองมิติที่เรามีตารางข้อเท็จจริงและเรามีมิติและสิ่งต่าง ๆ เหล่านั้น สิ่งหนึ่งที่ฉันต้องการแสดงให้คุณเห็นเช่นกันคือเราสามารถมีส่วนขยายไปยังข้อมูลเมตาของเราที่ช่วยให้เราจัดหมวดหมู่ประเภทของมิติข้อมูลและทุกอย่างอื่น ดังนั้นหากฉันดูที่แท็บข้อมูลมิติที่นี่ตัวอย่างหนึ่งมันจะตรวจจับโดยอัตโนมัติตามรูปแบบของโมเดลที่เห็นและให้จุดเริ่มต้นว่าคุณคิดว่ามันเป็นมิติหรือ ตารางข้อเท็จจริง แต่นอกเหนือจากนั้นสิ่งที่เราสามารถทำได้คือภายในมิติและประเภทของสิ่งนั้นเรายังมีมิติประเภทต่าง ๆ ที่เราสามารถใช้เพื่อจำแนกข้อมูลในสภาพแวดล้อมประเภทคลังข้อมูลด้วย ความสามารถที่ทรงพลังมาก ๆ ที่เรากำลังเย็บเข้าด้วยกัน

ฉันจะกระโดดเข้ามาในนี้ตั้งแต่ฉันอยู่ในสภาพแวดล้อมการสาธิตในขณะนี้และแสดงให้คุณเห็นสองสามอย่างก่อนที่ฉันจะกระโดดกลับไปที่สไลด์ หนึ่งในสิ่งที่เราเพิ่งเพิ่มลงใน ER / Studio Data Architect คือเราพบสถานการณ์ - และนี่เป็นกรณีการใช้งานทั่วไปเมื่อคุณทำงานในโครงการ - นักพัฒนาคิดในแง่ของวัตถุในขณะที่ข้อมูลของเรา ผู้สร้างแบบจำลองมักจะคิดในแง่ของตารางและเอนทิตีและสิ่งประเภทนั้น นี่เป็นรูปแบบข้อมูลที่ง่ายมาก แต่มันแสดงถึงแนวคิดพื้นฐานบางประการที่นักพัฒนาหรือแม้แต่นักวิเคราะห์ธุรกิจหรือผู้ใช้ทางธุรกิจอาจคิดว่าเป็นวัตถุหรือแนวคิดทางธุรกิจที่แตกต่างกัน มันยากมากที่จะจำแนกสิ่งเหล่านี้จนถึงตอนนี้ แต่สิ่งที่เราทำใน ER / Studio Enterprise Team Edition ในรีลีสปี 2016 คือตอนนี้เรามีแนวคิดที่เรียกว่า Business Data Objects และสิ่งที่ทำให้เราทำคือช่วยให้เราสามารถแค็ปซูลกลุ่มของเอนทิตีหรือตารางลงในออบเจ็กต์ธุรกิจจริง

ตัวอย่างเช่นสิ่งที่เราได้มาที่นี่ในมุมมองใหม่นี้คือส่วนหัวใบสั่งซื้อและบรรทัดการสั่งซื้อถูกดึงเข้าด้วยกันตอนนี้พวกเขาถูกห่อหุ้มเป็นวัตถุเราจะคิดว่าพวกเขาเป็นหน่วยงานเมื่อเรายืนยันข้อมูล และเรารวบรวมพวกเขาเข้าด้วยกันดังนั้นจึงเป็นเรื่องง่ายมากที่จะเกี่ยวข้องกับผู้ชมที่แตกต่างกัน พวกเขาจะสามารถใช้ซ้ำได้ตลอดสภาพแวดล้อมการสร้างแบบจำลอง พวกเขาเป็นวัตถุจริงไม่ใช่เพียงแค่การวาดรูป แต่เรายังได้รับประโยชน์เพิ่มเติมว่าเมื่อเราสื่อสารจากมุมมองของแบบจำลองจริงเราสามารถเลือกยุบหรือขยายพวกเขาเพื่อให้เราสามารถสร้างมุมมองสรุปสำหรับการสนทนากับผู้มีส่วนได้ส่วนเสีย และแน่นอนว่าเราสามารถให้มุมมองที่ละเอียดยิ่งขึ้นเหมือนที่เราเห็นที่นี่สำหรับผู้ชมด้านเทคนิคเพิ่มเติม มันทำให้เรามียานพาหนะในการสื่อสารที่ดีจริงๆ สิ่งที่เราเห็นตอนนี้คือการรวมรูปแบบต่าง ๆ หลายแบบเข้าด้วยกันโดยเพิ่มแนวคิดของวัตถุข้อมูลทางธุรกิจและตอนนี้ฉันจะพูดเกี่ยวกับวิธีที่เราใช้ความหมายเพิ่มเติมกับสิ่งเหล่านี้จริง ๆ และวิธีที่เรารวมเข้าด้วยกัน สภาพแวดล้อมโดยรวม

ฉันแค่พยายามค้นหา WebEx ของฉันกลับมาที่นี่เพื่อที่ฉันจะสามารถทำได้ กลับไปที่สไลด์สุดฮอต ฉันจะเลื่อนไปข้างหน้าอย่างรวดเร็วไม่กี่สไลด์ที่นี่เพราะคุณได้เห็นสิ่งเหล่านี้ในรูปแบบการสาธิตแล้ว ฉันต้องการพูดเกี่ยวกับมาตรฐานการตั้งชื่ออย่างรวดเร็ว เราต้องการนำไปใช้และบังคับใช้มาตรฐานการตั้งชื่อที่แตกต่างกัน สิ่งที่เราต้องการทำคือเรามีความสามารถในการจัดเก็บเทมเพลตมาตรฐานการตั้งชื่อในที่เก็บของเราโดยทั่วไปจะสร้างความหมายนั้นผ่านคำหรือวลีหรือตัวย่อและมัดพวกเขากลับไปเป็นคำภาษาอังกฤษที่มีความหมาย เราจะใช้คำศัพท์ทางธุรกิจคำย่อสำหรับแต่ละคำและเราสามารถระบุคำสั่งกรณีและเพิ่มคำนำหน้าและคำต่อท้าย กรณีการใช้งานทั่วไปสำหรับกรณีนี้คือเมื่อผู้คนสร้างแบบจำลองเชิงตรรกะและจากนั้นจะก้าวไปข้างหน้าเพื่อสร้างแบบจำลองทางกายภาพที่พวกเขาอาจใช้ตัวย่อและทุกอย่างอื่น

สิ่งที่สวยงามคือมันทรงพลังและมีประสิทธิภาพยิ่งกว่าในการย้อนกลับหากเราสามารถบอกได้ว่ามาตรฐานการตั้งชื่อเหล่านั้นบางอย่างอยู่ในฐานข้อมูลทางกายภาพบางส่วนที่เราได้ออกแบบวิศวกรรมย้อนกลับเราสามารถใช้ตัวย่อเหล่านั้น คำและนำพวกเขาไปข้างหลังเป็นวลีภาษาอังกฤษ ตอนนี้เราสามารถหาชื่อที่ถูกต้องสำหรับข้อมูลของเรา อย่างที่ฉันพูดกรณีการใช้งานทั่วไปคือเราจะก้าวไปข้างหน้าตรรกะกับกายภาพและแมปที่เก็บข้อมูลและสิ่งประเภทนั้น หากคุณดูภาพหน้าจอทางด้านขวามือคุณจะเห็นว่ามีชื่อย่อจากชื่อแหล่งที่มาและเมื่อเราใช้เทมเพลตมาตรฐานการตั้งชื่อเราจะมีชื่อเต็มมากกว่านี้ และเราสามารถใส่ช่องว่างและทุกอย่างเช่นนี้ถ้าเราต้องการขึ้นอยู่กับเทมเพลตมาตรฐานการตั้งชื่อที่เราใช้ เราสามารถทำให้มันดูได้ แต่เราต้องการให้มันเข้ามาในแบบจำลองของเรา เมื่อเรารู้ว่ามีบางสิ่งที่เรียกว่าจริง ๆ แล้วเราจะเริ่มแนบคำนิยามกับมันเพราะถ้าเรารู้ว่ามันคืออะไรเราจะใช้ความหมายกับมันได้อย่างไร?

สิ่งที่ดีคือเราสามารถเรียกสิ่งนี้ได้จริงเมื่อเราทำทุกสิ่ง ฉันพูดถึงวิศวกรรมย้อนกลับเราสามารถเรียกใช้แม่แบบมาตรฐานการตั้งชื่อได้พร้อมกันเมื่อเรากำลังทำวิศวกรรมย้อนกลับ ดังนั้นในขั้นตอนเดียวผ่านตัวช่วยสร้างสิ่งที่เราสามารถทำได้คือถ้าเรารู้ว่าอนุสัญญาคืออะไรเราสามารถทำวิศวกรรมฐานข้อมูลทางกายภาพกลับคืนมันจะนำมันกลับมาเป็นแบบจำลองทางกายภาพในสภาพแวดล้อมการสร้างแบบจำลองและ ก็จะใช้หลักการตั้งชื่อเหล่านั้นด้วย ดังนั้นเราจะเห็นว่าการแสดงชื่อเหมือนภาษาอังกฤษในรูปแบบโลจิคัลที่สอดคล้องกันในสภาพแวดล้อมอย่างไร เราสามารถทำมันและรวมเข้ากับการสร้าง XML Schema เพื่อให้เราสามารถทำแบบจำลองและผลักมันออกมาพร้อมกับตัวย่อของเราไม่ว่าเราจะทำ SOA frameworks หรือสิ่งประเภทนั้นดังนั้นเราจึงสามารถผลักดันการตั้งชื่อแบบต่างๆ ที่จริงเราเก็บไว้ในรูปแบบของตัวเอง มันทำให้เรามีความสามารถที่ทรงพลังมาก

นี่เป็นตัวอย่างของสิ่งที่ดูเหมือนว่าฉันมีเทมเพลต อันนี้แสดงให้เห็นจริง ๆ ว่าฉันมี EMP สำหรับ“ พนักงาน”, SAL สำหรับ“ เงินเดือน” PLN สำหรับ“ วางแผน” ในการประชุมมาตรฐานการตั้งชื่อ ฉันยังสามารถใช้พวกเขาเพื่อให้พวกเขาทำงานแบบโต้ตอบในขณะที่ฉันกำลังสร้างแบบจำลองและวางสิ่งต่าง ๆ ถ้าฉันใช้ตัวย่อนี้และฉันพิมพ์ใน "แผนการเงินเดือนของพนักงาน" ในชื่อนิติบุคคลมันจะทำหน้าที่แม่แบบมาตรฐานการตั้งชื่อ ฉันได้นิยามไว้ที่นี่แล้วมันจะให้ EMP_SAL_PLN แก่ฉันเมื่อฉันสร้างเอนทิตีและให้ชื่อทางกายภาพที่เกี่ยวข้องทันที

ดีอีกครั้งเมื่อเราออกแบบและส่งต่อวิศวกรรมเช่นกัน เรามีแนวคิดที่ไม่เหมือนใครและนี่คือจุดเริ่มต้นที่เราจะนำสภาพแวดล้อมเหล่านี้มารวมกันและเรียกว่าการจับคู่สากล เมื่อเรานำแบบจำลองเหล่านี้ทั้งหมดเข้าสู่สภาพแวดล้อมของเราแล้วสิ่งที่เราสามารถทำได้โดยสมมติว่าตอนนี้เราได้ใช้แบบแผนการตั้งชื่อเหล่านี้และพวกมันหาง่ายเราสามารถใช้โครงสร้างที่เรียกว่า Universal Mappings ใน ER / สตูดิโอ เราสามารถเชื่อมโยงเอนทิตี้ของรุ่นต่างๆได้ เมื่อใดก็ตามที่เราเห็น“ ลูกค้า” - เราอาจจะมี“ ลูกค้า” ในระบบที่แตกต่างกันและฐานข้อมูลที่แตกต่างกันมากมาย - เราสามารถเริ่มเชื่อมโยงทุกคนเข้าด้วยกันเพื่อที่เมื่อฉันทำงานกับมันในรุ่นเดียวฉัน สามารถดูว่าอาการของลูกค้าในรุ่นอื่น ๆ อยู่ที่ไหน และเนื่องจากเรามีโมเดลเลเยอร์ที่เป็นตัวแทนเราจึงสามารถผูกเข้ากับแหล่งข้อมูลและนำมาลงในที่ซึ่งมีการสอบถามที่ใช้ในฐานข้อมูลที่ซึ่งสิ่งเหล่านี้อาศัยอยู่ด้วย มันทำให้เรามีความสามารถในการผูกทั้งหมดนี้เข้าด้วยกันอย่างแน่นหนา

ฉันแสดงให้คุณเห็นวัตถุข้อมูลทางธุรกิจ ฉันต้องการพูดคุยเกี่ยวกับส่วนขยายข้อมูลเมตาที่เราเรียกว่าไฟล์แนบอย่างรวดเร็ว มันช่วยให้เราสามารถสร้างข้อมูลเมตาเพิ่มเติมสำหรับวัตถุโมเดลของเราได้ บ่อยครั้งที่ฉันจะตั้งค่าคุณสมบัติประเภทนี้เพื่อขับเคลื่อนสิ่งต่าง ๆ มากมายจากมุมมองการกำกับดูแลข้อมูลและคุณภาพของข้อมูลและเพื่อช่วยเราในการจัดการข้อมูลหลักและนโยบายการเก็บข้อมูล แนวคิดพื้นฐานคือคุณสร้างการจำแนกประเภทเหล่านี้และคุณสามารถแนบได้ทุกที่ที่คุณต้องการในระดับตารางระดับคอลัมน์ประเภทของสิ่งเหล่านั้น แน่นอนกรณีการใช้งานที่พบบ่อยที่สุดคือเอนทิตีคือตารางและจากนั้นฉันสามารถกำหนด: วัตถุข้อมูลหลักของฉันคืออะไรตารางอ้างอิงของฉันคืออะไรตารางการทำธุรกรรมของฉันคืออะไร? จากมุมมองคุณภาพข้อมูลฉันสามารถจำแนกประเภทในแง่ของความสำคัญต่อธุรกิจเพื่อให้เราสามารถจัดลำดับความสำคัญของการล้างข้อมูลและประเภทของสิ่งนั้น

สิ่งที่มักถูกมองข้ามคือนโยบายการเก็บรักษาข้อมูลประเภทต่างๆในองค์กรของเราคืออะไร เราสามารถตั้งค่าเหล่านี้และเราสามารถแนบกับสิ่งประดิษฐ์ข้อมูลประเภทต่างๆในสภาพแวดล้อมการสร้างแบบจำลองของเราและแน่นอนที่เก็บของเราเช่นกัน ความงามคือสิ่งที่แนบมาเหล่านี้อาศัยอยู่ในพจนานุกรมข้อมูลของเราดังนั้นเมื่อเราใช้พจนานุกรมข้อมูลองค์กรในสภาพแวดล้อมเราสามารถแนบไฟล์เหล่านี้กับหลายรุ่นได้ เราต้องกำหนดพวกเขาเพียงครั้งเดียวและเราสามารถใช้ประโยชน์จากพวกเขาซ้ำแล้วซ้ำอีกในโมเดลที่แตกต่างกันในสภาพแวดล้อมของเรา นี่เป็นเพียงสกรีนช็อตสั้น ๆ เพื่อแสดงว่าคุณสามารถระบุได้จริงเมื่อคุณทำสิ่งที่แนบมาชิ้นส่วนทั้งหมดที่คุณต้องการแนบ และตัวอย่างนี้ตรงนี้คือรายการค่าดังนั้นเมื่อพวกมันเข้าไปคุณสามารถเลือกจากรายการค่าคุณมีการควบคุมมากมายในสภาพแวดล้อมการสร้างแบบจำลองของสิ่งที่ถูกเลือกและคุณสามารถกำหนดสิ่งที่เป็นค่าเริ่มต้น value คือถ้าไม่ได้เลือกค่า ดังนั้นพลังงานมากมายที่นั่น พวกเขาอาศัยอยู่ในพจนานุกรมข้อมูล

บางสิ่งที่ฉันต้องการแสดงให้คุณเห็นอีกเล็กน้อยบนหน้าจอนี้นอกจากนี้คุณจะเห็นประเภทของสิ่งที่แนบมาที่ส่วนบนด้านล่างคุณเห็นข้อมูลความปลอดภัยของข้อมูล เราสามารถนำนโยบายความปลอดภัยของข้อมูลไปใช้กับข้อมูลต่างๆในสภาพแวดล้อมได้เช่นกัน สำหรับการแมปการปฏิบัติตามกฎระเบียบที่แตกต่างกันการจำแนกประเภทความปลอดภัยของข้อมูลเราจัดส่งจำนวนหนึ่งออกมาจากกล่องที่คุณสามารถสร้างและเริ่มใช้งานได้ แต่คุณสามารถกำหนดการแมปและมาตรฐานการปฏิบัติตามข้อกำหนดของคุณเองได้เช่นกัน ไม่ว่าคุณกำลังทำ HIPAA หรือโครงการอื่น ๆ และคุณสามารถเริ่มสร้างชุดข้อมูลเมตาที่สมบูรณ์แบบนี้ในสภาพแวดล้อมของคุณ

จากนั้นอภิธานศัพท์และข้อกำหนด - นี่คือสิ่งที่ความหมายทางธุรกิจเชื่อมโยงกันเรามักจะมีพจนานุกรมข้อมูลออกมาบ่อยครั้งที่องค์กรมักใช้เป็นจุดเริ่มต้นในการขับไล่อภิธานศัพท์ แต่คำศัพท์และการใช้คำฟุ่มเฟือยคือ มักเทคนิคมาก ดังนั้นสิ่งที่เราสามารถทำได้คือเราสามารถทำได้ถ้าเราต้องการใช้สิ่งเหล่านั้นเป็นจุดเริ่มต้นเพื่อขับไล่อภิธานศัพท์ แต่เราต้องการให้ธุรกิจเป็นเจ้าของสิ่งเหล่านี้ สิ่งที่เราทำในสภาพแวดล้อมเซิร์ฟเวอร์ทีมคือเราได้รับความสามารถสำหรับผู้คนในการสร้างคำจำกัดความทางธุรกิจและจากนั้นเราสามารถเชื่อมโยงพวกเขากับสิ่งประดิษฐ์โมเดลที่แตกต่างกันซึ่งพวกเขาสอดคล้องกับในสภาพแวดล้อมการสร้างแบบจำลองเช่นกัน นอกจากนี้เรายังรับรู้ถึงจุดที่ถูกกล่าวถึงก่อนหน้านี้ซึ่งก็คือยิ่งมีคนพิมพ์มากเท่าไหร่ก็ยิ่งมีโอกาสเกิดข้อผิดพลาดของมนุษย์มากขึ้นเท่านั้น สิ่งที่เราทำในโครงสร้างอภิธานศัพท์ของเราคือหนึ่งเราสนับสนุนลำดับชั้นของอภิธานศัพท์เพื่อให้เราสามารถมีอภิธานศัพท์ประเภทต่าง ๆ หรือสิ่งต่าง ๆ ในองค์กร แต่ที่สำคัญคือถ้าคุณมีแหล่งข้อมูลเหล่านี้อยู่แล้ว ด้วยข้อกำหนดและทุกสิ่งที่กำหนดเราสามารถนำเข้า CSV เพื่อดึงสิ่งเหล่านี้ลงในสภาพแวดล้อมการสร้างแบบจำลองของเราและเซิร์ฟเวอร์ทีมของเราหรืออภิธานศัพท์ของเราเช่นกันจากนั้นเริ่มเชื่อมโยงจากที่นั่น และทุกครั้งที่มีการเปลี่ยนแปลงสิ่งที่มีหลักฐานการตรวจสอบอย่างเต็มรูปแบบของภาพก่อนและหลังในแง่ของคำจำกัดความและทุกอย่างและสิ่งที่คุณจะเห็นการมาในอนาคตอันใกล้นี้ก็เป็นขั้นตอนการอนุญาตมากกว่า เพื่อให้เราสามารถควบคุมได้ว่าใครเป็นผู้รับผิดชอบการอนุมัติโดยคณะกรรมการหรือบุคคลและประเภทของสิ่งนั้นเพื่อให้กระบวนการกำกับดูแลมีความแข็งแกร่งยิ่งขึ้นเมื่อเราก้าวไปข้างหน้า

สิ่งนี้ยังทำเพื่อเราคือเมื่อเรามีอภิธานศัพท์เหล่านี้ในอภิธานศัพท์เซิร์ฟเวอร์ทีมของเรานี่เป็นตัวอย่างของการแก้ไขในเอนทิตีในรูปแบบที่ฉันนำขึ้นมาที่นี่ มันอาจมีการเชื่อมโยงคำศัพท์ แต่สิ่งที่เราทำก็คือถ้ามีคำที่อยู่ในอภิธานศัพท์นั้นที่ปรากฏในบันทึกย่อหรือคำอธิบายของสิ่งที่เรามีในหน่วยงานของเราที่นี่คำเหล่านั้นจะแสดงโดยอัตโนมัติในสีไฮเปอร์ลิงก์ที่อ่อนลง เลื่อนเมาส์ไปที่พวกเราจริง ๆ แล้วจะเห็นคำนิยามจากอภิธานศัพท์ทางธุรกิจเช่นกัน มันยังช่วยให้เรามีข้อมูลที่สมบูรณ์ยิ่งขึ้นเมื่อเราบริโภคข้อมูลเองด้วยคำศัพท์ทั้งหมดที่อยู่ข้างนอก มันช่วยเสริมประสบการณ์ให้มากขึ้นและใช้ความหมายกับทุกสิ่งที่เราทำงานด้วย

ดังนั้นอีกครั้งนั่นเป็นทางลัดที่เร็วมาก เห็นได้ชัดว่าเราสามารถใช้เวลาหลายวันกับเรื่องนี้ในขณะที่เราเจาะเข้าไปในส่วนต่าง ๆ แต่นี่เป็นการบินผ่านพื้นผิวที่รวดเร็วมาก สิ่งที่เราพยายามทำจริงๆคือเข้าใจว่าสภาพแวดล้อมข้อมูลที่ซับซ้อนเหล่านั้นมีลักษณะอย่างไร เราต้องการปรับปรุงการเปิดเผยข้อมูลส่วนต่างๆเหล่านั้นทั้งหมดและทำงานร่วมกันเพื่อขับออกด้วย ER / Studio เราต้องการเปิดใช้งานการสร้างแบบจำลองข้อมูลที่มีประสิทธิภาพและอัตโนมัติมากขึ้น และนั่นคือข้อมูลทุกประเภทที่เรากำลังพูดถึงไม่ว่าจะเป็นข้อมูลขนาดใหญ่ข้อมูลเชิงสัมพันธ์แบบดั้งเดิมที่เก็บเอกสารหรือสิ่งอื่นใด และอีกครั้งเราประสบความสำเร็จเพราะเรามีความสามารถในการส่งต่อและวิศวกรรมย้อนกลับที่มีประสิทธิภาพสำหรับแพลตฟอร์มที่แตกต่างกันและเครื่องมืออื่น ๆ ที่คุณอาจมี และมันคือทั้งหมดที่เกี่ยวกับการแบ่งปันและการสื่อสารทั่วทั้งองค์กรกับผู้มีส่วนได้เสียทั้งหมดที่เกี่ยวข้อง นั่นคือสิ่งที่เราใช้ความหมายผ่านมาตรฐานการตั้งชื่อ จากนั้นเราจะใช้คำจำกัดความผ่านอภิธานศัพท์ทางธุรกิจของเรา จากนั้นเราสามารถทำการจำแนกประเภทเพิ่มเติมสำหรับความสามารถด้านการกำกับดูแลอื่น ๆ ทั้งหมดของเราด้วยส่วนขยายข้อมูลเมตาเช่นส่วนขยายคุณภาพข้อมูลการจัดประเภทสำหรับการจัดการข้อมูลหลักหรือการจำแนกประเภทอื่น ๆ ที่คุณต้องการใช้กับข้อมูลนั้น จากนั้นเราสามารถสรุปเพิ่มเติมและปรับปรุงการสื่อสารให้มากขึ้นด้วยวัตถุข้อมูลทางธุรกิจกับกลุ่มผู้มีส่วนได้เสียที่แตกต่างกันโดยเฉพาะระหว่างผู้สร้างแบบจำลองและนักพัฒนา

และสิ่งที่สำคัญมากเกี่ยวกับสิ่งนี้คือสิ่งที่สำคัญคือพื้นที่เก็บข้อมูลแบบรวมที่มีความสามารถในการจัดการการเปลี่ยนแปลงที่แข็งแกร่งมาก ฉันไม่มีเวลาแสดงวันนี้เพราะมันค่อนข้างซับซ้อน แต่ที่เก็บมีความสามารถในการจัดการการเปลี่ยนแปลงและเส้นทางการตรวจสอบที่แข็งแกร่งมาก คุณสามารถตั้งชื่อรุ่นคุณสามารถตั้งชื่อรุ่นและเรายังมีความสามารถสำหรับผู้ที่กำลังทำการจัดการการเปลี่ยนแปลงเราสามารถผูกสิ่งนั้นไว้ในงานของคุณ เรามีความสามารถในวันนี้ที่จะนำงานเข้ามาและเชื่อมโยงการเปลี่ยนแปลงแบบจำลองของคุณกับงานเช่นเดียวกับนักพัฒนาที่จะเชื่อมโยงการเปลี่ยนแปลงรหัสของพวกเขากับงานหรือเรื่องราวของผู้ใช้ที่พวกเขากำลังทำงานด้วยเช่นกัน

นั่นเป็นภาพรวมที่รวดเร็วมาก ฉันหวังว่ามันจะเพียงพอที่จะปลุกความอยากอาหารของคุณเพื่อให้เราสามารถสนทนาอย่างลึกซึ้งยิ่งขึ้นในการแยกหัวข้อเหล่านี้บางส่วนเมื่อเราก้าวไปข้างหน้าในอนาคต ขอบคุณสำหรับเวลาของคุณและกลับมาหาคุณรีเบคก้า

รีเบคก้า Jozwiak: ขอบคุณรอนที่ยอดเยี่ยมและฉันมีคำถามจากผู้ชมบ้างเล็กน้อย แต่ฉันต้องการให้นักวิเคราะห์ของเรามีโอกาสที่จะฟันของพวกเขาในสิ่งที่คุณพูด เอริคฉันจะเดินหน้าต่อไปและบางทีหากคุณต้องการพูดถึงสไลด์นี้หรือสไลด์อื่นทำไมคุณไม่ไปข้างหน้าก่อนล่ะ หรือคำถามอื่น ๆ

Eric Little: แน่ใจ ขออภัยคำถามคืออะไรรีเบคก้า คุณต้องการให้ฉันถามอะไรบางอย่างที่เฉพาะเจาะจงหรือ ...

รีเบคก้า Jozwiak: ฉันรู้ว่าคุณมีคำถามสำหรับรอนในตอนแรก หากคุณต้องการขอให้เขาพูดถึงสิ่งเหล่านี้หรือบางส่วนของพวกเขาออกจากสไลด์หรือสิ่งอื่นใดที่ทำให้คุณสนใจที่คุณอยากถาม? เกี่ยวกับฟังก์ชันการสร้างแบบจำลองของ IDERA

Eric Little: ใช่แล้วอย่างหนึ่งในนั้นรอนดังนั้นคุณเป็นอย่างไรไดอะแกรมที่คุณแสดงเป็นไดอะแกรมความสัมพันธ์เอนทิตี้ทั่วไปแบบที่ปกติแล้วคุณจะใช้ในการสร้างฐานข้อมูลถูกต้องหรือไม่

Ron Huizenga: ใช่โดยทั่วไปแล้วพูด แต่แน่นอนว่าเรามีประเภทขยายสำหรับที่เก็บเอกสารและประเภทของสิ่งนั้นด้วย จริง ๆ แล้วเราแตกต่างจากสัญกรณ์เชิงสัมพันธ์ล้วนๆเราได้เพิ่มสัญลักษณ์เพิ่มเติมสำหรับร้านค้าอื่น ๆ เหล่านั้นด้วย

Eric Little: มีวิธีที่พวกคุณสามารถใช้การสร้างแบบจำลองกราฟแบบกราฟได้หรือไม่ดังนั้นจึงมีวิธีที่จะบูรณาการตัวอย่างเช่นสมมติว่าฉันมีบางอย่างที่เป็น Quadrant ยอดนิยมเครื่องมือแต่งเพลง TopBraid หรือฉันทำบางสิ่งในProtégéหรือ คุณรู้ไหมเช่นเดียวกับนักการเงินใน FIBO พวกเขาทำงานหลายอย่างในความหมายสิ่ง RDF - มีวิธีที่จะนำการสร้างแบบจำลองประเภทความสัมพันธ์เอนทิตี้ของกราฟลงในเครื่องมือนี้และใช้มันได้หรือไม่

Ron Huizenga: เรากำลังดูว่าเราสามารถจัดการกับกราฟได้อย่างไร เราไม่ได้จัดการฐานข้อมูลกราฟและสิ่งประเภทนั้นอย่างชัดเจนในวันนี้ แต่เรากำลังมองหาวิธีที่เราสามารถทำได้เพื่อขยายข้อมูลเมตาของเรา ฉันหมายความว่าเราสามารถนำสิ่งต่าง ๆ เข้ามาใน XML และสิ่งประเภทนั้นได้ในตอนนี้ถ้าอย่างน้อยเราก็สามารถแปล XML เพื่อนำมาเป็นจุดเริ่มต้นได้ แต่เรากำลังมองหาวิธีที่สง่างามกว่าเพื่อนำสิ่งนั้นเข้ามา

และฉันยังแสดงให้คุณเห็นว่ารายการสะพานวิศวกรรมย้อนกลับที่เรามีเช่นกันดังนั้นเราจึงมักจะมองหาการต่อเติมไปยังสะพานเหล่านั้นสำหรับแพลตฟอร์มที่เฉพาะเจาะจงเช่นกัน มันเป็นความพยายามอย่างต่อเนื่องและต่อเนื่องหากเป็นไปได้ที่จะเริ่มใช้โครงสร้างใหม่เหล่านี้และแพลตฟอร์มที่แตกต่างกันออกไป แต่ฉันสามารถพูดได้ว่าเราอยู่ในระดับแนวหน้าในการทำเช่นนั้น สิ่งที่ฉันแสดงให้เห็นเช่น MongoDB และสิ่งประเภทนั้นเราเป็นผู้จำหน่ายข้อมูลแบบจำลองรายแรกที่ทำสิ่งนั้นในผลิตภัณฑ์ของเราเอง

Eric Little: โอเคใช่ ดังนั้นคำถามอื่นที่ฉันมีให้คุณก็คือในแง่ของการกำกับดูแลและการดูแลรักษา - เมื่อคุณใช้ตัวอย่างเมื่อคุณแสดงตัวอย่างของบุคคลที่เป็น "ลูกจ้าง" ฉันเชื่อว่ามันเป็น " เงินเดือน "จากนั้นคุณมี" แผน "มีวิธีจัดการอย่างไรตัวอย่างเช่นคนประเภทต่าง ๆ ที่อาจมี - สมมติว่าคุณมีสถาปัตยกรรมขนาดใหญ่ใช่ไหมสมมติว่าคุณมีองค์กรขนาดใหญ่และ ผู้คนเริ่มดึงสิ่งต่าง ๆ เข้าด้วยกันในเครื่องมือนี้และคุณมีกลุ่มหนึ่งตรงนี้ที่มีคำว่า "พนักงาน" และกลุ่มหนึ่งตรงนี้ที่มีคำว่า "คนงาน" และอีกคนหนึ่งที่นี่บอกว่า "เงินเดือน" และอีกคนพูดว่า “ค่าจ้าง”.

พวกคุณกระทบยอดและจัดการและควบคุมความแตกต่างเหล่านั้นอย่างไร? เพราะฉันรู้ว่าเราจะทำมันอย่างไรในโลกกราฟคุณรู้ว่าคุณจะใช้รายการคำเหมือนหรือคุณจะบอกว่ามีแนวคิดเดียวและมีคุณสมบัติหลายอย่างหรือคุณสามารถพูดในโมเดล SKOS ที่ฉันมีป้ายกำกับที่ต้องการและฉันมี ป้ายกำกับอื่น ๆ อีกมากมายที่ฉันสามารถใช้ได้ พวกคุณทำยังไง?

Ron Huizenga: เราทำสองวิธีที่แตกต่างกันและให้พูดถึงคำศัพท์ก่อนเป็นหลัก แน่นอนว่าสิ่งหนึ่งที่เราทำคือเราต้องการให้มีคำศัพท์ที่กำหนดไว้หรือถูกลงโทษและในอภิธานศัพท์ทางธุรกิจที่เห็นได้ชัดคือที่ที่เราต้องการ และเราอนุญาตการเชื่อมโยงไปยังคำพ้องความหมายในอภิธานศัพท์ทางธุรกิจเช่นกันดังนั้นสิ่งที่คุณสามารถทำได้คือคุณสามารถพูดได้นี่คือคำศัพท์ของฉัน แต่คุณยังสามารถกำหนดความหมายของคำพ้องความหมายทั้งหมด

แน่นอนว่าสิ่งที่น่าสนใจคือเมื่อคุณเริ่มมองข้ามภูมิทัศน์ข้อมูลอันกว้างใหญ่นี้กับระบบต่าง ๆ เหล่านี้ที่คุณออกไปข้างนอกคุณไม่สามารถออกไปที่นั่นและเปลี่ยนตารางที่เกี่ยวข้องและสิ่งต่าง ๆ เหล่านั้นเป็น สอดคล้องกับมาตรฐานการตั้งชื่อนั้นเนื่องจากอาจเป็นแพ็คเกจที่คุณซื้อดังนั้นคุณจึงไม่สามารถควบคุมการเปลี่ยนแปลงฐานข้อมูลหรือสิ่งใด ๆ ได้เลย

สิ่งที่เราสามารถทำได้นอกเหนือจากความสามารถในการเชื่อมโยงคำศัพท์อภิธานศัพท์คือผ่านการแมปสากลที่ฉันพูดคุยเกี่ยวกับสิ่งที่เราจะทำและชนิดของวิธีการที่แนะนำคือการมีแบบจำลองตรรกะครอบคลุมที่วางสิ่ง แนวคิดทางธุรกิจที่แตกต่างกันเหล่านี้คือสิ่งที่คุณกำลังพูดถึง ผูกคำศัพท์ทางธุรกิจลงในคำศัพท์เหล่านั้นและสิ่งที่ดีคือตอนนี้คุณมีโครงสร้างนี้ที่แสดงถึงเอนทิตีแบบโลจิคัลตามเดิมจากนั้นคุณสามารถเริ่มเชื่อมโยงจากเอนทิตีแบบลอจิคัลนั้นไปยังการใช้งานทั้งหมด ระบบต่าง ๆ

จากนั้นคุณต้องเห็นว่าคุณสามารถเห็นได้ว่า "คน" ที่นี่เรียกว่า "พนักงาน" ในระบบนี้ “ เงินเดือน” ที่นี่เรียกว่า“ ค่าจ้าง” ที่นี่ในระบบอื่นนี้ เนื่องจากคุณจะเห็นสิ่งนั้นคุณจะเห็นการแสดงออกที่แตกต่างกันทั้งหมดของสิ่งเหล่านั้นเพราะคุณได้ทำการเชื่อมโยงเข้าด้วยกัน

Eric Little: โอเคเยี่ยมเลยเข้าใจแล้ว ในแง่นั้นมันปลอดภัยหรือไม่ที่จะบอกว่าเป็นเหมือนวิธีการเชิงวัตถุบางอย่าง?

Ron Huizenga: ค่อนข้าง. มันเข้มข้นกว่านี้นิดหน่อยที่ฉันคิดว่าคุณพูดได้ ฉันหมายความว่าคุณสามารถใช้วิธีการเชื่อมโยงด้วยตนเองและผ่านการตรวจสอบและดำเนินการทั้งหมดด้วยเช่นกัน สิ่งหนึ่งที่ฉันไม่มีโอกาสได้พูดคุย - เพราะอีกครั้งเรามีความสามารถมากมาย - เรายังมีส่วนต่อประสานอัตโนมัติแบบเต็มรูปแบบในเครื่องมือ Data Architect ด้วย และความสามารถของมาโครซึ่งเป็นภาษาโปรแกรมในเครื่องมือจริงๆ ดังนั้นเราสามารถทำสิ่งต่าง ๆ เช่นเขียนแมโครออกไปและซักถามและสร้างลิงก์ให้คุณ เราใช้สำหรับการนำเข้าและส่งออกข้อมูลเราสามารถใช้สำหรับการเปลี่ยนแปลงสิ่งต่าง ๆ หรือเพิ่มคุณสมบัติเหตุการณ์ตามโมเดลหรือเราสามารถใช้เพื่อรันเป็นแบทช์เพื่อออกไปและซักถามสิ่งต่าง ๆ และสร้างโครงสร้างที่แตกต่างกันใน แบบ ดังนั้นจึงมีอินเทอร์เฟซแบบอัตโนมัติเต็มรูปแบบที่ผู้คนสามารถใช้ประโยชน์ได้เช่นกัน และการใช้การจับคู่แบบสากลกับสิ่งเหล่านั้นจะเป็นวิธีที่ทรงพลังมากในการทำเช่นนั้น

รีเบคก้า Jozwiak: โอเคขอบคุณรอนและขอบคุณเอริค นั่นเป็นคำถามที่ยอดเยี่ยม ฉันรู้ว่าเรากำลังวิ่งผ่านจุดบนสุดของชั่วโมงเล็กน้อย แต่ฉันอยากให้โอกาสกับ Malcolm เพื่อโยนคำถามบางอย่างในแบบของรอน มัลคอล์?

Malcolm Chisholm: ขอบคุณรีเบคก้า ดังนั้นรอนมันน่าสนใจมากฉันเห็นว่ามีความสามารถมากมายที่นี่ หนึ่งในพื้นที่ที่ฉันสนใจมากคือถ้าเรามีโครงการพัฒนาคุณจะเห็นตัวสร้างข้อมูลโดยใช้ความสามารถเหล่านี้และทำงานร่วมกับนักวิเคราะห์ธุรกิจกับนักวิเคราะห์ข้อมูลกับนักวิเคราะห์คุณภาพข้อมูลได้อย่างไร และกับผู้สนับสนุนทางธุรกิจที่ในที่สุดจะต้องรับผิดชอบต่อความต้องการข้อมูลที่แท้จริงในโครงการ คุณรู้หรือไม่ว่าตัวสร้างข้อมูลจริง ๆ ทำให้โครงการมีประสิทธิภาพและประสิทธิผลมากขึ้นด้วยความสามารถที่เรากำลังมองหา

Ron Huizenga: ฉันคิดว่าหนึ่งในสิ่งแรกที่คุณต้องทำคือเป็น data modeler - และฉันไม่ได้ตั้งใจเลือก modeler แต่ฉันจะทำต่อไป - เป็นบางคนยังคงรู้สึกว่า data modeler มันเป็นบทบาทของคนเฝ้าประตูจริงๆเรากำลังกำหนดวิธีการทำงานเราเป็นผู้พิทักษ์ที่ทำให้แน่ใจว่าทุกอย่างถูกต้อง

ขณะนี้มีแง่มุมหนึ่งที่คุณต้องตรวจสอบให้แน่ใจว่าคุณได้กำหนดสถาปัตยกรรมข้อมูลเสียงและทุกอย่างอื่น แต่สิ่งที่สำคัญกว่านั้นก็คือในฐานะผู้สร้างแบบจำลองข้อมูล - และฉันพบว่ามันค่อนข้างชัดเจนเมื่อฉันให้คำปรึกษา - คุณต้องเป็นผู้อำนวยความสะดวกดังนั้นคุณต้องดึงคนเหล่านี้มารวมกัน

มันจะไม่เป็นการออกแบบสร้างและสร้างฐานข้อมูลอีกต่อไป - สิ่งที่คุณต้องทำคือคุณต้องสามารถทำงานกับกลุ่มผู้มีส่วนได้เสียต่าง ๆ เหล่านี้ทำสิ่งต่าง ๆ เช่นวิศวกรรมย้อนกลับการนำเข้าข้อมูลมี คนอื่น ๆ ทำงานร่วมกันไม่ว่าจะเป็นในอภิธานศัพท์หรือเอกสารทุกอย่างเช่นนั้น - และเป็นผู้อำนวยความสะดวกในการดึงสิ่งนี้ลงในที่เก็บและเชื่อมโยงแนวคิดเข้าด้วยกันในที่เก็บและทำงานกับคนเหล่านั้น

มันเป็นสภาพแวดล้อมการทำงานร่วมกันที่มีอยู่มากมายแม้ว่าจะผ่านคำจำกัดความของงานหรือแม้กระทั่งหัวข้อการอภิปรายหรือประเภทของสิ่งที่เรามีในเซิร์ฟเวอร์ทีมที่ผู้คนสามารถทำงานร่วมกันถามคำถามและมาถึงผลิตภัณฑ์สุดท้ายที่พวกเขา ต้องการสถาปัตยกรรมข้อมูลและองค์กรของพวกเขา คำตอบนั้นใช่ไหม

Malcolm Chisholm: ใช่ฉันเห็นด้วย คุณรู้ไหมฉันคิดว่าทักษะการอำนวยความสะดวกเป็นสิ่งที่ต้องการอย่างมากในตัวสร้างข้อมูล ฉันเห็นด้วยว่าเราไม่เห็นเสมอไป แต่ฉันคิดว่ามันจำเป็นและฉันขอแนะนำว่าบางครั้งความโน้มเอียงที่จะอยู่ในมุมของคุณในการสร้างแบบจำลองข้อมูลของคุณ แต่คุณต้องทำงานกับกลุ่มผู้มีส่วนได้เสียอื่น ๆ หรือคุณเพียงแค่ไม่เข้าใจสภาพแวดล้อมของข้อมูลที่คุณกำลังเผชิญอยู่และฉันคิดว่ารูปแบบนั้นได้รับผลกระทบ แต่นั่นเป็นเพียงความคิดเห็นของฉัน

Ron Huizenga: และเป็นเรื่องที่น่าสนใจเพราะคุณพูดถึงบางสิ่งก่อนหน้านี้ในสไลด์เกี่ยวกับประวัติความเป็นมาของธุรกิจที่หันเหความสนใจจาก IT เพราะพวกเขาไม่ได้นำเสนอโซลูชั่นในเวลาที่เหมาะสมและสิ่งต่าง ๆ เหล่านั้น

มันน่าสนใจมากที่ในการให้คำปรึกษาในภายหลังของฉันก่อนที่จะเป็นผู้จัดการผลิตภัณฑ์โครงการส่วนใหญ่ที่ฉันทำในช่วงสองปีที่ผ่านมาได้รับการสนับสนุนทางธุรกิจซึ่งเป็นธุรกิจที่ขับเคลื่อนและสถาปนิกด้านข้อมูล และผู้สร้างแบบจำลองไม่ได้เป็นส่วนหนึ่งของไอที เราเป็นส่วนหนึ่งของกลุ่มที่สนับสนุนธุรกิจและเราอยู่ที่นั่นในฐานะผู้อำนวยความสะดวกในการทำงานกับทีมส่วนที่เหลือของโครงการ

Malcolm Chisholm: ดังนั้นฉันคิดว่านั่นเป็นจุดที่น่าสนใจมากฉันคิดว่าเราเริ่มเห็นการเปลี่ยนแปลงในโลกธุรกิจที่ธุรกิจกำลังขอหรือคิดว่าอาจจะไม่มากเท่าที่ฉันจะทำกระบวนการในการดำเนินการ แต่พวกเขาก็เริ่มคิดว่าข้อมูลคืออะไร ที่ฉันทำงานด้วยคืออะไรต้องการข้อมูลของฉันคืออะไรข้อมูลที่ฉันจัดการกับเป็นข้อมูลและเท่าไหร่เราจะได้รับผลิตภัณฑ์และความสามารถของ IDERA เพื่อสนับสนุนมุมมองนั้นและฉันคิดว่าความต้องการของธุรกิจแม้ แม้ว่ามันจะยังค่อนข้างตั้งไข่นิดหน่อย

Ron Huizenga: ฉันเห็นด้วยกับคุณและฉันคิดว่าเราเห็นมันเป็นอย่างนั้นมากขึ้นเรื่อย ๆ เราเคยเห็นการตื่นขึ้นมาแล้วและคุณสัมผัสมันมาก่อนหน้านี้ในแง่ของความสำคัญของข้อมูล เราเห็นความสำคัญของข้อมูลในช่วงต้นของไอทีหรือในวิวัฒนาการของฐานข้อมูลเมื่อคุณบอกว่าเราเข้าสู่วงจรการจัดการกระบวนการทั้งหมด - และกระบวนการมีความสำคัญอย่างยิ่งอย่าเข้าใจฉันผิด - แต่ตอนนี้เกิดอะไรขึ้น คือเมื่อสิ่งนั้นเกิดขึ้นข้อมูลที่โฟกัสหายไป

และตอนนี้องค์กรต่างๆกำลังตระหนักว่าข้อมูลเป็นจุดสำคัญ ข้อมูลแสดงถึงทุกสิ่งที่เราทำในธุรกิจของเราดังนั้นเราจึงต้องตรวจสอบให้แน่ใจว่าเรามีข้อมูลที่ถูกต้องเพื่อให้เราสามารถค้นหาข้อมูลที่ถูกต้องที่เราต้องใช้ในการตัดสินใจ เพราะไม่ใช่ทุกอย่างมาจากกระบวนการที่กำหนดไว้ ข้อมูลบางอย่างเป็นผลพลอยได้จากสิ่งอื่นและเรายังต้องสามารถค้นหาได้รู้ว่ามันหมายถึงอะไรและสามารถแปลข้อมูลที่เราเห็นว่าเป็นความรู้ที่เราสามารถนำมาใช้เพื่อขับเคลื่อนธุรกิจของเราได้ดีขึ้น

Malcolm Chisholm: ใช่และตอนนี้สิ่งที่ฉันต้องดิ้นรนคือสิ่งที่ฉันจะเรียกว่าวงจรชีวิตของข้อมูลซึ่งก็คือถ้าคุณดูที่ห่วงโซ่อุปทานของข้อมูลที่จะผ่านองค์กรเราจะเริ่มด้วยการเก็บข้อมูลหรือ การจับข้อมูลซึ่งอาจเป็นการป้อนข้อมูล แต่อาจเท่ากันฉันได้รับข้อมูลจากภายนอกองค์กรจากผู้จำหน่ายข้อมูลบางราย

จากการจับข้อมูลเราไปที่การบำรุงรักษาข้อมูลที่ฉันคิดเกี่ยวกับการทำให้ข้อมูลนี้เป็นมาตรฐานและส่งไปยังสถานที่ที่ต้องการ จากนั้นใช้ข้อมูลซึ่งเป็นจุดที่เกิดขึ้นจริงของข้อมูลคุณจะได้รับประโยชน์จากข้อมูล

และในสมัยก่อนสิ่งเหล่านี้เกิดขึ้นในรูปแบบเดียว แต่ในวันนี้คุณอาจจะรู้ว่ามีสภาพแวดล้อมการวิเคราะห์เช่นจากนั้นเป็นที่เก็บถาวรร้านค้าที่เราใส่ข้อมูลเมื่อเราไม่ได้อยู่อีกต่อไป ต้องการมันและในที่สุดก็เป็นกระบวนการล้างข้อมูล คุณเห็นการสร้างแบบจำลองข้อมูลที่เหมาะสมในการจัดการวงจรข้อมูลทั้งหมดนี้อย่างไร

Ron Huizenga: นั่นเป็นคำถามที่ดีมากและสิ่งหนึ่งที่ฉันไม่ได้มีเวลาที่จะเจาะลึกลงไปในรายละเอียดใด ๆ ที่นี่ในวันนี้คือสิ่งที่เราเริ่มพูดถึงคือสายข้อมูล ดังนั้นสิ่งที่เราทำได้จริง ๆ ก็คือเรามีความสามารถของสายดาต้าในเครื่องมือของเราและอย่างที่ฉันบอกว่าเราสามารถดึงบางส่วนออกจากเครื่องมือ ETL ได้ แต่คุณสามารถแมปได้ด้วยการวาดสายเลือดเช่นกัน โมเดลข้อมูลหรือฐานข้อมูลใด ๆ ที่เราจับภาพและนำมาเป็นโมเดลเราสามารถอ้างอิงโครงสร้างจากนั้นในไดอะแกรมสายเลือดข้อมูลของเรา

สิ่งที่เราสามารถทำได้คือวาดการไหลของข้อมูลอย่างที่คุณพูดตั้งแต่ต้นทางถึงเป้าหมายและตลอดวงจรชีวิตโดยรวมของวิธีการที่ข้อมูลส่งผ่านระบบต่าง ๆ และสิ่งที่คุณกำลังหาคือเอาพนักงานกัน data - เป็นหนึ่งในรายการโปรดของฉันตามโครงการที่ฉันทำเมื่อหลายปีก่อน ฉันทำงานกับองค์กรที่มีข้อมูลพนักงานใน 30 ระบบที่แตกต่างกัน สิ่งที่เราทำลงไปที่นั่น - และรีเบคก้าก็โผล่ขึ้นมาสไลด์ข้อมูลดาต้าไลน์ - นี่คือสไลด์ข้อมูลดาต้าไลน์ที่ค่อนข้างง่าย แต่สิ่งที่เราสามารถทำได้คือนำโครงสร้างข้อมูลทั้งหมดมาอ้างอิงในแผนภาพแล้วเรา จริง ๆ แล้วสามารถเริ่มดูว่ากระแสระหว่างอะไรและหน่วยงานข้อมูลที่แตกต่างกันเหล่านั้นเชื่อมโยงกันในกระแสอย่างไร และเราสามารถไปได้ไกลกว่านั้นเช่นกัน นี่เป็นส่วนหนึ่งของ data flow หรือแผนภาพ lineage ที่เราเห็นที่นี่ หากคุณต้องการไปให้ไกลกว่านั้นเรายังมีส่วนธุรกิจสถาปนิกของชุดนี้และใช้สิ่งเดียวกัน

โครงสร้างข้อมูลใด ๆ ที่เราบันทึกไว้ในสภาพแวดล้อมการสร้างแบบจำลองข้อมูลนั้นสามารถอ้างอิงได้ในเครื่องมือสร้างแบบจำลองทางธุรกิจดังนั้นแม้ในแผนภาพรูปแบบธุรกิจของคุณหรือแผนภาพกระบวนการทางธุรกิจของคุณคุณสามารถอ้างอิงที่เก็บข้อมูลแต่ละรายการได้หากคุณต้องการ สภาพแวดล้อมการสร้างแบบจำลองข้อมูลและในขณะที่คุณกำลังใช้งานในโฟลเดอร์ในรูปแบบกระบวนการทางธุรกิจของคุณคุณสามารถระบุ CRUD ในสภาพแวดล้อมเหล่านั้นได้เช่นกันรวมถึงวิธีการที่ข้อมูลนั้นถูกบริโภคหรือผลิตออกมาและจากนั้นเราสามารถเริ่มสร้าง สิ่งต่างๆเช่นรายงานผลกระทบและการวิเคราะห์และไดอะแกรมจากนั้น

สิ่งที่เราตั้งเป้าหมายไว้และเรามีความสามารถมากมาย แต่หนึ่งในสิ่งที่เรามีเหมือนเสาประตูที่เรากำลังดูอยู่ขณะที่เราพัฒนาเครื่องมือของเราต่อไป สามารถที่จะแมปออกมาจากต้นจนจบสายดาต้าขององค์กรและวงจรชีวิตของข้อมูลทั้งหมด

Malcolm Chisholm: ถูก รีเบคก้าฉันได้รับอนุญาตอีกแล้วหรือยัง

รีเบคก้า Jozwiak: ฉันจะอนุญาตให้คุณอีกหนึ่งมัลคอล์มไปข้างหน้า

Malcolm Chisholm: ขอบคุณมาก. การคิดเกี่ยวกับการกำกับดูแลข้อมูลและการคิดเกี่ยวกับการสร้างแบบจำลองข้อมูลเราจะให้ทั้งสองกลุ่มทำงานร่วมกันอย่างมีประสิทธิภาพและเข้าใจซึ่งกันและกันได้อย่างไร

Eric Little: เป็นเรื่องที่น่าสนใจฉันคิดว่ามันขึ้นอยู่กับองค์กรและกลับไปที่แนวคิดก่อนหน้าของฉันคือในองค์กรที่มีความคิดริเริ่มทางธุรกิจขับเคลื่อนเราผูกติดอยู่ตัวอย่างเช่นฉันเป็นผู้นำทีมสถาปัตยกรรมข้อมูล แต่เรา ถูกผูกไว้กับผู้ใช้ทางธุรกิจและจริง ๆ แล้วเราช่วยให้พวกเขายืนขึ้นโปรแกรมการกำกับดูแลข้อมูลของพวกเขา วิธีการให้คำปรึกษาที่มากขึ้นอีกครั้ง แต่มันเป็นฟังก์ชั่นทางธุรกิจที่มากกว่า

สิ่งที่คุณต้องทำก็คือคุณต้องมีตัวจำลองข้อมูลและสถาปนิกที่เข้าใจธุรกิจจริง ๆ สามารถเชื่อมโยงกับผู้ใช้ทางธุรกิจและช่วยให้พวกเขายืนหยัดในกระบวนการกำกับดูแล ธุรกิจต้องการทำ แต่โดยทั่วไปแล้วเรามีความรู้ด้านเทคโนโลยีที่สามารถช่วยให้พวกเขาโดดเด่นในประเภทของโปรแกรมเหล่านั้น มันจะต้องมีการทำงานร่วมกัน แต่ไม่จำเป็นต้องเป็นเจ้าของธุรกิจ

Malcolm Chisholm: โอเคเยี่ยมเลย ขอขอบคุณ.

Dr. Eric Little: ถูก

รีเบคก้า Jozwiak: โอเคขอบคุณมาก สมาชิกผู้ชมฉันกลัวว่าเราจะไม่ได้รับคำถามของคุณ แต่ฉันจะทำให้แน่ใจว่าพวกเขาจะได้รับการส่งต่อไปยังแขกที่เหมาะสมที่เรามีในบรรทัดในวันนี้ ฉันต้องการขอบคุณมากสำหรับ Eric, Malcolm และ Ron ที่เป็นแขกของเราในวันนี้ นี่คือสิ่งที่ดีมากคน และถ้าคุณสนุกกับการออกอากาศทางเว็บของ IDERA ในวันนี้ IDERA น่าจะเข้าร่วมใน Hot Technologies ในวันพุธหน้าหากคุณต้องการเข้าร่วมพูดคุยเกี่ยวกับความท้าทายของการจัดทำดัชนีและ Oracles ดังนั้นอีกหัวข้อที่น่าสนใจ

ขอบคุณมากคนดูแลและเราจะพบคุณในครั้งต่อไป ลาก่อน.