เวลาในการอ่านโดยประมาณ: 7 นาที
หากมีข้อมูลที่มาจากแหล่งต่างๆ ไม่ว่าจะเป็น CRM, ฟีดโซเชียลมีเดีย หรือข้อมูลเหตุการณ์เชิงพฤติกรรม และข้อมูลนี้มีแนวโน้มที่จะจัดเก็บไว้ในเครื่องมือและระบบต่างๆ ทั่วทั้งกลุ่มเทคโนโลยี (เช่น ระบบเดิม เครื่องมือบนคลาวด์ และ คลังข้อมูล o ทะเลสาบ).
ขั้นตอนแรกในการประสานข้อมูลคือการรวบรวมและจัดระเบียบข้อมูลจากแหล่งต่างๆ เหล่านี้ทั้งหมด และตรวจสอบให้แน่ใจว่าข้อมูลมีการจัดรูปแบบอย่างถูกต้องสำหรับปลายทางเป้าหมาย ซึ่งนำเราไปสู่: การเปลี่ยนแปลง
ข้อมูลมีอยู่หลายรูปแบบ อาจเป็นแบบมีโครงสร้าง ไม่มีโครงสร้าง หรือกึ่งมีโครงสร้าง หรือเหตุการณ์เดียวกันอาจมีรูปแบบการตั้งชื่อที่แตกต่างกันระหว่างสองทีมภายใน ตัวอย่างเช่น ระบบหนึ่งอาจรวบรวมและจัดเก็บวันที่เป็น 21 เมษายน 2022 และอีกระบบอาจจัดเก็บในรูปแบบตัวเลข 20220421
เพื่อให้เข้าใจถึงข้อมูลทั้งหมดนี้ บริษัทต่างๆ มักจะต้องแปลงข้อมูลให้อยู่ในรูปแบบมาตรฐาน การเรียบเรียงข้อมูลสามารถช่วยลดภาระในการปรับข้อมูลทั้งหมดนี้ด้วยตนเอง และนำการเปลี่ยนแปลงไปใช้ตามนโยบายการกำกับดูแลข้อมูลและแผนการตรวจสอบขององค์กรของคุณ
ส่วนสำคัญของการประสานข้อมูลคือการทำให้ข้อมูลพร้อมสำหรับการเปิดใช้งาน สิ่งนี้เกิดขึ้นเมื่อข้อมูลที่รวมและสะอาดหมดจดถูกส่งไปยังเครื่องมือดาวน์สตรีมเพื่อใช้งานทันที (เช่น การสร้างผู้ชมแคมเปญหรือการอัปเดตแดชบอร์ดระบบธุรกิจอัจฉริยะ)
การจัดเรียงข้อมูลโดยพื้นฐานแล้วคือการยกเลิกข้อมูลที่ถูกแยกส่วนและระบบที่กระจัดกระจาย Alluxio ชื่นชม ว่าเทคโนโลยีข้อมูลมีการเปลี่ยนแปลงครั้งใหญ่ทุกๆ 3-8 ปี ซึ่งหมายความว่าบริษัทที่มีอายุ 21 ปีอาจใช้ระบบการจัดการข้อมูลที่แตกต่างกัน 7 ระบบตั้งแต่เริ่มก่อตั้ง
การจัดระเบียบข้อมูลยังช่วยให้คุณปฏิบัติตามกฎหมายความเป็นส่วนตัวของข้อมูล ขจัดปัญหาคอขวดของข้อมูล และบังคับใช้การกำกับดูแลข้อมูล ซึ่งเป็นเหตุผลที่ดีเพียงสามข้อ (จากหลาย ๆ เหตุผล) ที่ต้องดำเนินการ
กฎหมายความเป็นส่วนตัวของข้อมูล เช่น GDPR และ CCPA มีแนวทางที่เข้มงวดในการรวบรวม การใช้ และจัดเก็บข้อมูล ส่วนหนึ่งของการปฏิบัติตามข้อกำหนดคือการให้ทางเลือกแก่ผู้บริโภคในการเลือกยกเลิกการรวบรวมข้อมูลหรือขอให้บริษัทของคุณลบข้อมูลส่วนบุคคลทั้งหมดของพวกเขา หากคุณไม่มีการจัดการที่ดีเกี่ยวกับสถานที่จัดเก็บข้อมูลของคุณและใครที่เข้าถึงข้อมูลได้ การตอบสนองความต้องการนี้อาจเป็นเรื่องยาก
นับตั้งแต่มีการบังคับใช้ GDPR เราได้เห็นคำขอให้ลบข้อมูลนับล้านครั้ง จำเป็นอย่างยิ่งที่จะต้องมีความเข้าใจอย่างมั่นคงเกี่ยวกับวงจรชีวิตทั้งหมดของ ข้อมูล เพื่อให้แน่ใจว่าไม่มีอะไรหนีรอดไปได้
ปัญหาคอขวดถือเป็นความท้าทายอย่างต่อเนื่องหากไม่มีการประสานข้อมูล สมมติว่าคุณเป็นบริษัทที่มีระบบจัดเก็บข้อมูลหลายระบบซึ่งคุณต้องค้นหาข้อมูล บุคคลที่รับผิดชอบในการสืบค้นระบบเหล่านี้มีแนวโน้มที่จะมีคำขอจำนวนมากที่ต้องกรอง ซึ่งหมายความว่าอาจมีความล่าช้าระหว่างทีม ที่พวกเขาต้องการ ของข้อมูลและผู้ที่อยู่ในนั้น พวกเขาได้รับ ได้อย่างมีประสิทธิภาพ ส่งผลให้ข้อมูลล้าสมัยได้
ในสภาพแวดล้อมที่มีการจัดการอย่างดี การเริ่มและหยุดประเภทนี้จะถูกยกเลิกไป ข้อมูลของคุณจะถูกส่งไปยังเครื่องมือดาวน์สตรีมเพื่อเปิดใช้งานแล้ว (และข้อมูลนั้นจะเป็นมาตรฐาน ซึ่งหมายความว่าคุณสามารถมั่นใจในคุณภาพของข้อมูลได้)
การกำกับดูแลข้อมูลทำได้ยากเมื่อมีการกระจายข้อมูลไปยังหลายระบบ บริษัทต่างๆ ไม่มีมุมมองที่สมบูรณ์เกี่ยวกับวงจรชีวิตของข้อมูล และความไม่แน่นอนเกี่ยวกับข้อมูลที่ถูกจัดเก็บ (เช่น นกพิราบ) ก่อให้เกิดช่องโหว่ เช่น การปกป้องข้อมูลที่สามารถระบุตัวบุคคลได้ไม่เพียงพอ
Data Orchestration ช่วยแก้ไขปัญหานี้โดยให้ความโปร่งใสมากขึ้นในการจัดการข้อมูล สิ่งนี้ช่วยให้บริษัทต่างๆ สามารถบล็อกข้อมูลที่ไม่ถูกต้องในเชิงรุกก่อนที่จะเข้าถึงฐานข้อมูลหรือส่งผลกระทบต่อการรายงาน และตั้งค่าสิทธิ์สำหรับการเข้าถึงข้อมูล
มีความท้าทายหลายประการที่อาจเกิดขึ้นได้เมื่อพยายามนำ Data Orchestration ไปใช้ ต่อไปนี้คือสิ่งที่พบบ่อยที่สุดที่ควรทราบและวิธีหลีกเลี่ยง
ไซโลข้อมูลเป็นเรื่องปกติ (หากไม่เป็นอันตราย) เกิดขึ้นในหมู่ธุรกิจต่างๆ เมื่อกลุ่มเทคโนโลยีพัฒนาขึ้นและทีมต่างๆ เป็นเจ้าของประสบการณ์ของลูกค้าในแง่มุมที่แตกต่างกัน ทุกอย่างจึงง่ายเกินไปที่ข้อมูลจะถูกแยกออกจากเครื่องมือและระบบต่างๆ แต่ผลลัพธ์ที่ได้คือความเข้าใจที่ไม่สมบูรณ์เกี่ยวกับผลการดำเนินงานของบริษัท ตั้งแต่จุดบอดในการเดินทางของลูกค้าไปจนถึงความไม่ไว้วางใจในความถูกต้องของการวิเคราะห์และการรายงาน
ธุรกิจมักจะมีข้อมูลที่ไหลจากหลายจุดติดต่อไปยังเครื่องมือที่แตกต่างกัน แต่การทำลายไซโลเป็นสิ่งสำคัญหากบริษัทเหล่านี้ต้องการได้รับคุณค่าจากข้อมูลของตน
ในช่วงไม่กี่ปีที่ผ่านมา มีแนวโน้มบางประการเกี่ยวกับวิธีที่บริษัทต่างๆ จัดการโฟลว์และการเปิดใช้งานข้อมูลของตน ตัวอย่างนี้คือการประมวลผลข้อมูลแบบเรียลไทม์ ซึ่งก็คือเมื่อข้อมูลได้รับการประมวลผลภายในมิลลิวินาทีของรุ่น ข้อมูลแบบเรียลไทม์กลายเป็นสิ่งสำคัญในทุกอุตสาหกรรม โดยมีบทบาทสำคัญในIoT (เช่น เซนเซอร์จับความใกล้เคียงในรถยนต์) การดูแลสุขภาพ การจัดการห่วงโซ่อุปทาน การตรวจจับการฉ้อโกง และการปรับเปลี่ยนในแบบของคุณแทบจะในทันที โดยเฉพาะอย่างยิ่งกับความก้าวหน้าในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ ข้อมูลแบบเรียลไทม์ช่วยให้อัลกอริทึมและปัญญาประดิษฐ์ เพื่อเรียนรู้อย่างรวดเร็ว
แนวโน้มอีกประการหนึ่งคือการเปลี่ยนมาใช้เทคโนโลยีตาม เมฆ. ในขณะที่บางบริษัทได้ย้ายไปอยู่โดยสิ้นเชิง เมฆส่วนบริษัทอื่นๆ อาจยังคงมีการผสมผสานระหว่างระบบภายในองค์กรและโซลูชันบนคลาวด์
จากนั้น ก็มีวิวัฒนาการของวิธีการสร้างและใช้งานซอฟต์แวร์ ซึ่งส่งผลต่อวิธีการประสานข้อมูล
– ไม่รวมการล้างข้อมูลและการตรวจสอบความถูกต้อง
– ไม่ทดสอบขั้นตอนการทำงานเพื่อให้แน่ใจว่ากระบวนการราบรื่นและเหมาะสมที่สุด
– การตอบสนองต่อปัญหาต่างๆ ล่าช้า เช่น ข้อมูลไม่สอดคล้องกัน ข้อผิดพลาดของเซิร์ฟเวอร์ ปัญหาคอขวด
– ไม่มีเอกสารที่ชัดเจนเกี่ยวกับการแมปข้อมูล สายข้อมูล และแผนการตรวจสอบ
หากต้องการวัด ROI ของการเรียบเรียงข้อมูล:
– ทำความเข้าใจประสิทธิภาพขั้นพื้นฐาน
– มีเป้าหมาย KPI และวัตถุประสงค์ที่ชัดเจนในการประสานข้อมูล
– คำนวณต้นทุนรวมของเทคโนโลยีที่ใช้ พร้อมด้วยเวลาและทรัพยากรภายใน
– วัดตัวชี้วัดที่สำคัญ เช่น เวลาที่บันทึกไว้ ความเร็วในการประมวลผล และความพร้อมของข้อมูล เป็นต้น
BlogInnovazione.it
ผู้คนนับล้านชำระค่าบริการสตรีมมิ่ง โดยจ่ายค่าธรรมเนียมการสมัครสมาชิกรายเดือน เป็นความเห็นทั่วไปที่คุณ...
Coveware by Veeam จะยังคงให้บริการตอบสนองต่อเหตุการณ์การขู่กรรโชกทางไซเบอร์ต่อไป Coveware จะนำเสนอความสามารถในการนิติเวชและการแก้ไข...
การบำรุงรักษาเชิงคาดการณ์กำลังปฏิวัติภาคส่วนน้ำมันและก๊าซ ด้วยแนวทางเชิงรุกและนวัตกรรมในการจัดการโรงงาน...
UK CMA ได้ออกคำเตือนเกี่ยวกับพฤติกรรมของ Big Tech ในตลาดปัญญาประดิษฐ์ ที่นั่น…