Skip to main content
Global

4.7: डेटा वेयरहाउस

  • Page ID
    169559
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    चूंकि संगठनों ने डेटाबेस को अपने संचालन के केंद्र बिंदु के रूप में उपयोग करना शुरू कर दिया है, इसलिए उनके द्वारा एकत्र किए जा रहे डेटा को पूरी तरह से समझने और उनका लाभ उठाने की आवश्यकता अधिक से अधिक स्पष्ट हो गई है। हालांकि, दिन-प्रतिदिन के संचालन के लिए आवश्यक डेटा का सीधे विश्लेषण करना एक अच्छा विचार नहीं है; हम कंपनी के परिचालनों पर हमारी जरूरत से ज्यादा टैक्स नहीं लगाना चाहते हैं। इसके अलावा, संगठन ऐतिहासिक अर्थ में भी डेटा का विश्लेषण करना चाहते हैं: आज हमारे पास जो डेटा है, उसकी तुलना पिछले महीने या पिछले साल इस बार के समान डेटा के साथ कैसे की जाती है? इन जरूरतों से डेटा वेयरहाउस की अवधारणा उत्पन्न हुई।

    डेटा वेयरहाउस अवधारणा सरल है: संगठन के एक या अधिक डेटाबेस से डेटा निकालें और इसे भंडारण और विश्लेषण के लिए डेटा वेयरहाउस (जो स्वयं एक अन्य डेटाबेस है) में लोड करें। हालाँकि, इस अवधारणा का निष्पादन इतना सरल नहीं है। एक डेटा वेयरहाउस डिज़ाइन किया जाना चाहिए ताकि वह निम्नलिखित मानदंडों को पूरा करे:

    • यह गैर-परिचालन डेटा का उपयोग करता है। इसका मतलब यह है कि डेटा वेयरहाउस उन सक्रिय डेटाबेस से डेटा की एक प्रति का उपयोग करता है जो कंपनी अपने दिन-प्रतिदिन के संचालन में उपयोग करती है, इसलिए डेटा वेयरहाउस को मौजूदा डेटाबेस से नियमित, निर्धारित आधार पर डेटा खींचना चाहिए।
    • डेटा टाइम-वेरिएंट है। इसका अर्थ है कि जब भी डेटा वेयरहाउस में डेटा लोड किया जाता है, तो उसे टाइमस्टैम्प प्राप्त होता है, जो अलग-अलग समयावधियों के बीच तुलना करने की अनुमति देता है।
    • डेटा मानकीकृत है। क्योंकि डेटा वेयरहाउस में डेटा आमतौर पर कई अलग-अलग स्रोतों से आता है, इसलिए संभव है कि डेटा समान परिभाषा या इकाइयों का उपयोग न करे। उदाहरण के लिए, हमारे स्टूडेंट क्लब डेटाबेस में हमारी ईवेंट तालिका mm/dd/yyyy प्रारूप (उदाहरण के लिए, 01/10/2013) का उपयोग करके ईवेंट की तारीखों को सूचीबद्ध करती है। किसी अन्य डेटाबेस में एक तालिका तिथियों के लिए प्रारूप yy/mm/dd (उदाहरण के लिए, 13/01/10) का उपयोग कर सकती है। डेटा वेयरहाउस के लिए तारीखों से मेल खाने के लिए, एक मानक दिनांक प्रारूप पर सहमति होनी चाहिए, और डेटा वेयरहाउस में लोड किए गए सभी डेटा को इस मानक प्रारूप का उपयोग करने के लिए परिवर्तित करना होगा। इस प्रक्रिया को एक्सट्रैक्शन-ट्रांसफॉर्मेशन-लोड (ETL) कहा जाता है।

    डेटा वेयरहाउस डिज़ाइन करते समय विचार के दो प्राथमिक स्कूल होते हैं: बॉटम-अप और टॉप-डाउन। विशिष्ट व्यावसायिक समस्याओं को हल करने के लिए डेटा मार्ट नामक छोटे डेटा वेयरहाउस बनाने से बॉटम-अप दृष्टिकोण शुरू होता है। जैसे ही ये डेटा मार्ट बनाए जाते हैं, उन्हें एक बड़े डेटा वेयरहाउस में जोड़ा जा सकता है। टॉप-डाउन दृष्टिकोण से पता चलता है कि हमें एक एंटरप्राइज़-वाइड डेटा वेयरहाउस बनाकर शुरू करना चाहिए और फिर, जैसा कि विशिष्ट व्यावसायिक आवश्यकताओं की पहचान की जाती है, डेटा वेयरहाउस से छोटे डेटा मार्ट बनाएं।

    Behaviorism_1.gif
    चित्र\(\PageIndex{1}\): डेटा वेयरहाउस प्रक्रिया (ऊपर नीचे)। सोहा जमील की छवि CC BY-SA 4.0 के तहत लाइसेंस प्राप्त है

    डेटा वेयरहाउस के लाभ

    संगठनों को कई कारणों से डेटा वेयरहाउस काफी फायदेमंद लगता है:

    • विभिन्न सॉफ़्टवेयर के साथ स्वरूपित कई प्रणालियों से डेटा को एकीकृत करने और गहन जानकारी प्राप्त करने के लिए इसे संकलित करने की क्षमता
    • डेटा वेयरहाउस विकसित करने की प्रक्रिया एक संगठन को वर्तमान में एकत्रित डेटा की तुलना में बेहतर समझने के लिए मजबूर करती है और, उतना ही महत्वपूर्ण है कि कौन सा डेटा एकत्र नहीं किया जा रहा है।
    • एक डेटा वेयरहाउस पूरे उद्यम में एकत्र किए जा रहे सभी डेटा का एक केंद्रीकृत दृश्य प्रदान करता है और असंगत डेटा निर्धारित करने के लिए एक साधन प्रदान करता है।
    • एक बार जब सभी डेटा को सुसंगत के रूप में पहचाना जाता है, तो एक संगठन सच्चाई का एक संस्करण उत्पन्न कर सकता है। यह तब महत्वपूर्ण है जब कंपनी अपने बारे में लगातार आंकड़ों की रिपोर्ट करना चाहती है, जैसे कि राजस्व या कर्मचारियों की संख्या।
    • डेटा वेयरहाउस होने से समय के साथ डेटा का स्नैपशॉट लिया जा सकता है। यह डेटा का एक ऐतिहासिक रिकॉर्ड बनाता है, जो रुझानों का विश्लेषण करने की अनुमति देता है।
    • एक डेटा वेयरहाउस डेटा को संयोजित करने के लिए उपकरण प्रदान करता है, जो नई जानकारी और विश्लेषण प्रदान कर सकता है।