Skip to main content
Query

4.7: Data Warehouse

  • Page ID
    165010
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Kama mashirika yameanza kutumia database kama kiini cha shughuli zao, haja ya kuelewa kikamilifu na kujiinua data wanayokusanya imekuwa dhahiri zaidi na zaidi. Hata hivyo, kuchambua moja kwa moja data zinazohitajika kwa shughuli za kila siku sio wazo nzuri; hatutaki kulipa kodi ya shughuli za kampuni zaidi kuliko tunavyohitaji. Zaidi ya hayo, mashirika pia yanataka kuchambua data kwa maana ya kihistoria: Data tunayo leo inalinganishaje na data sawa iliyowekwa wakati huu mwezi uliopita au mwaka jana? Kutoka kwa mahitaji haya iliondoka dhana ya ghala la data.

    Dhana ya ghala la data ni rahisi: dondoo data kutoka kwenye database moja au zaidi ya shirika na uipakia kwenye ghala la data (ambayo yenyewe ni database nyingine) kwa ajili ya kuhifadhi na uchambuzi. Hata hivyo, utekelezaji wa dhana hii sio rahisi. Ghala la data linapaswa kuundwa ili kufikia vigezo vifuatavyo:

    • Inatumia data zisizo za uendeshaji. Hii ina maana kwamba ghala la data linatumia nakala ya data kutoka kwenye database zinazofanya kazi ambazo kampuni hutumia katika shughuli zake za kila siku, hivyo ghala la data linapaswa kuvuta data kutoka kwenye database zilizopo mara kwa mara, iliyopangwa.
    • Takwimu ni tofauti ya wakati. Hii ina maana kwamba wakati wowote data inapowekwa kwenye ghala la data, inapata muhuri wa muda, ambayo inaruhusu kulinganisha kati ya vipindi tofauti vya wakati.
    • Takwimu ni sanifu. Kwa sababu data katika ghala data kawaida linatokana na vyanzo mbalimbali, inawezekana kwamba data haitumii ufafanuzi huo au vitengo. Kwa mfano, meza yetu ya Matukio katika database yetu ya Vilabu vya Wanafunzi inaorodhesha tarehe za tukio kwa kutumia muundo wa mm/dd/yyyy (kwa mfano, 01/10/2013). Jedwali katika database nyingine inaweza kutumia muundo y/mm/dd (kwa mfano, 13/01/10) kwa tarehe. Kwa ghala la data ili kufanana na tarehe, muundo wa tarehe ya kawaida unapaswa kukubaliana, na data zote zilizobeba kwenye ghala la data zingebadilishwa ili kutumia muundo huu wa kawaida. Utaratibu huu unaitwa extraction-mabadiliko-mzigo (ETL).

    Kuna shule mbili za msingi za mawazo wakati wa kubuni ghala la data: chini-up na juu-chini. Njia ya chini-up huanza kwa kuunda maghala madogo ya data, inayoitwa data marts, kutatua matatizo maalum ya biashara. Kama hizi marts data ni kuundwa, wanaweza kuwa pamoja katika kubwa data ghala. Mbinu ya juu-chini inaonyesha kwamba tunapaswa kuanza kwa kuunda ghala la data la biashara nzima na kisha, kama mahitaji maalum ya biashara yanatambuliwa, tengeneze mikokoteni ndogo ya data kutoka kwenye ghala la data.

    Behaviorism_1.gif
    Kielelezo\(\PageIndex{1}\): Mchakato wa ghala la data (juu chini). Picha na Soha jamil ina leseni chini ya CC BY-SA 4.0

    Faida za Maghala ya Data

    Mashirika hupata maghala ya data yenye manufaa kwa sababu nyingi:

    • Uwezo wa kuunganisha data kutoka kwa mifumo mingi iliyopangwa na programu tofauti na kuikusanya ili kupata ufahamu zaidi.
    • Mchakato wa kuendeleza ghala la data unasababisha shirika kuelewa data bora zaidi kuliko sasa inakusanya na, muhimu pia, ni data gani isiyokusanywa.
    • Ghala la data hutoa mtazamo wa kati wa data zote zinazokusanywa katika biashara na hutoa njia za kuamua data zisizofanana.
    • Mara baada ya data zote kutambuliwa kama thabiti, shirika linaweza kuzalisha toleo moja la ukweli. Hii ni muhimu wakati kampuni inataka kuripoti takwimu thabiti kuhusu yenyewe, kama vile mapato au idadi ya wafanyakazi.
    • Kwa kuwa na ghala la data, picha za data zinaweza kuchukuliwa kwa muda. Hii inajenga rekodi ya kihistoria ya data, ambayo inaruhusu uchambuzi wa mwenendo.
    • Ghala la data hutoa zana za kuchanganya data, ambayo inaweza kutoa habari mpya na uchambuzi.