Skip to main content
Global

4.7: مستودع البيانات

  • Page ID
    168363
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    نظرًا لأن المؤسسات قد بدأت في استخدام قواعد البيانات باعتبارها محور عملياتها، أصبحت الحاجة إلى الفهم الكامل للبيانات التي تجمعها والاستفادة منها واضحة أكثر فأكثر. ومع ذلك، فإن التحليل المباشر للبيانات اللازمة للعمليات اليومية ليس فكرة جيدة؛ فنحن لا نريد فرض ضرائب على عمليات الشركة أكثر مما نحتاج إليه. علاوة على ذلك، ترغب المؤسسات أيضًا في تحليل البيانات بالمعنى التاريخي: كيف تقارن البيانات التي لدينا اليوم مع نفس مجموعة البيانات في هذا الوقت من الشهر الماضي أو العام الماضي؟ من هذه الاحتياجات نشأ مفهوم مستودع البيانات.

    مفهوم مستودع البيانات بسيط: استخراج البيانات من واحدة أو أكثر من قواعد بيانات المؤسسة وتحميلها في مستودع البيانات (وهو بحد ذاته قاعدة بيانات أخرى) للتخزين والتحليل. ومع ذلك، فإن تنفيذ هذا المفهوم ليس بهذه البساطة. يجب تصميم مستودع البيانات بحيث يلبي المعايير التالية:

    • يستخدم البيانات غير التشغيلية. وهذا يعني أن مستودع البيانات يستخدم نسخة من البيانات من قواعد البيانات النشطة التي تستخدمها الشركة في عملياتها اليومية، لذلك يجب على مستودع البيانات سحب البيانات من قواعد البيانات الحالية على أساس منتظم ومجدول.
    • البيانات هي متغير الوقت. وهذا يعني أنه عندما يتم تحميل البيانات في مستودع البيانات، فإنها تتلقى طابعًا زمنيًا، مما يسمح بإجراء مقارنات بين فترات زمنية مختلفة.
    • يتم توحيد البيانات. نظرًا لأن البيانات الموجودة في مستودع البيانات تأتي عادةً من عدة مصادر مختلفة، فمن المحتمل ألا تستخدم البيانات نفس التعريفات أو الوحدات. على سبيل المثال، يسرد جدول الأحداث في قاعدة بيانات نوادي الطلاب تواريخ الأحداث باستخدام صيغة mm/dd/yyyyy (على سبيل المثال، 01/10/2013). قد يستخدم جدول في قاعدة بيانات أخرى التنسيق yy/mm/dd (على سبيل المثال، 13/01/10) للتواريخ. لكي يتطابق مستودع البيانات مع التواريخ، يجب الاتفاق على شكل تاريخ قياسي، ويجب تحويل جميع البيانات التي يتم تحميلها في مستودع البيانات لاستخدام هذا التنسيق القياسي. هذه العملية تسمى تحميل الاستخراج والتحويل (ETL).

    هناك مدرستان فكريتان أساسيتان عند تصميم مستودع البيانات: من أسفل إلى أعلى ومن أعلى إلى أسفل. يبدأ النهج التصاعدي بإنشاء مستودعات بيانات صغيرة، تسمى أسواق البيانات، لحل مشكلات تجارية محددة. عند إنشاء مجموعات البيانات هذه، يمكن دمجها في مستودع بيانات أكبر. يقترح النهج من أعلى إلى أسفل أنه يجب علينا البدء بإنشاء مستودع بيانات على مستوى المؤسسة ثم، عند تحديد احتياجات العمل المحددة، إنشاء مجموعات بيانات أصغر من مستودع البيانات.

    Behaviorism_1.gif
    الشكل\(\PageIndex{1}\): عملية مستودع البيانات (من أعلى إلى أسفل). الصورة من سوها جميل مرخصة بموجب CC BY-SA 4.0

    فوائد مستودعات البيانات

    تجد المؤسسات مستودعات البيانات مفيدة جدًا لأسباب عديدة:

    • القدرة على دمج البيانات من أنظمة متعددة منسقة ببرامج مختلفة وتجميعها للحصول على رؤية أعمق.
    • تجبر عملية تطوير مستودع البيانات المؤسسة على فهم البيانات بشكل أفضل مما تقوم بجمعه حاليًا، وبنفس القدر من الأهمية، ما هي البيانات التي لا يتم جمعها.
    • يوفر مستودع البيانات عرضًا مركزيًا لجميع البيانات التي يتم جمعها عبر المؤسسة ويوفر وسيلة لتحديد البيانات غير المتسقة.
    • بمجرد تحديد جميع البيانات على أنها متسقة، يمكن للمؤسسة إنشاء نسخة واحدة من الحقيقة. يعد هذا أمرًا مهمًا عندما تريد الشركة الإبلاغ عن إحصاءات متسقة عن نفسها، مثل الإيرادات أو أرقام الموظفين.
    • من خلال وجود مستودع بيانات، يمكن التقاط لقطات من البيانات بمرور الوقت. يؤدي ذلك إلى إنشاء سجل تاريخي للبيانات، مما يسمح بتحليل الاتجاهات.
    • يوفر مستودع البيانات أدوات لدمج البيانات، والتي يمكن أن توفر معلومات وتحليلات جديدة.