ما المقصود بنمذجة البيانات؟
نمذجة البيانات هي عملية إنشاء تمثيل مرئي أو مخطط يوضح أنظمة جمع المعلومات وأنظمة الإدارة في أي منظمة. يُساعد هذا المخطط أو نموذج البيانات مختلف أصحاب المصلحة، مثل محللي البيانات والعلماء والمصممين، في إنشاء طريقة عرض موحدة لبيانات المنظمة. يوضح النموذج البيانات التي تجمعها الشركة، والعلاقة بين مختلف مجموعات البيانات، والطرق التي ستُستخدم في تخزين البيانات وتحليليها.
ما سبب أهمية نمذجة البيانات؟
تقوم المنظمات في الوقت الحالي بجمع كميات كبيرة من البيانات من العديد من المصادر المختلفة. إلا إن البيانات الخام ليست كافيةً. تحتاج إلى تحليل البيانات لتحصل على رؤىً قابلة للتنفيذ توجهك في اتخاذ قرارات تجارية مثمرة. إن الدقة في تحليل البيانات تستلزم الكفاءة في جمع البيانات وتخزينها ومعالجتها. توجد العديد من تقنيات قواعد البيانات وأدوات معالجة البيانات، وإن التنوع في مجموعات البيانات يستلزم التنوع في الأدوات لتحقيق الكفاءة في التحليل.
إن نمذجة البيانات تمنحك الفرصة لفهم بياناتك واتخاذ الخيارات التقنية المناسبة لتخزين هذه البيانات وإدارتها. وبنفس الطريقة التي يصمم بها المهندس المعماري مخططًا قبل بناء منزل، يقوم أصحاب المصلحة بالشركة بتصميم نموذج بيانات قبل أن يصمموا حلول قواعد البيانات لمنظمتهم.
نمذجة البيانات تحقق المزايا التالية:
- تقليل الأخطاء التي تحدث في تطوير قواعد البيانات
- تحقيق السرعة والكفاءة عند تصميم قواعد البيانات وإنشائها
- تحقيق الاتساق في وثائق البيانات وتصميم الأنظمة داخل المنظمة
- تسهيل التواصل بين مهندسي البيانات وفرق ذكاء الأعمال
ما أنواع نماذج البيانات؟
تبدأ نمذجة البيانات عادةً بتمثيل البيانات من منظور المفاهيم ثم تمثيلها مرةً أخرى في سياق التقنيات المختارة. يقوم المحللون وأصحاب المصلحة بإنشاء أنواع مختلفة من نماذج البيانات أثناء مرحلة تصميم البيانات. فيما يأتي ثلاثة أنواع أساسية من نماذج البيانات:
نموذج البيانات المفاهيمي
نماذج البيانات المفاهيمية تقدم طريقة عرض كبيرة وشاملة للبيانات. وهي توضح ما يلي:
- ما تتضمنه البيانات
- سمات البيانات والشروط أو القيود المفروضة على البيانات
- قواعد الأعمال التي ترتبط بها البيانات
- أفضل طريقة لتنظيم البيانات
- متطلبات نزاهة البيانات والأمان
وعادةً يقوم أصحاب المصلحة والمحللون في قطاع الأعمال بإنشاء النموذج المفاهيمي. هذا النموذج عبارة عن تمثيل تخطيطي بسيط لا يلتزم بالقواعد الرسمية الخاصة بنمذجة البيانات. والشيء المهم هو أنه يساعد كل من أصحاب المصلحة الفنيين وغير الفنيين في مشاركة رؤية مشتركة والاتفاق على الغرض من مشروع البيانات الخاص بهم والاتفاق على نطاقه وتصميمه.
أمثلة على نموذج البيانات المفاهيمي
على سبيل المثال، نموذج البيانات المفاهيمي لأحد وكالات بيع السيارات قد يعرض كيانات بيانات مثل ما يلي:
- كيان "صالات العرض" يمثل معلومات حول مختلف المنافذ التي تمتلكها الوكالة
- كيان "السيارات" يمثل العديد من السيارات التي تبيعها الوكالة في الوقت الحالي
- كيان "العملاء" يمثل جميع العملاء الذين أجروا عملية شراء في الوكالة
- كيان "المبيعات" يمثل معلومات حول المبيعات الفعلية
- كيان "مندوبو المبيعات" يمثل معلومات حول جميع مندوبي المبيعات الذين يعملون لدى الوكالة
يتضمن هذا النموذج المفاهيمي أيضًا متطلبات أعمال، مثل ما يلي:
- كل سيارة يجب أن تنتمي إلى صالة عرض معينة.
- يجب أن يكون لكل عملية بيع مندوب مبيعات واحد على الأقل وأن يرتبط بها عميل واحد على الأقل.
- يجب أن تحمل كل سيارة اسم علامة تجارية ورقم منتج.
- يجب على كل عميل أن يقدم رقم هاتفه وعنوان بريده الإلكتروني.
وبالتالي، تعمل النماذج المفاهيمية كجسر يربط بين قواعد الأعمال والنظام الأساسي الخاص بإدارة قواعد البيانات المادية (DBMS). نماذج البيانات المفاهيمية تسمى أيضًا نماذج المجال.
نموذج البيانات المنطقي
تقوم نماذج البيانات المنطقية بتعيين فئات البيانات المفاهيمية إلى هياكل بيانات فنية. وهذه النماذج تقدم تفاصيل أكثر حول مفاهيم البيانات وعلاقات البيانات المعقدة التي تم تحديدها في نموذج البيانات المفاهيمية، مثل ما يلي:
- أنواع البيانات للسمات المختلفة (على سبيل المثال، سلسلة أو رقم)
- العلاقات بين كيانات البيانات
- السمات الأساسية أو الحقول الأساسية في البيانات
يتعاون مهندسو البيانات مع محللي البيانات في إنشاء النموذج المنطقي. وعند إنشاء التمثيل، يلتزمون بأحد الأنظمة الرسمية المتعددة لنمذجة البيانات. في بعض الأحيان، قد تختار فرق أجايل (agile) تخطي هذه الخطوة والانتقال مباشرةً من النماذج المفاهيمية إلى النماذج المادية. ومع ذلك، فإن هذه النماذج مفيدة في تصميم قواعد البيانات الكبيرة، التي تسمى مستودعات البيانات، وفي تصميم أنظمة إعداد التقارير التلقائية.
أمثلة على نماذج البيانات المنطقية
في مثال بيع السيارات الذي نتناوله، يقوم نموذج البيانات المنطقي بتوسيع النموذج المفاهيمي ويتعمق أكثر في فئات البيانات على النحو التالي:
- يحتوي الكيان "صالات العرض" على حقول مثل الاسم والموقع كبيانات نصية وعلى رقم هاتف كبيانات عددية.
- يشتمل الكيان "العملاء" على حقل عنوان بريد إلكتروني بالتنسيق xxx@example.com أو xxx@example.com.yy. يجب ألا يزيد اسم الحقل عن 100 حرف.
- يحتوي الكيان "المبيعات" على حقل اسم العميل وحقل اسم مندوب المبيعات، بالإضافة إلى تاريخ عملية البيع في صورة نوع بيانات "تاريخ" والمبلغ في صورة نوع بيانات "عشري".
وبالتالي، تعمل النماذج المنطقية كجسر يربط بين نموذج البيانات المفاهيمي والتقنية الأساسية ولغة قاعدة البيانات التي يستخدمها المطورون في إنشاء قاعدة البيانات. ومع ذلك، فهي نماذج حيادية من الناحية التقنية، ويمكنك تنفيذها بأي لغة قاعدة بيانات. يتخذ مهندسو البيانات وأصحاب المصلحة عادةً القرارات التقنية بعد قيامهم بإنشاء نموذج بيانات منطقي.
نموذج البيانات المادي
تقوم نماذج البيانات المادية بتعيين نماذج البيانات المنطقية على تقنية نظام DBMS محددة واستخدام مصطلحات البرامج. على سبيل المثال، تقدم تفاصيل حول ما يلي:
- أنواع حقول البيانات كما هي ممثلة في نظام DBMS
- علاقات البيانات كما هي ممثلة في نظام DBMS
- تفاصيل إضافية، مثل ضبط فعالية الأداء
يقوم مهندسو البيانات بإنشاء النموذج المادي قبل تنفيذ التصميم النهائي. وهي تتبع أيضًا تقنيات نمذجة البيانات الرسمية للتأكد من أنها قد تناولت جميع جوانب التصميم.
أمثلة على نماذج البيانات المادية
افترض أن وكالة السيارات قد قررت إنشاء أرشيف بيانات في Amazon S3 Glacier Flexible Retrieval. يصف نموذج البيانات المادية المواصفات التالية:
- في "المبيعات"، مبلغ عملية البيع هو نوع بيانات float (عائم)، وتاريخ عملية البيع هو نوع بيانات ذو طابع زمني.
- في "العملاء"، اسم العميل هو نوع بيانات سلسلة.
- في مصطلحات استرداد S3 Glacier Flexible Retrieval، المخزن هو موقع جغرافي لبياناتك.
يتضمن نموذج البيانات المادي أيضًا تفاصيل إضافية مثل منطقة AWS التي تنشئ فيها مخزنك. وبالتالي، يعمل نموذج البيانات المادية كجسر يربط بين نموذج البيانات المنطقي والتنفيذ النهائي للتقنية.
ما أنواع تقنيات نمذجة البيانات؟
تقنيات نمذجة البيانات هي الطرق المختلفة التي يمكنك استخدامها في إنشاء نماذج بيانات مختلفة. تطورت هذه الطرق بمرور الوقت كنتيجة للابتكارات في مفاهيم قواعد البيانات وفي حوكمة البيانات. فيما يلي الأنواع الأساسية لنمذجة البيانات:
نمذجة البيانات الهرمية
في نمذجة البيانات الهرمية، يمكنك تمثيل العلاقات بين مختلف عناصر البيانات في تنسيق يشبه الشجرة. نماذج البيانات الهرمية تمثل علاقات واحد إلى متعدد، مع تعيين فئات البيانات الأصل أو الجذر للكثير من الفئات التابعة.
في مثال وكالة السيارات، تتضمن صالات العرض كلاً من الكيان السيارات والكيان مندوب المبيعات ككيانات تابعة لأن صالة العرض الواحدة يوجد بها العديد من السيارات ويعمل بها العديد من مندوبي المبيعات.
نمذجة البيانات الرسومية
تطورت نمذجة البيانات الهرمية بمرور الوقت لتصبح نمذجة بيانات رسومية. نماذج البيانات الرسومية تمثل علاقات البيانات التي تعامل الكيانات بالتساوي. تربط الكيانات مع بعضها من خلال علاقات واحد إلى واحد أو علاقات متعدد إلى متعدد بدون أي مفهوم أصل أو تابع.
على سبيل المثال، يمكن أن تشتمل صالة العرض الواحدة على العديد من مندوبي المبيعات، ويمكن لمندوب مبيعات واحد أيضًا العمل في عدة صالات عرض إذا كانت نوباتها تختلف حسب الموقع.
نمذجة البيانات العلائقية
نمذجة البيانات العلائقية هي طريقة نمذجة شائعة تعرض فئات البيانات بطريقة مرئية في صورة جداول. تنضم جداول البيانات المختلفة إلى بعضها أو ترتبط ببعضها باستخدام مفاتيح تمثل علاقة الكيان بالعالم الحقيقي. يُمكنك استخدام تقنية قواعد البيانات العلائقية في تخزين البيانات المهيكلة، ويعتبر نموذج البيانات العلائقية طريقةً مفيدةً في تمثيل بنية قواعد البيانات العلائقية.
على سبيل المثال، يكون لدى وكالة السيارات نماذج بيانات علائقية تمثل الجدول "مندوبو المبيعات" والجدول "السيارات"، كما هو موضح هنا:
معرّف مندوب المبيعات | الاسم |
1 | جين |
2 | جوان |
معرّف السيارة | ماركة السيارة |
C1 | XYZ |
C2 | ABC |
معرّف البائع ومعرّف السيارة هما مفتاحان أساسيان يحددان بشكل فريد كيانات العالم الحقيقي الفردية. في الجدول "صالة العرض"، تعمل هذه المفاتيح الأساسية كمفاتيح خارجية تربط بين أجزاء البيانات.
معرّف صالة العرض | اسم صالة العرض | معرّف مندوب المبيعات | معرّف السيارة |
S1 | صالة عرض نيويورك | 1 | C1 |
في قواعد البيانات العلائقية، يعمل المفتاح الأساسي والمفتاح الخارجي معًا لإظهار علاقة البيانات. يوضح الجدول السابق أن صالات العرض تحتوي على مندوبي مبيعات وسيارات.
نمذجة البيانات بطريقة العلاقات بين الكيانات
تقوم نمذجة البيانات بطريقة العلاقات بين الكيانات (ER) باستخدام مخططات رسمية لتمثيل العلاقات بين الكيانات في قاعدة بيانات. يستخدم مهندسو البيانات العديد من أدوات النمذجة بطريقة العلاقات بين الكيانات (ER) لتمثيل البيانات.
نمذجة البيانات الموجهة للكائنات
تستخدم البرمجة الموجهة للكائنات هياكل بيانات تُسمى "كائنات" لتخزين البيانات. كائنات البيانات هذه هي عبارة عن تجريدات برمجية لكيانات العالم الحقيقي. على سبيل المثال، في نموذج البيانات الموجه للكائنات، يكون لدى وكالة السيارات كائنات بيانات مثل الكيان "العملاء" الذي يشتمل على سمات مثل الاسم والعنوان ورقم الهاتف. ستقوم بتخزين بيانات العميل حتى يتم تمثيل كل عميل في العالم الحقيقي ككائن بيانات عميل.
تتغلب نماذج البيانات الموجهة للكائنات على كثير من قيود نماذج البيانات العلائقية وهذه النماذج تشيع في قواعد البيانات متعددة الوسائط.
نمذجة البيانات ذات الأبعاد
تستخدم حوسبة المؤسسة الحديثة تقنية مستودعات البيانات في تخزين كميات كبيرة من البيانات لإجراء التحليلات لها. يُمكنك استخدام مشروعات نمذجة البيانات ذات الأبعاد في تخزين البيانات واسترجاعها بسرعة عالية من مستودع البيانات. تقوم النماذج ذات الأبعاد باستخدام التكرار أو البيانات الزائدة عن الحاجة وتعطي الأولوية للأداء عن استخدام مساحة أقل في تخزين البيانات.
على سبيل المثال، في نماذج البيانات ذات الأبعاد، تشتمل وكالة السيارات على أبعاد مثل السيارة، وصالة العرض، والوقت. يحتوي البُعد "السيارة" على سمات مثل الاسم والماركة، ولكن البُعد "صالة العرض" يتضمن تسلسلات هرمية مثل الولاية والمدينة واسم الشارع واسم صالة العرض.
ما المقصود بعملية نمذجة البيانات؟
تتضمن عملية نمذجة البيانات سلسلةً من الخطوات التي يجب أن تنفذها بشكل متكرر حتى تقوم بإنشاء نموذج بيانات شامل. في أي منظمة، يجتمع العديد من أصحاب المصلحة معًا لإنشاء طريقة عرض بيانات كاملة. وعلى الرغم من اختلاف الخطوات حسب نوع نمذجة البيانات، ففيما يلي نظرة عامة.
الخطوة 1: تحديد الكيانات وخصائصها
حدد جميع الكيانات التي تريدها في نموذج البيانات. من المفترض أن يكون كل كيان متميزًا منطقيًا عن جميع الكيانات الأخرى وأن يمثل الأشخاص أو الأماكن أو الأشياء أو المفاهيم أو الأحداث. كل كيان هو كيان مميز لأنه يحتوي على خاصية فريدة واحدة أو أكثر. يُمكنك اعتبار الكيانات على أنها أسماء وسمات وصفات في نموذج البيانات الخاص بك.
الخطوة 2: تحديد العلاقات بين الكيانات
إن العلاقات بين مختلف الكيانات هي أساس نمذجة البيانات. تحدد قواعد الأعمال في البداية هذه العلاقات على المستوى المفاهيمي. يُمكنك اعتبار العلاقات كأفعال في نموذج البيانات. على سبيل المثال، يقوم مندوب المبيعات ببيع الكثير من السيارات، أو توظف صالة العرض الكثير من مندوبي المبيعات.
الخطوة 3: تحديد تقنية نمذجة البيانات
بعد أن تفهم كياناتك وعلاقاتها من الناحية المفاهيمية، يُمكنك تحديد تقنية نمذجة البيانات الأنسب لحالة الاستخدام لديك. على سبيل المثال، قد تستخدم نمذجة البيانات العلائقية مع البيانات المهيكلة ولكن قد تستخدم نمذجة البيانات ذات الأبعاد مع البيانات غير المهيكلة.
الخطوة 4: التحسين والتكرار
يُمكنك إدخال مزيد من التحسينات على نموذج البيانات لديك ليلائم متطلباتك من حيث التقنية والأداء. على سبيل المثال، إذا كنت تخطط لاستخدام Amazon Aurora ولغة استعلام هيكلية (SQL)، فستضع كياناتك مباشرةً في جداول وتحدد العلاقات باستخدام مفاتيح خارجية. وعلى العكس من ذلك، إذا اخترت استخدام Amazon DynamoDB، فستحتاج إلى التفكير في أنماط الوصول قبل تصميم جدولك. ونظرًا لأن DynamoDB يعطي الأولوية للسرعة، فأنت تحدد أولاً كيفية الوصول إلى بياناتك ثم تقوم بنمذجة بياناتك في النموذج الذي سيتم الوصول إليه.
وستقوم عادةً بتكرار هذه الخطوات كلما تغيرت تقنيتك ومتطلباتك بمرور الوقت.
كيف تساعد AWS في نمذجة البيانات؟
يمكنك أيضا استخدام AWS Amplify DataStore في تسريع وتسهيل نمذجة البيانات لبناء تطبيقات الويب وتطبيقات الأجهزة المحمولة. تتضمن واجهةً مرئيةً ومستندة إلى تعليمة برمجية لتحديد نموذج البيانات الخاص بك وتحديد العلاقات، ما يؤدي إلى تسريع تطوير التطبيقات لديك.
ابدأ استخدام نمذجة البيانات على AWS من خلال إنشاء حساب مجاني اليوم.