شرح الگوی ستاره و معیارهای آن

ساخت وبلاگ

کشف کنید که چگونه مدل سازی داده ها از انتزاع برای نشان دادن و درک بهتر ماهیت جریان داده ها در یک سیستم اطلاعاتی سازمانی استفاده می کند

black and blue background

مدل سازی داده ها فرآیند ایجاد یک نمایش بصری از یک سیستم اطلاعاتی کامل یا بخش هایی از IT برای برقراری ارتباط بین نقاط داده و ساختار است. هدف نشان دادن انواع داده های مورد استفاده و ذخیره شده در سیستم ، روابط بین این انواع داده ها ، روش های گروه بندی و سازماندهی داده ها و قالب ها و ویژگی های آن است.

مدل های داده در مورد نیازهای تجاری ساخته شده اند. قوانین و الزامات از طریق بازخورد ذینفعان مشاغل به صورت مقدماتی تعریف می شوند تا بتوانند در طراحی یک سیستم جدید گنجانیده شوند یا در تکرار یک موجود موجود سازگار شوند.

داده ها را می توان در سطوح مختلف انتزاع مدل کرد. این روند با جمع آوری اطلاعات در مورد نیازهای تجاری از ذینفعان و کاربران نهایی آغاز می شود. این قوانین تجاری سپس برای تدوین یک طراحی پایگاه داده بتونی به ساختار داده ترجمه می شوند. یک مدل داده را می توان با نقشه راه ، طرح معمار یا هر نمودار رسمی که درک عمیق تری از آنچه طراحی شده است ، مقایسه کند.

مدل سازی داده ها از طرحواره های استاندارد و تکنیک های رسمی استفاده می کند. این یک روش مشترک ، سازگار و قابل پیش بینی برای تعریف و مدیریت منابع داده در یک سازمان یا حتی فراتر از آن است.

در حالت ایده آل ، مدل های داده اسناد زنده ای هستند که به همراه تغییر نیازهای تجاری تکامل می یابند. آنها نقش مهمی در حمایت از فرآیندهای تجاری و برنامه ریزی معماری و استراتژی IT ایفا می کنند. مدل های داده را می توان با فروشندگان ، شرکا و/یا همسالان صنعت به اشتراک گذاشت.

مانند هر فرآیند طراحی ، پایگاه داده و طراحی سیستم اطلاعات در سطح بالایی از انتزاع آغاز می شود و به طور فزاینده ای بتن و خاص تر می شود. مدل های داده به طور کلی می توانند به سه دسته تقسیم شوند که با توجه به میزان انتزاع آنها متفاوت است. این فرآیند با یک مدل مفهومی آغاز می شود ، به یک مدل منطقی پیشرفت می کند و با یک مدل فیزیکی نتیجه می گیرد. هر نوع مدل داده با جزئیات بیشتر در زیر مورد بحث قرار گرفته است:

 

  • مدل های داده مفهومی. آنها همچنین به عنوان مدل های دامنه یاد می شوند و یک تصویر بزرگ از آنچه سیستم شامل می شود ، نحوه سازماندهی آن و قوانین تجاری در آن وجود دارد ، ارائه می دهند. مدل های مفهومی معمولاً به عنوان بخشی از روند جمع آوری نیازهای اولیه پروژه ایجاد می شوند. به طور معمول ، آنها شامل کلاس های موجودیت (تعریف انواع چیزهایی هستند که برای تجارت در مدل داده ها مهم هستند) ، ویژگی ها و محدودیت های آنها ، روابط بین آنها و الزامات مربوط به امنیت و یکپارچگی داده ها. هرگونه نماد به طور معمول ساده است.

     

به عنوان یک رشته ، مدل سازی داده ها از ذینفعان دعوت می کند تا پردازش و ذخیره سازی داده ها را در جزئیات پر دردسر ارزیابی کنند. تکنیک های مدل سازی داده ها دارای کنوانسیون های مختلفی هستند که دیکته می کنند که از کدام نمادها برای نشان دادن داده ها ، نحوه ارائه مدل ها و نحوه انتقال نیازهای تجاری استفاده می شود. همه رویکردها گردش کار رسمی را ارائه می دهند که شامل توالی از وظایف است که باید به صورت تکراری انجام شود. این گردش کار به طور کلی به این شکل است:

  1. موجودات را شناسایی کنید. فرآیند مدل سازی داده ها با شناسایی چیزها ، رویدادها یا مفاهیمی که در مجموعه داده هایی که باید مدل سازی شوند ، آغاز می شود. هر نهاد باید منسجم باشد و از نظر منطقی از همه گسسته باشد.
  2. خصوصیات کلیدی هر موجودیت را شناسایی کنید. هر نوع موجودیت را می توان از سایر موارد متمایز کرد زیرا دارای یک یا چند ویژگی منحصر به فرد ، به نام ویژگی ها است. به عنوان مثال ، یک نهاد به نام "مشتری" ممکن است دارای ویژگی هایی مانند نام ، نام خانوادگی ، شماره تلفن و سلام و احوالپرسی باشد ، در حالی که یک نهاد به نام "آدرس" ممکن است شامل نام و شماره خیابان ، یک شهر ، ایالت ، کشور و کد پستی باشدبشر
  3. روابط بین موجودات را شناسایی کنید. اولین پیش نویس یک مدل داده ماهیت روابطی را که هر یک از نهاد با دیگران دارد مشخص می کند. در مثال بالا ، هر مشتری "در" یک آدرس "زندگی می کند. اگر این مدل گسترش یابد تا شامل یک نهاد به نام "سفارشات" باشد ، هر سفارش نیز به آدرس ارسال می شود و به آنها صورت می گیرد. این روابط معمولاً از طریق زبان مدل سازی متحد (UML) ثبت می شود.
  4. ویژگی های نقشه به موجودات کاملاً. این تضمین می کند که مدل نشان دهنده نحوه استفاده از داده ها از داده ها است. چندین الگوی مدل سازی داده های رسمی در استفاده گسترده است. توسعه دهندگان شی گرا اغلب الگوهای تجزیه و تحلیل یا الگوهای طراحی را اعمال می کنند ، در حالی که ذینفعان سایر حوزه های تجاری ممکن است به الگوهای دیگر روی آورند.
  5. در صورت لزوم کلیدها را اختصاص دهید و در مورد درجه ای از عادی سازی تصمیم بگیرید که نیاز به کاهش افزونگی با نیازهای عملکرد را متعادل می کند. عادی سازی تکنیکی برای سازماندهی مدل های داده (و بانکهای اطلاعاتی که آنها را نشان می دهند) است که در آن شناسه های عددی ، به نام کلیدها ، به گروه های داده اختصاص می یابد تا روابط بین آنها را بدون تکرار داده ها نشان دهند. به عنوان مثال ، اگر به مشتریان یک کلید اختصاص داده شود ، این کلید می تواند بدون نیاز به تکرار این اطلاعات در جدول نام مشتری ، به آدرس و تاریخ سفارش آنها مرتبط شود. عادی سازی تمایل دارد میزان فضای ذخیره سازی را که یک پایگاه داده به آن نیاز دارد ، کاهش دهد ، اما برای پرس و جو عملکرد می تواند هزینه کند.
  6. مدل داده ها را نهایی و تأیید کنید. مدل سازی داده ها یک فرایند تکراری است که با تغییر نیاز به تجارت باید تکرار و تصفیه شود.

مدل سازی داده ها در کنار سیستم های مدیریت پایگاه داده تکامل یافته است ، با افزایش نیازهای ذخیره داده های مشاغل ، انواع مدل در پیچیدگی افزایش می یابد. در اینجا چندین مدل مدل وجود دارد:

  • مدل های داده های سلسله مراتبی نشان دهنده روابط یک به یک در قالب treelike است. در این نوع مدل ، هر رکورد دارای یک ریشه یا والدین است که به یک یا چند میز کودک نقشه می کند. این مدل در سیستم مدیریت اطلاعات IBM (IMS) اجرا شد ، که در سال 1966 معرفی شد و به سرعت استفاده گسترده ای پیدا کرد ، به خصوص در بانکداری. اگرچه این رویکرد نسبت به مدلهای پایگاه داده اخیراً توسعه یافته کارآمدتر است ، اما هنوز هم در سیستم های تغییر زبان (XML) زبان و سیستم های اطلاعات جغرافیایی (GISS) مورد استفاده قرار می گیرد.
  • مدلهای داده رابطه ای در ابتدا توسط محقق IBM E. F.coDD در سال 1970 پیشنهاد شد. آنها هنوز هم در بسیاری از پایگاه داده های مختلف رابطه ای که معمولاً در محاسبات شرکت استفاده می شود ، اجرا می شوند. مدل سازی داده های رابطه ای نیازی به درک دقیق از خصوصیات فیزیکی ذخیره داده های مورد استفاده ندارد. در آن ، بخش های داده به صراحت از طریق استفاده از جداول وصل می شوند و پیچیدگی پایگاه داده را کاهش می دهند.

بانکهای اطلاعاتی رابطه ای اغلب برای مدیریت داده ها از زبان پرس و جو ساختاری (SQL) استفاده می کنند. این پایگاه داده ها برای حفظ یکپارچگی داده و به حداقل رساندن افزونگی به خوبی کار می کنند. آنها اغلب در سیستم های نقطه فروش و همچنین برای سایر انواع پردازش معاملات مورد استفاده قرار می گیرند.

  • مدل های داده-رابطه (ER) از نمودارهای رسمی برای نشان دادن روابط بین نهادها در یک پایگاه داده استفاده می کنند. چندین ابزار مدل سازی ER توسط معماران داده برای ایجاد نقشه های بصری که اهداف طراحی پایگاه داده را منتقل می کنند ، استفاده می شود.
  • مدلهای داده شی گرا به عنوان برنامه نویسی شی گرا ، کشش را به دست آوردند و در اواسط دهه 1990 محبوبیت پیدا کردند."اشیاء" درگیر انتزاع موجودات دنیای واقعی هستند. اشیاء در سلسله مراتب کلاس گروه بندی می شوند و دارای ویژگی های مرتبط هستند. بانکهای اطلاعاتی شی گرا می توانند جداول را در خود جای دهند ، اما همچنین می توانند از روابط داده پیچیده تری پشتیبانی کنند. این رویکرد در پایگاه داده های چندرسانه ای و فشار خون و همچنین سایر موارد استفاده استفاده می شود.
  • مدل های داده بعدی توسط Ralph Kimball ساخته شده اند ، و آنها برای بهینه سازی سرعت بازیابی داده ها برای اهداف تحلیلی در یک انبار داده طراحی شده اند. در حالی که مدل های رابطه ای و ER بر ذخیره سازی کارآمد تأکید می کنند ، مدلهای بعدی باعث افزایش افزونگی می شوند تا بتوانید اطلاعات را برای گزارش و بازیابی آسان تر کنید. این مدل سازی به طور معمول در سیستم های OLAP استفاده می شود.

دو مدل داده بعدی محبوب طرح ستاره ای است که در آن داده ها به حقایق (موارد قابل اندازه گیری) و ابعاد (اطلاعات مرجع) سازماندهی می شوند ، جایی که هر واقعیت با ابعاد مرتبط با آن در یک الگوی ستاره مانند احاطه شده است. مورد دیگر طرح برفی است که شبیه به طرح ستاره است اما شامل لایه های اضافی از ابعاد مرتبط است و الگوی انشعاب را پیچیده تر می کند.

مدل سازی داده ها باعث می شود توسعه دهندگان ، معماران داده ، تحلیلگران تجارت و سایر ذینفعان بتوانند روابط بین داده ها را در یک بانک اطلاعاتی یا انبار داده مشاهده و درک کنند. علاوه بر این ، می تواند:

  • خطاها را در نرم افزار و توسعه پایگاه داده کاهش دهید.
  • قوام را در مستندات و طراحی سیستم در سراسر شرکت افزایش دهید.
  • عملکرد و عملکرد پایگاه داده را بهبود بخشید.
  • نقشه برداری داده ها را در سراسر سازمان سهولت کنید.
  • ارتباط بین توسعه دهندگان و تیم های اطلاعات تجاری را بهبود بخشید.
  • سهولت و سرعت بخشیدن به فرآیند طراحی پایگاه داده در سطوح مفهومی ، منطقی و فیزیکی.

ابزارهای مدل سازی داده ها

بسیاری از راه حل های مهندسی نرم افزار به کمک رایانه (CASE) به کمک رایانه امروز به طور گسترده ای مورد استفاده قرار می گیرند ، از جمله چندین مدل مدل سازی ، نمودار سازی و ابزارهای تجسم. در اینجا چندین مثال آورده شده است:

فارکس کاران ایران...
ما را در سایت فارکس کاران ایران دنبال می کنید

برچسب : نویسنده : ديناروند فهيمه بازدید : 55 تاريخ : شنبه 20 خرداد 1402 ساعت: 1:29