انبار داده به یک بانک اطلاعاتی وسیع گفته میشود که از طریق آن مدیران به تمامی دادههای سازمان از گذشته تا حال برای تهیه گزارش و تجزیه وتحلیل دسترسی دارند، در نتیجه انبار داده نقشی پر رنگ در اتخاذ تصمیمات استراتژیک مدیران ایفا میکند. ممکن است دادهها قبل از قرارگیری بر روی انبار داده در یک فضای عملیاتی کوچکتر قرار گیرند تا پردازش بر روی آنها انجام گیرد.
انبار داده بر سه لایه staging، Integration و Presentationاستوار است، به این ترتیب که دادههای خامی که از منابع اطلاعاتی مختلف به دست آمدهاند در لایه Staging قرار میگیرد. در لایه بعدی یا Integration دادهها از نظر یکنواختی (نرمالسازی، حذف افزونگی و ...) مورد بررسی قرار میگیرند. و در لایه آخر یا Presentation دادهها برای موارد مختلفی همچون گزارشگیری در ابزارهای گزارش ساز و گزارش ساز پیشرفته در دسترس کاربران قرار میگیرد.
انواع سیستمها:
•Data Mart
Data Mart یک فرم ساده از یک انبار دادهها است که در مورد یک موضوع واحد از قبیل فروش، امور مالی یا بازاریابی متمرکز است. Data Mart اغلب توسط یک بخش از سازمان ساخته و کنترل میشود. با توجه به تمرکز Data Mart بر روی یک موضوع، معمولا دادههای تعداد محدودی از منابع را ترسیم میکند. این منابع می توانند سیستمهای عملیاتی داخلی، یک انبار داده مرکزی، و یا دادههای خارجی باشند.
با حجم نسبتا کمی از مبادلات توصیف میشوند. اغلب شامل پرس و جوهای بسیار پیچیده و تجمیعها هستند. برای سیستمهای OLAP، زمان پاسخ یک شاخص اندازهگیری است. برنامههای OLAP به طور گستردهای توسط تکنیکهای دادهکاوی استفاده میشود. معمولا تأخیر سیستمهای OLAP در حد چند ساعت است، در مقایسه با Data Mart ها که تأخیری نزدیک به یک روز دارند.
•پردازش تراکنش آنلاین (OLTP)
با حجم زیادی از تراکنشهای خطی کوتاه (از قبیل DELETE، UPDATE، INSERT) توصیف میشود. سیستمهای OLTP بر روی پردازش پرس و جوهای بسیار سریع و حفظ تمامیت دادهها در محیطهای Multi Access تأکید دارد. اندازهگیری تعداد تراکنشها در هر ثانیه برای سیستمهای OLTP مؤثر است. پایگاههای داده OLTP حاوی اطلاعات دقیق و جاری است. طرحی که برای ذخیره پایگاه دادههای تراکنشی استفاده میشود مدل موجودیتی ( عموما 3NF) است.
•تجزیه و تحلیل پیشبینی شده
تجزیه و تحلیل پیشبینی شده در مورد پیداکردن و تعیین کمیت الگوهای پنهان در دادهها با استفاده از مدلهای پیچیده ریاضی است که میتواند برای پیشبینی نتایج آینده استفاده شود. تجزیه و تحلیل پیشبینی شده متفاوت از OLAP است، چرا که OLAP بر روی تجزیه و تحلیل دادههای تاریخی و واکنش طبیعی آنها تمرکز دارد، در حالی که تجزیه و تحلیل پیشبینی شده تمرکزش بر آینده است. این سیستمها نیز برای CRM مورد استفاده قرار میگیرند.
مزایا:
یک انبار داده یک کپی از اطلاعات سیستمهای عملیاتی را در بر دارد. این پیچیدگی معماری این فرصت را فراهم میکند که:
•با تجمیع دادهها از منابع متعدد درون یک پایگاه داده برای ارائه دادهها میتوان تنها از یک موتور پرس و جو استفاده کرد.
•کاهش مشکلات قفل شدن پایگاه داده سیستمهای عملیاتی با جداسازی اجراهای بزرگ، طولانی و تجزیه و تحلیل پرسوجوها از پایگاه دادههای عملیاتی.
•حفظ تاریخچه داده، حتی اگر سیستمهای عملیاتی این داده ها را نگهداری نکنند.
•با ادغام دادههای سیستمهای عملیاتی متعدد، توانایی ارائه دید متمرکز از تمامی دادههای شرکت را خواهیم داشت. این مزیت همیشه ارزشمند است، به ویژه برای سازمانهایی که با این ادغام رشد میکنند (مانند هولدینگها).
•بهبود کیفیت دادهها، با ارائه کد سازگار و توضیحات، نشانهگذاری یا حتی رفع مشکل دادههای اشتباه
•ارائه مداوم اطلاعات سازمان
•ارائه یک مدل داده مشترک برای همه اطلاعات مفید صرف نظر ار منابع داده
•بازسازی دادهها به طوری که باعث سادهسازی برقراری ارتباط کاربران با دادهها شود.
•بازسازی دادهها به طوری که باعث بهتر شدن عملکرد پرسوجوها شود، حتی برای پرسوجوهای تحلیلی پیچیده.
•ارزش دادن به برنامههای عملیاتی کسبوکار، به ویژه سیستمهای مدیریت ارتباط با مشتری (CRM)
•سادهسازی نوشتن پرسوجوهای پشتیبان تصمیمگیری