1- حجم دادههای هر شركت مهم است و بر طبق آن می توان تشخیص داد كه چه نوع انبار دادهای و با چه مشخصات نرمافزاری و سختافزاری مورد نیاز است. حجم دادهها به علت بالا بودن میزان آن معولا برحسب ترابایت مشخص میشود .این حجم بستگی به تعداد كاربران و مشتریان و میزان ركوردها دارد.
2- محدوده زمانی كه اطلاعات مربوط به آن دوره نگهداری میشود پارامتر مهمی درطراحی و انتخاب انبار داده است. به عنوان مثال ممكن است اطلاعات یك یا دو سال و یا حتی بیشتر درانبار داده نگهداری شود.
3- گستره جغرافیایی و این كه دادهها از چه نقاطی جمعآوری و تجمیع میشوند درانتخاب پیكربندی انبار داده مساله مهمی است. این نقاط ممكن است محدود باشد اما مثلا دركشور ما ممكن است شركت مربوطه دهها شعبه دراستانها داشته باشد و بخواهد كلیه مراكز را به نقطه مركزی متصل كند و دادهها در آن جا تجمیع شوند .
4- تعیین میزان رشد دادهها در هر سال مهم است به عبارت دیگر باید میزان افزایش حجم دادهها درفاصله زمانی سالیانه مشخص شود كه چند درصد است و درآن صورت برحسب میزان دادههای موجود وفعلی و در نظر گرفتن ومحاسبه رشد دادهها درسالهای آتی میتوان طراحی و انتخاب مناسبی انجام داد.
5- تعداد سطرهای بزرگ ترین جدول باید مشخص شود. این كاربرای انتخاب پایگاه داده مربوطه مهم است. به عنوان مثال یك جدول ممكن است میلیونها و یا حتی میایاردها سطر داشته باشد.
6- ابعاد مكعبهای دادههای چند بعدی باید مشخص شود مثلا 50 مكعب با 32 بعد
7- تعداد كل تجمیعها باید محاسبه و درنظر گرفته شود. تعداد تجمیعها معمولا اعداد بسایر بزرگی است. البته بسته به حجم و اندازه دادهها متفاوت است اما درشركتهای بزرگ ممكن است به میلیاردها تجمیع برسد.
8- نرمافزار مربوط به پایگاه داده مثلا اراكل یا SQL server باید بسته به طراحی و پارامترهای دیگر تعیین شود و آن گاه بستری كه این پایگاه داده باید برروی آن قرار گیرد مشخص شود.
9- بستری كه پایگاه داده برروی آن قرار میگیرد معمولا سیستم عامل است كه ازسیتم عاملهای سرور استفاده میشود. به عنوان مثال ممكن است از سیستم عاملی مانند windows server 2008 و یا یونیكس استفاده شود .
10- پردازشگر سخت افزار سیستم عامل و پایگاه داده باید مطابق مشخصات و پارامترهای مختلف دیگر وسرعت مورد انتظار برای پردازش مشخص شود . مثلا ممن است تصمیم گرفته شود كه پردازشگر AMD و یا اینتل و یا برند دیگری استفاده شود.
11- تعداد ركوردهای تولید شده درهرروز باید مشخص گردد.
12- تعداد ركوردهای تولید شده درسال باید مشخص و محاسبه شود.
13- تنوع و پیچیدگی سیستمهای كامپیوتری اعم از نرمافزار وسختافزار باید مشخص و تعیین شود. به عنوان مثال دریك شركت ممكن است ازكامپیوترهای مین فریم, سیستمهای یونیكس و سرورهای مایكروسافت استفاده شده باشد بنابراین باید طراحی انبار داده به گونهای باشد كه تفاوتهای این سیستمها را لحاظ كند و همخوانی كامل با وضعیت موجود داشته باشد.
14- درحالتهایی كه حجم دادهها خیلی زیاد باشد, معمولا به جای یك سرور از دو یا چند سرور استفاده میشود كه هر كدام درصدی از دادهها را درخود نگه میدارند و موجب افزایش سرعت و بالا رفتن ضریب اطمینان میشود.
15- برای افراد و تیمهای پشتیبانیكننده انبار داده, شركت مخابراتی باید برای تامین منابع انسانی برنامهریزی مشخصی داشته باشد و معین كند كه چه تعداد افراد و درچند گروه میبایست كار پشتیبانی و به روز نگه داشتن و عملیاتی كردن انبار داده را برعهده داشته باشند. دراین زمینه باید افزایش تعداد كاربران درسالهای آتی و افزایش حجم دادهها و به تبع آن افزایش تجهیزات سختافزاری و نرمافزاری مورد توجه قرارگیرد.
16- ارتقا سختافزاری و نرمافزاری سیستهای عامل و نرم افزار پایگاه داده باید مورد توجه قرار بگیرد .به عنوان مثال ممكن است لازم باشد پایگاه داده از نسخه قدیمیتر به نسخه جدیدتری ارتقا یابد در آن صورت كلیه ملزومات سختافزاری و مجوزهای قانونی (licencse) و هزینهها و ملزومات سختافزاری باید مد نظر قرار بگیرد .ارتقا همواره مساله مهمی در مباحث سختافزاری و نرمافزاری است .
17- تحلیل هزینه به فایده برای استفاده ازانبار داده باید انجام شود و ازلحاظ اقتصادی تحلیل شود كه نصب و استقرار و پیادهسازی انبار داده و داده كاوی تا چه حد میتواند به بهبود عملكرد و بازدهی بالاتر بهتر كمك كند. به عنوان مثال یكی از پارامترها میزان كاهش زمان پردازش است كه خود باعث صرفهجویی در زمان پرسنل و افارد و فرایند تصمیمگیری میشود و درنهایت رضایت مشتریان را به همراه دارد. یكی دیگر از مزایا ممكن است ایجاد محیطی یكپارچه باشد كه به طراحی و پشتیبانی بهتر منجر شود و همچنین باعث صرفه جویی درهزینههای آموزش و خرید تجهیزات شود. همچنین اغلب انبارهای داده باعث كاهش نیازمندی به فضای ذخیرهسازی میشوند و زمان پرس و جو را به میزان خیلی زیادی كاهش داده و تحلیلهای مختلف را ممكن میسازند.
18- موضوع دیگری كه باید درطراحی و پیادهسازی انبار داده مورد توجه قرار بگیرد, لزوم انجام حداكثر تلاش برای پشتیبانی و استفاده از ابزارهای سختافزاری و نرمافزاری موجود است زیرا اغلب شركتهای مخابراتی ازقبل سرمایهگذاری زیادی روی تجهیزات سختافزاری و نرمافزاری انجام دادهاند و بسیار به صرفه است كه تا حد ممكن بتوان از این تجهیزات كه اغلب شامل سرورها و پردازندهها و تجهیزات ذخیرهسازی و نرمافزارها است, استفاده بهینه كرد.
19- آموزش پرسنل و آشنا كردن آنها با پایگاه داده و سیستمهای سختافزاری و نرمافزاری و توانایی پشتیبانی و به روز نگه داشتن سیستم مسالهای حیاتی است و باید همزمان با درنظرگرفتن سرمایه فیزیكی و تجهیزات سرمایه انسانی نیز مورد توجه قرار گیرد.
20- به نظر میرسد با توجه به آشنایی و سابقه آموزش و پشتیبانی بهتر ازمحصولات شركت مایكروسافت در ایران و به ویژه تسلط سیستم عاملهای سرور مایكروسافت دربازار كشور و آشنایی بهتر و بیشتر كارشناسان با این محصولات و همخوانی با سایر محصولات مایكروسافت مانند اكسل و اكسس و غیره , چانچه شركتهای مخابراتی بخواهند از ابزارهای نرمافزاری انبار داده استفاده كنند بهتر است از محصولات SQL server بهره ببرند زیرا ضمن پشتیبانی از قابلیتهای مختلف باعث صرفهجویی درهزینههای پشتیبانی و آموزش افراد نیز میشود.
نویسنده:جمال صوفیه