فهرست مطالب این مقاله:
در این سند ابتدا مقدمهای در مورد مراکز عملیات شبکه (NOC) آورده شده و سپس به معرفی 5 ابزار اساسی (NOC) پرداخته است.
مراکز عملیات شبکه (NOC) به دلیل مواجهه با درخواستهای متعدد برای سرویسهای فنی و تجاری همواره تحت فشار زیادی قرار دارند. در چند سال گذشته این مراکز با به عهده گرفتن وظایف و مسئولیتهای بیشتر، به یک بخش حیاتی از سازمانها تبدیل شدهاند.
در مراکز NOC، چالشهای فنی در مواقع غیر منتظره از راه میرسند و متعاقباً مشکلات پیش بینی نشده بروز میکنند. در چنین مواقعی تنها بخشی که میتوانید روی آن حساب کنید، کاهش منابع است.
اما بهترین کاری که میتوانید انجام دهید، چیست؟ این که مطمئن شوید بهترین شیوهها را به کار گرفتهاید و از مناسبترین ابزارها استفاده میکنید و فرآیندها و دانش خود را بهینه سازید و این کل مطالبی است که این مقاله پوشش میدهد.
بخش 1: ابزارها
همان طور که میدانید ابزارها یک عنصر اساسی در مدیریت NOC به شمار میآیند و نیز یک عنصر کلیدی برای پیشرفت هستند. اما کدام ابزارها بیشترین بازگشت سرمایه را برایتان به ارمغان میآورند؟ چگونه دانش تیم خود را به روز می کنید؟ و این که چگونه ابزارها میتوانند به تیم شما در کنترل تمام وظایف کمک کنند، در حالی که NOC در جایگاه یک منبع منحصر به فرد IT قرار دارد؟
5 ابزار اساسی مرکز عملیات شبکه:
سیستم تیکتینگ یا مدیریت میز کار(Helpdesk)
نرم افزار تیکتینگ به شما امکان میدهد که کلیه عملیات جاری را با توجه به دشواری، فوریت و فردی که برای مدیریت هر وظیفه تعیین شده است، ردیابی کنید. شناخت تمام عملیات معلق شما را در اولویت بندی وظایف مسئول شیفت و همچنین ارائه بهترین سرویس به مشتریان یاری میکند.
این سیستم ها با عناوین دیگری از جمله “نرم افزار هلپ دسک” یا “Help Desk” و یا سیستم های مدیریت درخواست نیز شناخته می شوند. شما باید تصویری واضح از وضعیت رسیدگی به درخواست ها داشته باشید و در اسرع وقت و در بسیاری از مواقع به صورت خودکار درخواست ها را به کارشناس مربوطه اختصاص دهید.
یکی از ویژگیهای قابل توجه در انتخاب یک نرم افزار تیکتینگ پیشرفته امکان تبادل داده و یکپارچگی با سیستم های مانیتورینگ است. نرم افزار جامع مدیریت فناوری اطلاعات دانا یک راه حل پیشرفته است که همه نیاز های شما در این حوزه را پوشش خواهد داد.
پایگاه دانش
یک منبع متمرکز را برای کلیه اطلاعات و مستندات در نظر بگیرید طوری که تمام افراد تیم شما به آن دسترسی داشته باشند. این پایگاه دانش باید یک منبع اطلاعات تغییر پذیر باشد، بنابراین آن را دائماً با تجارب و آموختههای خود برای ارجاع و توسعههای آتی به روز برسانید. زیر سیستم مدیریت پایگاه دانش نرم افزار مدیریت فناوری اطلاعات دانا پُرو نیاز های شما در این حوزه را پوشش خواهد داد.
گزارش و سنجشها
گزارشهایی را به صورت روزانه و ماهانه تهیه کنید. گزارش روزانه باید شامل تمام رویدادهای مهم 24 ساعت گذشته و علت ریشهای وقوع مشکلات بر طرف شده باشد. این گزارش برای سرپرستان شیفت و مدیران NOC مفید و ضروری است.
این کار همچنین مابقی پرسنل دپارتمان IT را از فعالیتهای NOC و رویدادهای مهم مطلع میسازد. با گردآوری گزارشهای روزانه و ایجاد یک گزارش ماهیانه نیز میتوان میزان پیشرفت تیم را سنجید. این گزارشها میتوانند نواحی قابل توسعه را نیز نشان دهند یا هر نوع روند مثبت یا منفی در عملکرد را مشخص سازند.
بیشتر گزارش های مورد نیاز NOC ،از ابزار های مانیتورینگ شبکه تهیه می گردد.سیستم هایی مانند سیستم جامع مانیتورینگ شبکه و دیتاسنتر بینا با ارائه گزارش های مختلف ، تصویری واضح از وضعیت شبکه و دیتا سنتر در اختیار مسئولان فناوری اطاعات قرار می دهد.
سیستم مانیتورینگ
بدون شک اصلی ترین ابزار و در واقع پیش نیاز راه اندازی یک مرکز NOC به کار گیری یک سیستم مانیتورینگ شبکه و دیتاسنتر میباشد. سیستم های مانیتورینگ به صورت یکپارچه بر عملکرد همه اجزاء سخت افزاری و نرم افزاری شبکه و مرکز داده نظارت کرده و در صورت ردیابی هر گونه اختلال به صورت بلادرنگ افراد را از موضوع با خبر می سازد.
سیستم های مانیتورینگ پیشرفته مانند سیستم جامع مانیتورینگ شبکه و دیتاسنتر بینا دارای امکانات متعددی متناسب با نیاز های مراکز NOC می باشند که موجب تسهیل امر نظارت می گردند، مانند دیاگرام های پویای شبکه ، داشبورد شبکه، پویشگر، مکانیسم های ارسال اخطار و عملیات بازیابی.
اتوماسیون فرایند IT
اتوماسیون فرآیندIT میتواند در اجرای وظایف تکراری روزانه، زمان قابل توجهی را صرفهجویی کرده و وقت سیستم را به پروژههای استراتژیک بیشتر اختصاص دهد.
این کار به تیم سطح – 1 توانایی پرداختن به وظایفی را میدهد که انجام آنها نیازمند تیم سطح – 2 است. نمونهای از این وظایف عبارتند از: تنظیم مجدد کلمه عبور (پسورد)، پاکسازی فضای دیسک، راه اندازی مجدد سرویسها و غیره.
اتوماسیون فرآیند IT همچنین به کاهش زمان میانگین برای بازیافت (MTTR) در زمان وقوع رویدادهای بحرانی کمک میکند. برای مثال، جهت مدیریت وقایع بحرانی سیستم، گردش کارهای خاص میتوانند طی ساعتهای بیکاری سیستم راه اندازی شوند.
بخش 2: دانش و مهارتها
منظور ما از “دانش و مهارتها” این نیست که اعضای تیم شما باید از “دانش عملی” شبکه و دانش فنی مشهودی برای اجرای عملیات روزانه برخوردار باشند، بلکه منظور این است که چگونه میتوانید مطمئن شوید که از مهارتهای بالقوه تیم شما به بهترین وجه استفاده میشود و چگونه این مهارتها را در طی زمان به روز نگه دارید.
وظایف با تعریف شفاف
در مرکز عملیات شبکه تعریف وظایف بر حسب نوع دیتاسنتر تغییر میکند و به تعداد اعضای تیم، محیط و عملیات IT بستگی خواهد داشت. در عین حال، بین وظایف و مسئولیت اپراتورها و مدیران شیفت در NOC تفاوت آشکاری باید وجود داشته باشد.
چرا این موضوع اهمیت دارد؟
غالباً به این دلیل که روی اتخاذ تصمیمات تاثیر میگذارد. در واقع، بدون تعریف شفاف وظایف و مسئولیتها، اختلافات بین اپراتورها به تصمیمات و واکنشهای دیر هنگام منتهی شده یا اصلاً تصمیمی گرفته نمیشود. این امر میتواند روی مشتریان، سرویسهای تجاری حساس و درخواستهای فوری طی ساعات بیکاری سیستم تاثیر بگذارد. بنابراین وظایف باید به طور شفاف تعریف شوند تا مدیر شیفت بتواند تصمیمات نهایی را بگیرد.
کارها و مسئولیتها
یکی از مشکلات بالقوه دیگر که در اثر فقدان تعریف شفاف وظایف به وجود میآید، تقسیم وظایف بین اپراتورها و مدیر شیفت است.
هر مدیر شیفت باید مسئولیتهایی از قبیل: اولویت بندی وظایف، ارجاع کار به اپراتورها بر اساس مهارتهای آنها، تایید این که تیکتها به درستی باز میشوند و پرسنل مربوطه در هنگام نیاز مطلع میشوند یا خیر، ارجاع مشکلات به سطوح بالاتر، ارتباط با مدیریت طی رویدادهای مهم NOC، ارسال اطلاعیهها به کل سازمان، تهیه گزارشات و اتخاذ تصمیمات حساسی که روی بسیاری از سرویسها (نظیر خاموش کردن دیتاسنتر در شرایط اضطراری) تاثیر میگذارد، را بر عهده داشته باشد.
اپراتورها باید مسئول مدیریت جنبه فنی رویدادها باشند – چه این وظیفه را به طور مستقل انجام دهند چه آن را به عضوی از تیم دیگر که مهارتهای لازم را دارد، ارجاع دهند. اپراتورها همچنین مسئولیت پیگیری و به روز رسانی تیکتها را بر عهده دارند.
در حالی که ممکن است به نظر آید اپراتورها فاقد استقلال و مسئولیت هستند، اما این مورد صحت ندارد. در هنگام مواجهه با چالشهای فنی، شاید بتوان گفت که تلاش و مهارت اپراتورها برای تفکیک و هموار ساختن عملیات NOC اهمیت بسیار زیادی دارد. اپراتورها نسبت به مشکلات بصیرت بیشتری دارند و میتوانند هنگام ناموفق بودن اجرای روالهای استاندارد راه حلهای خلاقانه ارائه دهند.
آموزش پرسنل NOC
چه مدت یکبار کار جدیدی را بدون راهنمایی، مشاوره یا آموزش آغاز کردهاید؟
یک اپراتور جدید NOC شاید نداند که در کجا یک روال خاص را بیابد یا چگونه آن را اجرا کند، یا در شرایط دشوارتر تصمیمی بگیرد که باعث آسیب دیدن تجهیزات یا از کار افتادن سیستم شود.
یک برنامه آموزشی گسترده برای پرسنل جدید NOC ترتیب دهید. در حالت ایدهآل، چنین برنامهای باید شامل یک هفته آموزش تئوری و به دنبال آن 3 هفته آموزش عملی تحت نظارت یک مربی معین باشد.
مطمئن شوید که اعضای مجرب NOC، ترجیجاً مدیران شیفت، کارمندان جدید را آموزش میدهند. این مربیان را از انجام سایر وظایفشان معاف کنید تا امر آموزش به تدریج بین وظایف فوری و ضروری ضایع نشود.این برنامه آموزشی را به صورت مداوم به روز برسانید و مطمئن شوید که شامل مباحثی همچون کاربران و مجوزهای مورد نیاز، مشکلات شناخته شده، عیب یابی، تیمها و شمارههای تماس مهم است.
ارتباط و همکاری
یک ارتباط خوب بین اعضای NOC و سایر تیمهای IT مزایای بسیاری دارد. این امر باعث رشد حرفهای پرسنل میشود، فرصتهایی را برای پیشرفت در سازمان فراهم کرده و نزدیکی به سایر تیمها را هنگامی که نیاز به کمک دارند، آسانتر میکند. ولی از همه مهمتر این است که به پرسنل NOC بینش وسیعتری را میدهد. بدیهی است اگر اعضای NOC از پروژهها، سرویسها و نیازهای مشتریان مطلع باشند، سرویس بهتری ارائه میدهند.
اما چگونه میتوانید وضعیت ارتباط را بهبود بخشید؟ چند ایده در این رابطه وجود دارد:
مطمئن شوید که یکی از اعضای NOC در جلسات مدیریت تغییر هفتگی شرکت میکند و مسائل یا فعالیتهای آتی نظیر زمان از کار افتادگی برنامه ریزی شده سیستم را به اطلاع سایر اعضای تیم میرساند.
اعضایی از NOC را به عنوان نقاط کانونی برای نواحی مهم IT نظیر NT، UNIX، شبکه یا پروژهای خاص تعیین کنید. این اعضا در جلسات تیمهای مربوطه شرکت میکنند، دانش و اطلاعات جدید را در اختیار سایر اعضای NOC قرار میدهند و چالشهای حرفهای خاص را مدیریت میکنند.
حس همکاری را بین اعضای تیم NOC تشویق و ترویج کنید. مادامی که اعضای تیم شما مایلند به یکدیگر کمک کنند، اطلاعات آسانتر به اشتراک گذاشته میشوند و مشکلات سریعتر و موثرتر رفع خواهند شد. اگر اعضای تیم NOC به لحاظ جغرافیایی پراکندهاند یا در کشورهای متفاوتی هستند، باید روی مساله ارتباط و همکاری تلاش بیشتری کنید تا بر موانع فرهنگی و زبان غلبه کنید.
بخش 3: فرآیندها
برای به دست آوردن نتایج موثر و تکراری، کدام فرآیندهای عملیاتی ساختیافته را باید اجرا کنید؟
ما چند پیشنهاد عالی برای شما داریم:
فرآیندهای ارجاع به سطح بالاتر
شما مایلید یک فرآیند ارجاع شفاف ایجاد کنید. یک روش، ایجاد جدول ارجاع است که از قبل قرارداد، کانالهای ارجاع مسائل و تماس با پرسنلی که تخصص مناسب را دارد، تعیین میکند.
اولویت بندی
فرآیند اولویت بندی رویدادها در هر NOC متفاوت است، بنابراین باید به طور شفاف تعریف شوند. رویدادها نباید هرگز بر اساس ترتیب وقوعشان از ابتدا به انتها مدیریت شوند. به جای این کار، مدیر شیفت باید رویدادها و مسائل را بر اساس اهمیت و تاثیری که روی کار میگذارند، اولویتبندی کند.
باید 10 پروژه برتر و مهمتر NOC را بشناسند و نسبت به آنچه که یک رویداد حساس خوانده میشود – مانند افزایش دما در دیتاسنتر , قطع یکی از کابلهای مهم شبکه , متوقف شدن سرویس “x” یا هر رویداد دیگر – درک درستی داشته باشند.
مدیریت رویداد
مدیران شیفت و اپراتورهای NOC باید با فرآیند ویژه مدیریت رویدادها آشنا باشند.
فرآیند مدیریت رویداد باید مسائل زیر را پوشش دهد:
- راه حل فنی کامل، در صورت وجود.
- ارجاع کار به پرسنل مناسب.
- آگاه سازی کاربرانی که به طور مستقیم یا غیر مستقیم تحت تاثیر رویداد قرار گرفتهاند.
- فرآیندهای “راه حل سریع” یا راه حلهای موقتی برای مشکلات پیچیدهای که رفع آنها نیازمند مدت زمان بیشتری است.
- تهیه گزارش از رویداد.
نتیجه
شما با به کار گیری ابزارها، مهارتها و فرآیندهای مناسب در NOC خود میتوانید عملیات شبکه را به صورت کارآمدتر اجرا کنید و عملیات روزانه بدون اشکال را تضمین کنید.استفاده از این شیوههای برتر در NOC نه تنها تداوم عملیات بدون اشکال را تضمین میکند، بلکه باعث میشود تا تیم شما با به دست آوردن درک بهتری نسبت به نیازهای تجاری، دپارتمان IT و مشتریان پیشرفت کنند؛ روحیه رشد و ترقی را در میان اعضای تیم ترویج میکند؛ و مهمتر از همه، یک محیط کاری سالم و حمایت کنندهای را ایجاد میکند که میتواند سرویسهای برتری را ارائه دهد.