در محیطهای فناوری اطلاعات، اطمینان از عملکرد صحیح کنترلرهای ذخیرهسازی نقشی حیاتی در حفظ سلامت سیستمهای سروری ایفا میکند. شرکت HPE برای پشتیبانی بهتر از کنترلرهای خود، مجموعهای از ابزار تشخیصی کنترلر را ارائه داده است که به مدیران شبکه و کارشناسان IT کمک میکند تا مشکلات احتمالی را بهسرعت شناسایی و رفع کنند. این ابزارها، بسته به نوع کنترلر (SR یا MR)، امکانات متنوعی مانند نظارت لحظهای، گزارشگیری از رخدادها و بررسی وضعیت سخت افزاری را فراهم میسازند. در این مقاله، مهمترین ابزارهای تشخیصی HPE و شیوه استفاده از آنها برای رفع خطاهای متداول کنترلرها معرفی شدهاند. با ما همراه باشید.
ابزار تشخیصی کنترلر HPE SR
Smart Storage Administrator (SSA)
SSA را میتوان به صورت آفلاین از طریق Intelligent Provisioning یا با بوت از تصویر SPP ISO اجرا کرد. همچنین، بهصورت آنلاین با دانلود نسخه 6.10.14.0 یا جدیدتر قابل دسترسی است.
HPE iLO، ابزار تشخیصی کنترلر SR
سیستمعامل سرور و بدون نیاز به آن، iLO firmware بهطور مداوم کنترلر را نظارت میکند و هرگونه خرابی را در IML ،iLO RESTful API و SNMP ثبت میکند. علاوه بر این، رابط وب iLO به کاربران امکان میدهد وضعیت کنترلر و دستگاههای متصل به آن را مشاهده کنند.
ابزارهای سیستم UEFI
ابزارهای سیستم UEFI در ROM سیستم تعبیه شدهاند و به شما امکان مشاهده تنظیمات و پیکربندی کنترلر را میدهند.
انواع ابزار تشخیصی کنترلر های HPE MR
HPE MR Storage Administrator
مدیر ذخیرهسازی HPE MR پیامهای گزارش رویداد و پیامهای سیستم را نمایش میدهد. برای مشاهده گزارش رویداد، در داشبورد کنترلر، روی View Event Log در منوی Actions کلیک کنید. در منوی Actions برای گزارش رویداد، میتوانید فایل گزارش را دانلود کرده و آن را پاک کنید. برای مشاهده پیامهای سیستم، روی آیکون زنگوله کلیک کنید و پیامها در بالای پنجره ظاهر خواهند شد.
گزارش لاگ سیستم، ابزار تشخیصی کنترلر MR
مدیر ذخیرهسازی HPE MR رویدادهای آرایه را به ناحیه برنامه در داخل گزارش رویداد سیستم Microsoft Windows ارسال میکند، که شامل اطلاعات تشخیصی دقیقترین رویدادهای اخیر مواجه شده توسط کنترلر است. در Linux، گزارش رویداد سیستم در مسیر مشخص شده قرار دارد. در VMware، گزارش رویداد سیستم در مسیر مشخصی قرار دارد.
(به نظر میرسد مسیرهای دقیق برای Linux و VMware در متن شما ذکر نشده است؛ اگر این مسیرها را دارید، میتوانید وارد کنید.)
کنترلر در حین POST نمایش داده نمیشود یا خطاهایی را نمایش میدهد.
نشانهها
- کنترلر در حین فرایند POST قابل مشاهده نیست.
- کنترلر در حین فرایند POST خطاهایی را نمایش میدهد.
دلایل
- سختافزار بهطور فیزیکی آسیب دیده است.
- کنترلر بر روی سرور پشتیبانی نمیشود.
- کنترلر تعبیهشده در UEFI System Utilities فعال نشده است.
- کنترلر بهدرستی در جای خود قرار نگرفته است.
- کنترلر خراب است.
- فریمور قدیمی است.
اقدامات لازم
- از پشتیبانی کنترلر توسط سرور اطمینان حاصل کنید.
- چک کنید که کنترلر از نظر فیزیکی آسیب ندیده باشد.
- اگر کنترلر توسط BIOS سیستم شناسایی شده است، آن را مجدداً نصب کنید.
- برای مشکلات مربوط به کنترلر تعبیهشده، از فعال بودن کنترلر تعبیهشده در UEFI System Utilities مطمئن شوید.
- controller diagnostics را اجرا کنید و مراحل نمایش دادهشده را انجام دهید.
- فریمور را آپدیت کنید.
- برای تشخیص و رفع مشکلات، لاگ Active Health System را دانلود کنید.
- کنترلر را تعویض کنید.
کنترلرها دیگر redundant نیستند
نشانهها
- کنترلر در حین فرآیند POST خطاهایی را نمایش میدهد.
- کش غیرفعال است.
دلایل
- سختافزار یک یا چند کنترلر از نظر فیزیکی آسیب دیده است.
- یک یا چند کنترلر بر روی سرور پشتیبانی نمیشوند.
- کنترلرها با عملیات redundant سازگار نیستند.
- یک یا چند کنترلر به درستی نصب نشدهاند.
- فریمور کنترلر(ها) قدیمی یا ناسازگار است.
- energy pack نصب نشده است.
- energy pack به درستی بر روی برد سیستم نصب نشده است.
- کابل برق پشتیبان کنترلر از آن به برد PCIe riser متصل نشده است.
اقدامات لازم
- از پشتیبانی کنترلر توسط سرور اطمینان حاصل کنید.
- مطمئن شوید که هر دو کنترلر به درستی نصب یا در جای خود قرار گرفتهاند.
- مطمئن شوید که کنترلرها مدلهای سازگار باشند.
- مطمئن شوید که نسخههای فریمور کنترلرها سازگار و بهروز باشند.
- مطمئن شوید که اندازه کش کنترلرها سازگار باشند.
- از درستی نصب energy pack اطمینان حاصل کنید.
- از اتصال درست کابلهای کنترلر مطمئن شوید.
- اگر همچنان مشکل پا برجا بود، لاگ Active Health System را دانلود کنید.
کنترلر Smart Array پس از جابجایی درایوها به سرور جدید یا JBOD، درایوهای منطقی را نمایش نمیدهد.
نشانه
کنترلر Smart Array پس از جابجایی درایوها به سرور جدید یا JBOD، درایوهای منطقی را نمایش نمیدهد.
دلیل
مشکلی در جابهجایی درایو به وجود آمده است.
اقدام لازم
اطمینان حاصل کنید که هنگام جابهجایی درایوها، از تمامی قوانین Drive Roaming پیروی میکنید.
سخن آخر
با بهره گیری از انواع ابزار تشخیصی کنترلرهای SR و MR، میتوان بهصورت دقیق و سریع مشکلات سختافزاری و نرمافزاری مربوط به ذخیرهسازی را شناسایی و برطرف کرد. این ابزارها نهتنها امکان مانیتورینگ مداوم و ثبت لاگهای سیستمی را فراهم میکنند، بلکه با کمک آنها میتوان از سلامت کنترلرها و سازگاری اجزای سیستم اطمینان حاصل کرد. در شرایط بحرانی مانند عدم شناسایی کنترلر یا بروز خطاهای POST، این ابزارها نقش کلیدی در عیبیابی و جلوگیری از آسیبهای بیشتر ایفا میکنند. ما در مانیا سرویس برای حل مشکلات سروری شما آماده خدمت رسانی هستیم، کافیست با کارشناسان فنی ما در ارتباط باشید.