مانیتورینگ سرورهای HP در لینوکس
چکیده
در این مستند به معرفی ابزارهایی پرداخته می شود که به سبب آن می توان قسمتهای سخت افزاری سرورهای HP را نظارت نمود .
1- مقدمه
جهت بررسی نمودن وضعیت سخت افزار سرورهای HP، ابزارهای متعددی طراحی شده است که هر کدام از آنها جهت تحقق هدفی ایجاد گردیده است.در این بین، ابزارهایی وجود دارند که در محیط Command line مورد استفاده قرار میگیرند.در این مستند به بررسی ابزارهای نظارتی سرورHP در محیط متنی پرداخته شده است.همچنین کنترل سختافزار های سرور از طریق پورت iLO نیز مورد بررسی قرار می گیرد.
2- hplog
2.1 معرفی
hplog ابزاری است که اجازه میدهد تا به قسمتهایی از سرورهای اچ پی نظارت گردد.این ابزار اطلاعات خود را از طریق IML دریافت میکند.
IML ابزاری است که تمام سوابق مربوط به رویداد های اتفاق افتاده بر روی سرور را نگهداری می کند.
رویدادهای ذخیره شده در IML به سه دسته تقسیمبندی میشوند،که این دسته بندی بر اساس نوع رویدادی است که در سرور اتفاق افتاده است .
این چهار دسته عبارتند از:
۱-CAUTION :اخطارها (warning)
۲-CRITICAL :خطاها (error)
۳-INFO :پیغام ها (information)
۴-REPAIRED اطلاع از رفع شدن خرابی توسط خود سرور.
2.2 پارامترهای ابزار hplog
پارامتر t
نمایش اطلاعات حرارتی مربوط به تمام سنسورهای سرور، که این اطلاعات شامل نوع ،وضعیت، موقعیت،درجه حرارت فعلی و آستانه حرارتی سنسورها می باشد.
تصویر 1: خروجی دستور hplog با پارامتر t
تصویر 3: خروجی دستور hplog با پارامتر a
3- hpacucli
3.1 معرفی hpacucli
hpacucli برگرفته از جمله HP Array Configuration Utility CLI می باشد.
ابزار hpacucli جهت ساخت، حذف و تعمیر درایوهای فیزیکی و منطقی بر روی کنترلر های RAID در سرور های HP مورد استفاده قرار میگیرد.به عبارتی بر تنظیمات مربوط به RAID تمرکز دارد.
تصویر 4: خروجی دستور hpacucli
3.2 پارامتر های ابزار hpacucli
این ابزار شامل پارامتر های زیادی می باشد که برای ساخت،حذف و نظارت برروی کنترلر هایRAID به کار می رود.
پارامتر help
این پارامتر یک راهنمای کامل در مورد نحوه استفاده از ابزار hpacucli را ارائه می دهد.
تصویر 5: خروجی دستور hpacucli با پارامتر help
پارامتر show
جهت نظارت بر قسمتهای مختلف کنترلرRAID از پارامتر show به همراه دیگر پارامتر ها استفاده می گردد .
پارامتر ctrl
از (ctrl (controller جهت بررسی و نظارت بر کنترلر های RAID استفاده میشود.
پارامتر all
جهت نمایش اطلاعات مربوط به تمام بخش های کنترلر RAID بر روی سرور به کار برده می شود.
پارامتر slot
جهت بررسی نمودن وضعیت یکslot در کنترلر RAID به کار برده می شود . Slot جایگزین پارامتر all میشود.
تصویر 6 :خروجی دستور hpacucli با پارامتر slot
-
پارامتر pd
از این پارامتر(pd(physical drive جهت مشاهده مشخصات درایو های فیزیکی استفاده می گردد.
درایو فیزیکی به هر یک از هارددیسک های نصب شده بر روی کنترلر RAID اطلاق می شود.با استفاده از این پارامتر از وضعیت و میزان حجم هر هارددیسک ،نوع هارد دیسک ها و موقعیت آنها بر روی کنترلر RAID میتوان آگاهی یافت.
تصویر 7: خروجی دستور hpacucli با پارامتر pd
پارامتر ld
از پارامتر ( ld( logical drive جهت مشاهده مشخصات درایوهای منطقی به کار برده می شود.
درایو منطقی اشاره به تقسیمات منطقی RAID دارد.و مشخص کننده نوع RAID ای میباشد که بر روی کنترلر RAID تعریف گردیده است .در تصویر 8 مشخص است که دو درایو منطقی از نوع RAID5 بر روی کنترلرRAIDتعریف گردیده است.
تصویر 8: خروجی دستور hpacucli با پارامتر ld
پارامتر config
از این پارامتر جهت مشاهده تنظیمات صورت گرفته بر روی کنترلر RAID استفاده می گردد.
تصویر 9: خروجی دستورhpacucli با پارامتر config
پارامتر detail
جهت بدست آوردن اطلاعات کاملتر در مورد قسمتهای مختلف کنترلر RAID از این پارامتر همراه با پارامتر های دیگر استفاده می شود.
تصویر 10: خروجی دستور hpacucli با پارامتر detail
پارامتر config detail
از ترکیب دو پارامتر config و detail برای بدست آوردن اطلاعات کامل از تمام تنظیمات و مشخصات مربوط به کنترلر RAID استفاده می شود.
تصویر 11: خروجی دستورhpacucli با پارامترهای config detail
پارامتر status
جهت بررسی وضعیت کلی کنترلرRAID استفاده می گردد.
4 ابزار hpasmcli
hpasmcli برگرفته از جمله HP Server Management Application and Agents Command Line
می باشد.
از این ابزار جهت نمایش تنظیمات سیستم ،BIOS سیستم و وضعیت سخت افزارها در سرور های HP مورد استفاده قرار می گیرد.
4.1 پارامتر های hpasmcli جهت بررسی وضعیت سیستم
پارامتر help
نمایش لیستی از پارامتر هایی که با این دستور به کار برده می شوند.
تصویر 12: خروجی دستور hpasmcli با پارامتر help
پارامتر show
برای نمایش وضعیت قسمتهای مختلف سرور از این پارامتر استفاده می شود.
زمانی که از پارامتر show به تنهایی استفاده گردد تمام پارامترهایی که می توان همراه با آن به کار برده شود را نمایش می دهد .
تصویر 13: خروجی دستور hpasmcli با پارامتر show
پارامتر server
نمایش مشخصات سرور از جمله نوع سرور ،تعداد CPUهاو مدل آنها ،تعداد کارت های شبکه و… .
تصویر 14: خروجی دستور hpasmcli با پارامتر server
پارامتر temp
از این پارامتر جهت نمایش وضعیت سنسورهای سرور استفاده می گردد.
پارامتر dimm
این پارامتر اطلاعات RAMهایی که بر روی سرور نصب شدهاند را نمایش می دهد.
تصویر 15: خروجی دستور hpasmcli با پارامتر dimm
پارامتر fans
جهت نمایش اطلاعات مربوط به فن های نصب شده بر روی سرور به کار برده می شود.
پارامتر boot
نمایش لیستی از device های سرور بر اساس اولویت بوت شدن آنها.
پارامتر ht
از این پارامتر جهت نمایش وضعیت Hyper-Threading یا همان فراریسمانی سرور استفاده می شود .
فراریسمانی یک فناوری اختصاصی شرکت اینتل است که برای بهبود « رایانش موازی یا پردازش موازی» (انجام چند دستورالعمل به طور همزمان) در پردازنده به کار رفته است.با این فناوری، برای هر هسته پردازشی (هستههای واقعی)سیستم عامل دو هستهٔ مجازی ادرس دهی میکند و در هنگامی که امکان داشته باشد حجم کار را بین آنها تقسیم میکند.برای این فناوری نه تنها لازم است که سیستم عامل از چند پردازنده پشتیبانی کند بلکه باید برای آن بهینه سازی شده باشد؛ و شرکت اینتل توصیه میکند که در صورتی که از سیستم عاملی استفاده میکنید که هایپرتردینگ را پشتیبانی نمیکند، این فناوری را غیر فعال کنید.
تصویر 16: خروجی دستور hpasmcli با پارامتر های boot , ht
پارامتر iml
با استفاده از این پارامتر می توان مجموعه ای از اتفاقاتی که روی سرور رخ داده است را نمایش داد.این پارامتر محتوای IML سیستم را نمایش می دهد.
تصویر 17: خروجی دستور hpasmcli با پارامتر iml
پارامتر ipl
لیستی از انواعdevice های نصب شده بر روی سرور را نمایش می دهد.
پارامتر powersupply
جهت نمایش اطلاعات مربوط به وضعیت منبع تغذیه های نصب شده بر روی سرور به کار برده می شود.
تصویر 18: خروجی دستور hpasmcli با پارامتر های ipl , powersupply
پارامتر uid
جهت نمایش وضعیت led مربوط به uid سرور به کار برده می شود.
تصویر 19: LED مربوط uid سرور hp
پارامتر wol
جهت نمایش فعال یا غیر فعال بودن سیستم wake-on-lan بر روی سرور های hp به کار برده می شود.
Wake on lan یک سیستم استاندارد شبکه است که اجازه روشن یا همان بیدار شدن را با یک پیغام شبکه به سرور میدهد. این پیغام معمولاً توسط یک برنامه ساده بر روی سیستمی دیگر روی همان شبکه محلی ارسال میشود. بیدار شدن از شبکه یا همان Wake-on-LAN را به اختصار WOL نیز مینامند.
تصویر 20: خروجی دستور hpasmcli با پارامتر های uid , wol
5 ابزار dmidecode
ابزار dmidecode ،جدول DMI (بعضی ها به اسم SMBIOS آن را می شناسند) را می خواند و اطلاعات کاملی در مورد سختافزار سرور , BIOS ،CPU وRAMها را نمایش می دهد.
DMI تمام اطلاعات سخت افزاری سیستم را در خود نگهداری می نماید.
5.1 پارامتر های دستور dmidecode
در صورتی که دستورdmidecode به تنهایی استفاده گردد تمام اطلاعات مربوط به سخت افزارهای شناسایی شده سرور را نمایش می دهد.
پارامتر t یا type
برای اینکه بتوان از پارامتر های مختلف سخت افزاری به صورت keyword (یا نام سختافزاری) استفاده کرد،از این پارامتر استفاده می گردد.در غیر این صورت بایستی از id های از پیش تعریف شده برای هر نوع سختافزار استفاده شود.
پارامتر Memory
اطلاعات مربوط به RAM های سیستم و اسلات های حافظه را به نمایش می دهد.
تصویر 21: خروجی دستور dmidecode باپارامتر memory
پارامترBios
جهت نمایش اطلاعات مربوط به BIOS سیستم به کار برده می شود.
پارامترSystem
جهت نمایش اطلاعات مربوط به مدل ، Serial number وسازنده سیستم استفاده می شود.
تصویر 22: خروجی دستور dmidecode با پارامتر system
پارامترProcessor
این پارامتر اطلاعات کاملی از نوع پردازشگرها ، تعداد آنها ، سرعت و مدل آنها را به نمایش میگذارد.
تصویر 23: خروجی دستور dmidecode با پارامترprocessor
پارامترCache
جهت نمایش اطلاعات مربوط به cache پردازشگر سیستم استفاده می شود.
تصویر 24: خروجی دستور dmidecode با پارامتر cache
پارامترConnector
جهت نمایش اطلاعات مربوط به تمام پورت های سیستم از این پارامتر استفاده می گردد.
تصویر 25: خروجی دستور dmidecode با پارامترconnector
پارامترSlot
جهت نمایش مشخصات مربوط به تمام slot های سیستم استفاده می گردد.
تصویر 26: خروجی دستور dmidecode با پارامتر slot
6 بررسی لاگ های iLO جهت مشخص شدن مشکلات سخت افزاری
6.1 معرفی پورت iLO
Integrated Lights-Out Management یا iLO نام تکنولوژی مورد استفاده شرکت HP در تجهیزات سرور تولید شده توسط این شرکت میباشد.
iLO در زمانی به کار میرود که شما به هر دلیلی و از راه دور نیازمند به دسترسی سطح پایین ( Out-Band Management ) به سرور خود میباشید.