Integrované funkce sledování stavu zařízení zvyšují dostupnost průmyslových počítačů

Integrované funkce sledování stavu zařízení (condition monitoring) u průmyslových počítačů znamenají, že uživatelé mohou aktivními opatřeními zvyšovat dostupnost svých strojů a zařízení a udržovat dobu odstávek na minimu. Základním předpokladem pro monitorování stavu zařízení ovšem je správná instalace snímačů do individuálních hardwarových komponent počítače a jeho periférií a správná interpretace měřených údajů. Výrobci strojů a zařízení (OEM) mohou ušetřit hodně času i peněz, když se rozhodnou pro průmyslový server, který už má v sobě integrované snímače i potřebné funkce pro sledování svého provozního stavu.

V Německu v současné době všichni hovoří o „Industrie 4.0“, projektu štědře dotovaném německou spolkovou vládou, který je součástí německého akčního plánu technického rozvoje. Podle projektu Industrie 4.0 stojí německá ekonomika na prahu čtvrté průmyslové revoluce, v níž budou hrát významnou roli tzv. kyber-fyzikální systémy (CPS). Podstatou je, že všechny komponenty průmyslových zařízení budou propojeny nejen lokálně, ale i v rámci celého závodu do sítě „internetu věcí“. Taková síť zpřístupní všechna relevantní data potřebná pro pokročilé monitorovací funkce a autonomní rozhodovací procesy. Umožní v reálném čas řídit, monitorovat a optimalizovat výrobní procesy. Nejenže přispěje ke zvýšení efektivity výroby, ale nepřetržité sledování stavu systému a jeho periférií je také základním předpokladem pro předvídání závad a prediktivní údržbu, jež zabraňuje nákladným neplánovaným odstávkám (obr. 1). 

Jak omezit drastické důsledky neplánovaných odstávek?

Selhání průmyslového serveru je spojeno s minimálně stejně drastickými důsledky a finančními ztrátami jako selhání serveru podnikového informačního systému. Jenže zatímco servery informačních systémů pracují v klimatizovaných serverovnách a dohlížejí na ně specialisté na výpočetní techniku, průmyslové servery musejí často pracovat v náročných průmyslových podmínkách. Cen­tralizovaný dohled specialisty na výpočetní techniku je v současné době spíše výjimečný. Neočekávané selhání se všemi jeho nepříjemnými důsledky je potom nevyhnutelné, protože ani ten nejlepší hardware nevydrží všechno. Například když okolní teplota přesáhne limitní hodnotu a ventilátor nemůže procesor uchladit, protože je pokrytý prachem, nebo když hard-disk nevydrží vibrace, které se na něj přenášejí od strojů pracujících v těsné blízkosti.

Nepřetržitý dohled nad klíčovými provozními parametry, jako jsou teplota procesoru, otáčky ventilátorů, stav hard-disku nebo napětí v systému, umožňuje detekovat příznaky poruchy již v počátečním stadiu, a to i v drsném průmyslovém prostředí, a předem přijmout včas odpovídající nápravná opatření (obr. 2). Například závada hard-disku, jež má obvykle mechanickou příčinu, se obvykle projevuje dlouho dopředu postupným zhoršováním jeho parametrů: zvyšuje se četnost chyb při čtení a zápisu a roste počet vadných sektorů. Postupné zhoršování parametrů hard-disku lze zachytit pomocí standardizované diagnostické metody S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology).

Také selhání ventilátoru, který chladí procesor, zdroj nebo celý hardwarový systém, o sobě dává vědět ve velkém předstihu prostřednictvím změn otáček ventilátoru a zvýšení teploty komponent. Sledováním těchto parametrů lze selhání předvídat a podezřelé komponenty preventivně vyměnit v rámci běžné údržby ještě před jejich selháním (obr. 3). Tím se zabrání drahým neočekávaným odstávkám provozu a náklady na údržbu se tím sníží, a to velmi výrazně – desetkrát až stokrát. Prediktivní údržba, která zahrnuje také nepřetržité sledování klíčových provozních parametrů, ušetří provozovateli zařízení čas i peníze a provozním operátorům přinese více klidu.

Jestliže jsou výrobci strojů a zařízení v těsné spolupráci s koncovým zákazníkem schopni navrhnout, vytvořit a nabídnout takové řešení údržby, jaké bylo popsáno, významně to zlepší jejich poprodejní vztahy se zákazníky.  

Vhodné řešení je dosud vzácné

Systémy pro nepřetržité sledování provozního stavu průmyslových serverů, které jsou v současnosti dostupné na trhu, vyžadují pro připojení snímačů speciální hardwarové moduly. Tím roste cena celého zařízení a ne každý výrobce nebo koncový uživatel je připraven nést takové zvýšení nákladů. Na druhé straně jsou na trhu k dispozici profesionální softwarové systémy pro vzdálený dohled nad servery informačních systémů, ovšem ty nejsou určené do průmyslového prostředí a zpravidla jsou příliš rozsáhlé a drahé. Až dosud hledání vhodného řešení zpravidla končilo u softwarových nástrojů, jejichž využití vyžadovalo pro realizaci přístupu k datům ze snímačů důkladnou znalost hardwarových komponent a výstupu jednotlivých snímačů. Výrobci strojů a zařízení stejně jako koncoví uživatelé ovšem potřebují snadno ovladatelný nástroj, který požadované informace zobrazí v co nejjednodušší formě a který dokáže využívat pokud možno všechny informační kanály, aby mohl být snadno začleněn do stávající komunikační infrastruktury podniku i výrobních zařízení. Dále se požaduje, aby bylo možné nakonfigurovat způsoby notifikace událostí, např. prostřednictvím e-mailu nebo SMS, které se automaticky odešlou přímo odpovědnému technikovi. Zvláště výrobci strojů a zařízení požadují síťové protokoly jako SNMP (Simple Network Management Protocol) nebo rozhraní webových služeb SOAP (Simple Object Access Protocol). To umožňuje přenést hodnoty klíčových provozních parametrů do centrálního monitorovacího serveru, který se potom může starat o dohled nad několika systémy najednou. Zkrátka řečeno, výrobci strojů a zařízení i jejich uživatelé požadují jednoduchý, nenákladný a efektivní monitorovací systém, který s minimálním úsilím přináší co největší výhody.  

Vzdálená správa pro průmyslové servery

Řešení, které splňuje popsané požadavky, nabízí firma Kontron. PC Condition Monitoring, PCCM, je softwarový systém, který dokáže kontinuálně sledovat stav průmyslových serverů. Je navržen pro průmyslové servery KISS druhé generace, ale lze jej snadno použít i pro jiné servery.

Systém pro kontinuální sledování stavu systému PCCM byl navržen tak, aby byl levný a bylo možné snadno jej ovládat a užívat. Má přímý přístup k odpovídajícím provozním parametrům serverových komponent. Servisní technici a administrátoři dostávají upozornění na překročení mezí monitorovaných provozních veličin cestou, kterou si mohou zvolit: zprávou SMS, e-mailovou zprávou, prostřednictvím SNMP, služby Windows News Service nebo přímo na místě vizuálním nebo akustickým signálem. Jestliže je to požadováno, mohou být data ukládána a archivována a lze je zobrazovat lokálně stejně jako na dálku. Implementována je také webová služba SOAP, která umožňuje připojení ke specifickým systémům údržby využívaným zákazníky. Navíc je možné signály přenášet i přímo prostřednictvím paralelního rozhraní. 

Bezpečná implementace

Na rozdíl od mnoha nástrojů pro sledování provozu zařízení, které jsou založené na standardu ACPI (Advanced Configura­tion and Power Interface), přistupuje PCCM k datům ze snímačů prostřednictvím vlastního rozhraní API. To znamená, že systém PCCM pracuje zcela spolehlivě, aniž by ho mohly ovlivnit případné chyby v ovladačích snímačů nebo jejich softwaru. Výrobci strojů a zařízení a jejich zákazníci získají v podobě PCCM snadno ovladatelný systém údržby, který od nich nevyžaduje hluboké znalosti hardwaru ani žádné vývojářské úsilí. Měřené provozní parametry zahrnují napětí na komponentech systému, teploty procesorů, čipových sad a hard-disků a otáčky ventilátorů pro chlazení procesoru, skříně serveru a napájecího zdroje. Stav hard-disku je zjišťován prostřednictvím rozhraní S.M.A.R.T. Lze monitorovat také stav celého subsystému diskového pole RAID. Do monitorovacího systému PCCM je možné zahrnout také měření napájecího napětí a sledování dostupnosti záložního zdroje (UPS).  

Co vidí uživatel

Kromě zasílání upozornění prostřednictvím SMS nebo e-mailu mohou být hodnoty monitorovaných provozních veličin zobrazeny v běžném webovém prohlížeči na pracovišti údržby nebo operátorů. Diagnostické údaje jsou zobrazovány přehledně s respektováním barevné konvence zelená – oranžová – červená (obr. 4). Prostřednictvím webového rozhraní je možné také individuálně nastavit meze pro vybavení nebo resetování výstražných hlášení, stejně jako zpoždění pro zarušené signály nebo signály s výskytem špiček. Hodnoty provozních veličin jsou ukládány pro dlouhodobou analýzu provozu po celou dobu technického života zařízení. V jakémkoliv časovém intervalu lze v nastavené periodě ukládat maximální, minimální a průměrnou hodnotu určených veličin. Je možné zvolit jinou periodu ukládání hodnot v normálním provozním režimu a jinou v situaci, kdy je některý ze sledovaných parametrů mimo stanovené meze. To omezuje objem ukládaných dat bez ztráty přesnosti. Pro externí analýzu mohou být data exportována v souboru CSV, který lze potom importovat do všech běžných tabulkových procesorů a databází.  

Flexibilní rozšiřitelnost

Díky modulární struktuře aplikace lze do systému kromě dat z různých vestavných hardwarových komponent zahrnout také jiná, uživatelsky specifická data. Tak lze do systému integrovat např. externí snímače otřesů nebo nárazu či snímač vlhkosti. Uživatelé se nedostanou do nesnází ani tehdy, když potřebují nakonfigurovat limitní hodnoty těchto veličin pro vybavení výstražných hlášení. Kontron může těžit ze svých bohatých zkušeností a podělit se o ně se svými zákazníky nebo, je-li to třeba, se sám postarat o konfiguraci limitních hodnot před dodávkou serveru.  

Günther Dumsky, Global Product Line Manager Rackmount IPC, PICMG 1.x a BoxPCs, Kontron

Obr. 1. Neočekávané selhání může způsobit odstávku spojenou s vysokými náklady

Obr. 2. Nepřetržité sledování hodnot provozních parametrů je předpokladem pro prediktivní údržbu, která zkracuje dobu odstávky a snižuje náklady na údržbu desetkrát až stokrát

Obr. 3. Servery KISS jsou vybaveny redundantními ventilátory; v případě oprávněného podezření blížící se poruchy ventilátoru je jeho výměna velmi snadná – ventilátor je přístupný z čelní strany a pro jeho výměnu není třeba server odstavovat

Obr. 4. Systém PCCM má přímý přístup k datům ze snímačů prostřednictvím vlastního API; díky respektování barevné konvence zelená – oranžová – červená je diagnostika provozu serveru zcela intuitivní