Specjalista ds. teleinformatycznych i optymalizacja zasilania w serwerowni cz.74
Ze względu na rozbudowę systemu informatycznego (raz i dwa ) w szpitalu w zeszłym roku do serwerowni doszło sporo nowego sprzętu, który został zainstalowany w dwóch szafach serwerowych. Dzięki tym urządzeniom serwerownia zyskała sporo nowych zasobów, z których nasi kochani pracownicy mogą korzystać. Nowe sprzęty, które zostały dostarczone w zeszłym roku to UPS 1, UPS 2, dwa switche w drugiej szafie, macierz oraz serwery nr 3, 4, 7, 8. Te 4 serwery wraz z macierzą są najważniejszymi serwerami. Na tych serwerach trzymane są wszystkie dane pacjentów, ich badań i tak dalej (serwery 7, 8 i macierz) a także dodatkowy backup wszystkich najważniejszych danych oraz oprogramowanie do wymiany informacji z innymi szpitalami (serwery 3, 4 i macierz). Te 4 serwery muszą działać cały czas.
W dużym uproszczeniu tak wygląda układ serwerów na chwilę obecną. Wydawało mi się wówczas (przy projektowaniu takiego układu), że takie ułożenie posiadanych sprzętów jest optymalne, jednakże okazało się, że nie do końca. Niedawno w firmie mieliśmy kompleksową wymianę łącz elektrycznych dla szpitala. Wymiana ta miała się wiązać z całkowitym brakiem prądu w szpitalu przez okres około 2 godzin. Wyliczyłem sobie, że po odłączeniu zbędnych na tamtą chwilę serwerów (tj serwerów dla administracji czyli urządzeń nr 1, 2, 5, 6, 9, 10 (swoją drogą wśród nich tez przydałaby się jakaś optymalizacja, bo coś ich za dużo jest) oraz jednego ze switchów) reszta powinna działać około 2, 5 godziny, a więc wynik jak najbardziej akceptowalny. Niestety jak to bywa w życiu z zaplanowanych 2 godzin wyłączenia prądu wyszło ponad 4 godziny. Oczywiście po lekko ponad 2 godzinach (macnąłem się w obliczeniach jakieś 15 minut) reszta serwerów padła. Czekaliśmy z prawidłowym zamknięciem komputerów jak najdłużej się dało i przesadziliśmy trochę.
Prąd w UPS'ach skończył się szybciej i wszystkie serwery po prostu padły. A że czekaliśmy na powrót prądu to była chwila (dość długa:)) aby przedyskutować nowe lepsze ustawienie serwerów. Po jakieś godzinie dyskusji stwierdziliśmy, że podstawowym błędem było zainstalowanie serwerów 3 i 4 (jedno ważne zadanie - patrz powyżej) w jednej szafie a serwerów 7 i 8 (drugie ważne zadanie - patrz powyżej) w drugiej szafie. Kolejnym błędem było podłączenie routera dostępowego i VPN (wraz z jednym ze switchy) do UPS'a gdzie są już serwery. Dostęp do Internetu również powinien być dostępny bez względu na wszelkie inne okoliczności, ponieważ inne jednostki nie będą miały również do niego dostępu i możliwości komunikowania się ze sobą bez udziału głównej serwerowni
Jednakże chyba największym błędem była instalacja okablowania z całego szpitala do switcha, do którego podłączone są również serwery z szafy 1. Nie dość, że do switcha podpięte są komputery z administracji to jeszcze podpiąłem tam switche z poszczególnych pięter (3 piętra - 3 oddziały). Zrobiłem misz-masz na całego. Dlatego też właśnie powstał pomysł dostawienia trzeciej szafy, gdzie podłącze administrację. Dzięki temu do switcha w szafie nr 1 zostaną podłączone tylko serwery i przełączniki z reszty pięter.
Widać więc, że takie nie do końca zaplanowane wyłączenia prądu dają wiele pozytywów. Szybko mogłem sprawdzić, gdzie mam błędy projektowe, a kilka ich było. Kilka z nich (np. router dostępowy nie podłączony do żadnego UPS'a) mogłem wyeliminować od razu a nad innymi był czas i sposobność zastanowić się dłużej.
----- Jeszcze spis treści mojego bloga (wiem, wiem ta regułka zaczyna być nudna:)) i zapraszam do moich wpisów. Polecam szczególnie ten wpis, gdzie opisałem jak poprawnie formatować wpisy na blogu, bo niektóre pomimo świetnej treści formatowanie mają niepoprawne. Ponadto polecam ten wpis na forum gdzie Semtex opisał jak wrzucać grafikę na naszego bloga. Informuję także, że wszystkie grafiki, użyte w wpisie są mojego autorstwa lub są dostępne w otwartej licencji lub są pobrane z oficjalnych stron podmiotów, o których wspominałem we wpisie. Pozdrawiam Shaki81