Więcej RAM nie zawsze znaczy lepiej. Taniej i wydajniej może być z pamięcią flash
Przyzwyczailiśmy się do tego, że komputery potrzebują RAM. Imwięcej pamięci operacyjnej tym lepiej, im poważniejszezastosowanie komputera, tym RAM-u potrzeba więcej. Wsuperkomputerach czy klastrach do przetwarzania Big Data częstomontuje się więc dziesiątki terabajtów modułów DRAM, znaczącozwiększających cenę sprzętu. A może to wszystko nie ma sensu,może tyle pamięci operacyjnej wcale nie jest potrzebne? Informatycyz MIT dowiedli, że istnieje wiele obciążeń roboczych, w którychpamięć DRAM lepiej zastąpić pamięcią zewnętrzną NAND flash.
Jako pamięć masowa flash NAND przyjął się na dobre, jakonośnik jest o rząd wielkości szybszy od dysków talerzowych. FlashNAND jest też bardziej energooszczędny, zarówno od mechanicznychdysków, jak i pamięci DRAM. Jednak w porównaniu do DRAM, jestprzeraźliwie powolne. Procesor jest w stanie uzyskać dostęp dodanych w takiej pamięci tysiące razy szybciej niż do danych wpamięci zewnętrznej. Nie bez znaczenia pozostają też ceny:serwerowe 64 GB RAM to ok. 2 tys. złotych. Szybki dysk SSD o takiejpojemności kosztuje ok. 200 zł.
Grupa informatyków z MIT pokazała jednak podczas poświęconegoarchitekturze komputerowej międzynarodowego sympozjum interesującąalternatywę dla bogatych w RAM systemów. W wielu typowych dlasuperkomputerów obciążeniach roboczych można wykorzystać zamiasttego klastry pamięci flash NAND, oszczędzając pieniądze i energięelektryczną. Dotyczy to wszystkich sytuacji, w których wąskimgardłem jest dostęp do pamięci zewnętrznej. Wystarczy, by wobliczeniach konieczne okazało się sięganie do danych na dyskachSSD przez więcej niż 5% czasu pracy, a znacznie efektywniejszestaje się zastosowanie większej ilości pamięci masowej niżoperacyjnej. Podczas prezentacji wykazano, że klaster 40 serwerów z10 TB RAM, który otrzymał do przeliczenia zbiór 10,5 TB danych,był mniej wydajny niż BlueDBM – eksperymentalny klaster 20serwerów z 20 TB flashowej pamięci masowej.
Oczywiście te konkurencyjne pod względem wydajności serwery niebyły czymś do zamówienia wprost z katalogów hurtowni. Badaczezbudowali własną sieć, kontrolującą ich komunikację z pamięciąmasową. Każdy z tych 20 serwerów połączony był z płytką zprogramowalnym układem FPGA, podłączonym do dwóch układów flashNAND o łącznej pojemności 1 TB. Każda z płytek z FPGA byłaspięta w sieć o pierścieniowej topologii z pozostałymi, copozwalało każdemu serwerowi na dostęp do każdej macierzy pamięci.Na FPGA uruchamiane było zaś oprogramowanie predykcyjne,umożliwiające efektywne buforowanie najpotrzebniejszych aktualniedanych.
Oprócz tego na FPGA działały też algorytymy wstępnieprzetwarzające dane gromadzone na pamięci flash, pod kątemzałożonych obciążeń roboczych. Przetestowano trzy takienarzędzia software'owe – dla wyszukiwania obrazów z bazy, dlaustalania rankingu w indeksie stron WWW (analogicznie do Google PageRank) oraz dla warstwy buforującej memcached, wykorzystywanej dobuforowania często pobieranych ze stron danych.
Badacze podkreślają, że to nie jest uniwersalne rozwiązanie, ina pewno DRAM nie zastąpi. Jednak wiele rodzajów aplikacji możeskorzystać na tej nowej architekturze, pozwalającej budować dlanich znacznie tańsze i znacznie bardziej energooszczędne komputery.Co szczególnie istotne, osiągnięcie to pokazuje, jak wieletechnice komputerowej może dać upowszechnienie się układów FPGA,na których uruchamiane byłyby specjalizowane akceleratory, napisanepod kątem zadanych obciążeń. Rozumie to dobrze Intel, który w2014 roku pokazał swój pierwszy procesor Xeon E5 z wbudowanym FPGAprodukcji Altery, a w tym roku za niemal 17 mld dolarów (w gotówce!)zakupił tę firmę – lidera na rynku programowalnych układówlogicznych.
Zainteresowanym szczegółami tej ciekawej konstrukcji polecamyartykuł naukowców z MIT i Quanta Research pt. BlueDBM: AnAppliance for Big Data Analytics.