Ignite 2019: SQL Server 2019 to już nie baza, to ogromny klaster danych
Podczas konferencji Ignite 2019 w Orlando Microsoft udostępnił nową wersję swojej relacyjnej bazy danych. Wydaniem SQL Server 2019 Microsoft pokazuje nam, czym jest BDC, czyli Big Data Clusters (Klastry Big Data).
SQL Server 2019 rozbudowuje najważniejsze cechy poprzednich wydań. Podobnie jak SQL Server 2017, jest dostępny dla Linuxa i może działać w kontenerach Kubernetes (K8s) i Dockera. Dzięki systemowi PolyBase SQL Server może łączyć się z systemami Big Data wirtualizować dane, co daje zupełnie nowe możliwości przetwarzania informacji. Połączenie tych cech powołało do życia Klastry Big Data.
Wielkie klastry danych – o co chodzi?
Microsoft zapowiedział wprowadzenie BDC podczas zeszłorocznej konferencji Ignite. BDC będą wykorzystywać implementację SQL Servera, działającą w klastrach złożonych z kontenerów K8s. Klaster będzie połączony z rozproszonym systemem plików Hadoop i silnikiem analizy danych Apache Spark w jedną, potężną platformę.
BDC będzie w stanie sprostać wymaganiom szybko rosnących repozytoriów danych niestrukturalnych (data lake), aplikacji OLTP, a nawet maszynowego uczenia. Klaster może działać na infrastrukturze lokalnej lub w chmurze – na przykład w Microsoft Azure, gdzie dostępne są usługi Kubernetes.
Warto tu dodać, że PolyBase w SQL Serverze 2019 może łączyć się nie tylko z klastrami Hadoop i Azure, ale też z innymi instancjami SQL Servera, bazami Oracle, Teradata, MongoDP (a więc Azure Cosmos DB) i dowolnym innym źródłem danych, jeśli dostanie odpowiedni sterownik. SQL Server 2019 może przejąć zadania związane z wirtualizacją danych, które nie migrują z oryginalnego źródła (zapytania można delegować do zdalnych źródeł danych). Bez tego stworzenie BDC nie byłoby możliwe.
Baza nie została porzucona
Oczywiście BDC to tylko część nowości w SQL Server 2019. Korzystający z oprogramowania w bardziej tradycyjny sposób też mają powody do radości.
TempDB można skonfigurować jako bazę danych zoptymalizowaną pod kątem użycia pamięci, co bardzo korzystnie wpłynie na wydajność pracy. Lepiej działa także optymalizacja zapytań i przywracanie bazy po awariach.
W skryptach SQL Server 2019 można wykorzystać kod napisany w R, Pythonie oraz Javie.