BigQuery to wysoce skalowalna, bezserwerowa hurtownia danych działająca w chmurze. Umożliwia ona analizowanie ogromnych ilości danych bez konieczności zarządzania infrastrukturą. Na tle konkurencji wyróżnia się szeregiem funkcji i możliwości, które sprawiają, że jest popularnym wyborem dla przedsiębiorstw i organizacji poszukujących potężnych narzędzi do przetwarzania i analizy danych.
Zanim przejdę do opisania tego jak możesz wykorzystać hurtownię danych bigquery w biznesie skupmy się na kilku elementach charakterystycznych dla tego narzędzia.
Z roku na rok Google BigQuery ma coraz szersze zastosowanie w biznesie. Bardzo istotną rolą jest możliwość załadowania i przechowywania Twoich danych z różnych źródeł w jedno miejsce. Dzięki temu znacznie zwiększasz możliwości analityczne swojego biznesu mogąc tworzyć raporty, analizy i modele uwzględniające dane z wielu narzędzi i programów, z których korzystacie na co dzień.
BigQuery przestaje być również miejscem z którego korzystają tylko analitycy i inżynierowie danych. Dobrze skonstruowana hurtownia daje wiele możliwości interakcji z danymi. Menedżerowie i specjaliści mogą łatwo zintegrować dane z narzędziami, które znają i korzystają na co dzień, takimi jak Google Sheets, Excel czy Google Slides.
Poniżej spisałem obszary, które są najpopularniejszymi zastosowaniami narzędzia w codziennych potrzebach biznesowych.
Dodatkowo, narzędzie umożliwia przeprowadzenie szybkiej eksploracji waszych danych za pomocą konsoli, narzędzia DataPlex, DataPrep lub za pomocą Looker Studio. Jeśli macie potrzebę zaawansowanej pracy na danych geograficznych, z pomocą przyjdzie wam przeznaczone do tego BigQuery Geo VIZ.
BigQuery ML daje wam możliwość tworzenia i trenowania modeli typu machine learning przy pomocy języka SQL.
Jest to ogromna zaleta przede wszystkim dla mniejszych firm, które nie potrzebują ponosić dodatkowych kosztów na zatrudnianie ludzi o różnych kompetencjach programistycznych aby stworzyć zaawansowane modele rekomendacyjne, prognostyczne czy klasyfikacyjne.
Całość możecie obsłużyć w ramach interfejsu używając funkcji BigQuery ML. Jeśli macie jednak bardziej zaawansowane potrzeby tworzenia modeli ML, tabele przechowywane w hurtowni danych możecie w prosty sposób zintegrować z bardziej zaawansowanymi narzędziami i platformami wspomagającymi tą część analityki.
Od niedawna w narzędziu posiadamy możliwość prostej integracji z modelami sztucznej inteligencji udostępnionymi przez Vertex AI. Dzięki temu możemy za pomocą języka SQL tworzyć bardzo zaawansowane analizy z wykorzystaniem modeli językowych i multimodalnych bezpośrednio na danych zawartych w naszych tabelach.
Zupełnie innym scenariuszem będzie migracja już istniejącej hurtowni danych, którą możemy przeprowadzić zupełnie bezkosztowo z takich źródeł jak : Snowflake, Amazon Redshift, Apache Hive, Teradata, Oracle i IBM Netezza.
Jedną z podstawowych funkcjonalności BigQuery jest przechowywanie ogromnych ilości danych. W teorii nie ma limitów odnośnie tego jak dużą ilość danych możemy załadować do naszej hurtowni danych. Są jednak przypadki, że mówimy o tak ogromnych ilościach danych, że tradycyjne sposoby migracji lub replikacji nie wchodzą w grę z powodu ograniczeń prędkości internetu i limitów ładowania narzędzia.
Aby unikać zbędnych kosztów i manualnego uruchamiania tych samych zapytań, procesy transformacyjne najlepiej zautomatyzować. Do wykonywania działań transformacyjnych rekomendujemy natywne rozwiązanie Google Cloud – Dataform lub sprawnie integrujący się z GCP narzędzie dbt.
Jedną z istotnych funkcjonalności biznesowych jest możliwość udostępniania danych różnym interesariuszom. W BigQuery mamy dużo możliwości publikacji lub eksportu danych. Ludzie nie mający doświadczenia z językiem SQL mogą uzyskać dostęp do danych bezpośrednio z poziomu Google Sheets.
Bezpieczeństwo danych Twojej firmy jest jednym z najważniejszych elementów w Twoim biznesie.
Szczególnie ważne jest aby wdrażać hurtownię danych mając na uwadze kto, kiedy i na jakiej zasadzie może mieć dostęp do Twoich danych. BigQuery w połączeniu z innymi funkcjonalnościami Google Cloud umożliwia szereg zabezpieczeń oraz monitorowania wszystkich akcji oraz zadań związanych z Twoimi danymi.
Dzięki temu możesz zarządzać bardzo szczegółowo dostępami oraz możliwościami eksportu danych poza obszar chmury Google. Dodatkowo BigQuery umożliwia analizowanie całej historii działań wszystkich użytkowników w Twojej organizacji oraz tworzenie alertów w momencie pojawienia się niepokojącego zachowania.
W BigQuery poza nadawaniem uprawnień na poziomie projektu, zbioru danych czy tabeli możesz zastosować row level policy lub column level policy ułatwiając dostęp różnym interesariuszom tylko do istotnych danych w ramach jednej tabeli.
Rola | Opis uprawnień |
---|---|
Admin | Zapewnia uprawnienia do zarządzania wszystkimi zasobami w ramach projektu. |
Data Editor (roles/bigquery.dataEditor) | Na poziomie tabeli lub widoku:
Na poziomie datasetu:
|
Data Owner (roles/bigquery.dataOwner) | Na poziomie tabeli lub widoku:
Na poziomie datasetu:
|
Data Viewer (roles/bigquery.dataViewer) | Na poziomie tabeli lub widoku:
Na poziomie datasetu:
Na poziomie projektu:
|
Job User (roles/bigquery.jobUser) | Zapewnia uprawnienia do uruchamiania zadań, w tym zapytań, strumieniowania i transferów w ramach projektu. |
Korzystając z DataPlex możemy zarządzać wszystkimi tymi operacjami w jednym miejscu. Dodatkowo tworząc procesy profilujące dane oraz testy jakości mamy możliwość ciągłego monitorowania problemów z kompletnością lub poprawnością naszych danych. W dojrzałej organizacji za te działania będzie odpowiedzialny Data Steward.
To bardzo ważne pytanie dla tych, którzy myślą na poważnie o zaimplementowaniu narzędzia w swoim biznesie. Koszt BigQuery składa się z dwóch głównych elementów:
Poza tymi głównymi kosztami, zapłacisz za korzystanie z innych alternatywnych funkcjonalności dostępnych w narzędziu. Głównie chodzi o korzystanie z BigQuery Omni, BigQuery ML, BI Engine oraz strumieniowania danych do i z tabel.
Narzędzie oferuje również bezpłatny tier, w ramach którego masz dostępne 20 Gb miejsca na przechowywanie danych oraz 1 TB na computing w projekcie.
Jeśli Twoja firma pracuje bardzo dużo na danych, zamiast korzystać z modelu pay as you go możecie wykorzystać jedną trzech możliwych opcji tierowych zwanych edycjami.
Dzięki temu koszty narzędzia będą bardziej przewidywalne ponieważ z góry zapłacisz za możliwość korzystania ze slotów obliczeniowych.
Usługi i wykorzystanie | Typ subskrypcji | Cena (USD) |
---|---|---|
Wersja bezpłatna | Wersja darmowa zapewnia klientom 10 GiB miejsca na dane, do 1 TiB na obliczenia oraz dostęp do innych zasobów. | Bezpłatnie |
Obliczenia (Computing) | On Demand Zapewnia dostęp do 2000 slotów jednocześnie, współdzielonych między wszystkimi zapytaniami w ramach jednego projektu. |
Od $6,25 za TiB przeskanowanych danych. Pierwszy 1 TiB na miesiąc jest bezpłatny. |
Wersja standardowa Niskokosztowa opcja do standardowej analizy SQL |
$0,04 za godzinę slotu |
|
Wersja Enterprise Zaawansowana analityka korporacyjna |
$0,06 za godzinę slotu |
|
Wersja Enterprise Plus Analityka korporacyjna o znaczeniu krytycznym |
$0,10 za godzinę slotu |
|
Przechowywanie (Storage) | Aktywna pamięć lokalna W oparciu o nieskompresowane bajty używane w tabelach lub partycjach tabel zmodyfikowanych w ciągu ostatnich 90 dni. |
Od $0,02 za GiB. Pierwsze 10 GiB jest bezpłatne każdego miesiąca. |
Długoterminowa pamięć logiczna W oparciu o nieskompresowane bajty używane w tabelach lub partycjach tabel zmodyfikowanych przez 90 kolejnych dni. |
Od $0,01 za GiB. Pierwsze 10 GiB jest bezpłatne każdego miesiąca. |
|
Aktywna pamięć fizyczna W oparciu o skompresowane bajty używane w tabelach lub partycjach tabel zmodyfikowanych przez 90 kolejnych dni. |
$0,04 za GiB. Pierwsze 10 GiB jest bezpłatne każdego miesiąca. |
|
Długoterminowa pamięć fizyczna W oparciu o skompresowane bajty w tabelach lub partycjach, które nie zostały zmodyfikowane przez 90 kolejnych dni. |
$0,02 za GiB. Pierwsze 10 GiB jest bezpłatne każdego miesiąca. |
|
Pozyskiwanie danych |
Wczytywanie wsadowe Import tabeli z zasobnika w chmurze |
Bezpłatnie Podczas korzystania ze współdzielonej puli slotów |
Ładowanie strumieniowe Opłata naliczana jest za pomyślnie załadowane wiersze. Poszczególne wiersze są obliczane przy użyciu minimum 1 KB. |
0,01 USD za 200 MiB |
|
BigQuery Storage Write API Dane załadowane do BigQuery podlegają cenom przechowywania BigQuery lub cenom Cloud Storage. |
0,025 USD za 1 GiB. Pierwsze 2 TiB miesięcznie są bezpłatne. |
|
Eksport danych |
Eksport Eksportuj dane tabeli do Cloud Storage. |
Bezpłatnie |
Odczyt - strumieniowanie Dostępd do danych poprzez API |
Od 1,10 USD za odczytany TiB |
Jeśli chcesz śledzić na bieżąco koszt użycia narzędzia przejdź do strony Cloud Billing w konsoli Google Cloud i otwórz zakładkę reports.
Po prawej stronie w okienku filtrów wybierz usługę BigQuery. To pozwoli Ci lepiej zrozumieć ile płacisz dziennie za korzystanie z narzędzia.
Hybrid Poplar Sp. z o.o.
VAT ID: PL5213892597
ul. Ksawerów 3,
02-656 Warszawa
Copyright © 2024 bigglo | Wszelkie prawa zastrzeżone.
Hybrid Poplar Sp. z o.o.
VAT ID: PL5213892597
ul. Ksawerów 3,
02-656 Warszawa
Copyright © 2024 bigglo.pl
Ustawienia plików cookies
Informacje o plikach cookies
Szanujemy Twoją prywatność