
Parameter
Mehr zum Buch
Potrzeby analizy dużych zbiorów danych rosną, a PySpark, interfejs API systemu Spark dla Pythona, staje się kluczowym narzędziem. Apache Spark doskonale nadaje się do analizy dużych danych, a PySpark ułatwia integrację z narzędziami PyData. Aby w pełni wykorzystać te możliwości, istotne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami analitycznymi. Przewodnik po wersji 3.0 systemu Spark przedstawia metody statystyczne i rzeczywiste zbiory danych, omawiając zasady rozwiązywania problemów analitycznych za pomocą PySpark oraz dobre praktyki programowania. Po lekturze można łatwo zgłębić analityczne wzorce oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie IT i finansach. Książka zawiera również opisy przetwarzania obrazów i języka naturalnego oraz rzeczywiste przykłady analizy dużych zbiorów danych. Dzięki niej poznasz model programowania w ekosystemie Spark, podstawowe metody w nauce o danych, pełne implementacje analiz publicznych zbiorów danych, konkretne przypadki użycia narzędzi uczenia maszynowego oraz kod, który można łatwo dostosować do własnych potrzeb. PySpark to odpowiedź na wyzwania inżynierów danych!
Buchkauf
Zaawansowana analiza danych w PySpark, Autorenkollektiv
- Sprache
- Erscheinungsdatum
- 2023
- product-detail.submit-box.info.binding
- (Paperback)
Lieferung
- Gratis Versand in ganz Österreich
Zahlungsmethoden
Keiner hat bisher bewertet.