Napačna izbira? Nič za to! Ponujamo možnost vračila v 30 dneh
Z darilnim bonom ne morete zgrešiti. Obdarovanec lahko v zameno za darilni bon izbere karkoli iz naše ponudbe.
30 dni za vračilo blaga
APRENDE APACHE SPARK Construya Pipelines Escalables con PySpark y Optimización
Este libro está dirigido a estudiantes, desarrolladores, ingenieros de datos, científicos de datos y profesionales de tecnología que buscan dominar Apache Spark en la práctica, tanto en entornos corporativos como en la nube pública y en integraciones modernas. Aprenderá a construir pipelines escalables para el procesamiento de datos a gran escala, orquestando cargas de trabajo distribuidas con AWS EMR, Databricks, Azure Synapse y Google Cloud Dataproc.
El contenido abarca integración con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB y Python, además de técnicas avanzadas de tuning, optimización de jobs, análisis en tiempo real, machine learning con MLlib y automatización de workflows.
Incluye:
• Implementación de pipelines ETL y ELT con Spark SQL y DataFrames
• Procesamiento de datos en streaming e integración con Kafka y AWS Kinesis
• Optimización de jobs distribuidos, tuning de performance y uso de Spark UI
• Integración de Spark con S3, Data Lake, NoSQL y bases de datos relacionales
• Deploy en clusters gestionados en AWS, Azure y Google Cloud
• Machine Learning aplicado con MLlib, Delta Lake y Databricks
• Automatización de rutinas, monitoreo y escalabilidad para Big Data
Al final, dominará Apache Spark como solución profesional para análisis de datos, automatización de procesos y machine learning en entornos complejos y de alto rendimiento.
Pozdravljeni! Sem Libroamiko, vaš knjižni svetovalec.
Kako vam lahko pomagam?