دوره حضوری / آنلاین جامع مهندسی داده Data Engineer

دوره حضوری / آنلاین جامع مهندسی داده Data Engineer

در دوره جامع مهندسی داده به درک عمیقی از اجزای پلتفرم داده خواهید رسید و انواع مختلف پایگاه داده ای رابطه‌ای مانند PostgreSQL و MySQL و پایگاه داده غیر رابطه ای مانند MongoDB ،زبان برنامه نویسی پایتون،Scala ، انبار داده, Lakehouse , Data Lake , مدل سازی داده ها، کلان داده ها و تکنیک های جستجو در آن با Elasticsearch ،Apache Spark ،Hadoop، انتقال و پردازش کلان داده ها، ذخیره سازی بهینه، نظارت بر داده ها، کنترل نسخ توزیع شده، استقرار و اجرای برنامه ها، ابزار مدیریت لاگ و مانیتورینگ با Grafana، Data Mesh و تکنیک های آماده سازی داده برای دانشمند علم داده جهت پیاده سازی الگوریتم های یادگیری ماشین بر بستر ویندوز و لینوکس ارائه خواهد شد.

این دوره به شما درک درستی از چرخه مهندسی داده را می دهد که شامل طراحی و معماری پلتفرم های داده ، طراحی انبارهای داده، آماده سازی و گرد آوری، جست جو و تجزیه و تحلیل داده ها داده می باشد.

آموزش دوره جامع مهندسی داده:

دوره جامع مهندسی داده Data Engineer

مدت دوره جامع مهندسی داده:

140 ساعت

پيش نياز دوره جامع مهندسی داده:

بدون پیش نیاز

مخاطب آموزش مهندسی داده:

علاقمندان به ورود به حوزه مهندسی داده ، پردازش کلان داده ها، تحلیلگران داده، دانشمندان علم داده

در انتهای دوره جامع مهندسی داده دانشجویان قادر خواهند بود:

یادگیری ایجاد، طراحی و مدیریت پایگاه داده های رابطه ای و اعمال مفاهیم مدیریت پایگاه داده MySQL, PostgreSQL
توسعه دانش کاری NoSQL و Big Data با استفاده از MongoDB، Hadoop، Apache Spark، Spark SQL، Spark ML و Spark Streaming
مدل‌سازی داده‌ها (نمودارهای موجودیت-رابطه، مفاهیم انبار داده، مفاهیم دریاچه داده، مدل‌سازی ابعادی)
یکپارچه سازی داده ها با Apache Kafka ,Airflow ,Data pipelines ETL,
فناوری های کلان داده (اکوسیستم آپاچی هادوپ، محاسبات توزیع شده)
پیاده سازی روش‌های پاکسازی و اعتبارسنجی داده‌ها و اطمینان از بهره برداری اطلاعات به‌طور مناسب برای کاربران
ایجاد داشبوردهای تعاملی

سرفصل دوره جامع مهندسی داده:

Learn a Programming Language: (Python, Scala)
   Python
   Scala
Database Fundamentals (NoSQL Databases, Relational Databases)
   NoSQL Databases (MongoDB)
   Relational Databases (PostgreSQL, MySQL)
Data Modeling (Data Warehouse Concepts, Data Lake Concepts, Dimensional Modeling, Entity-Relationship Diagrams, Elasticsearch, Kibana)
   Data Warehouse Concepts, Data Lake Concepts, Dimensional Modeling, Entity-Relationship Diagrams
   Elastic Search, Kibana
ETL and Data Integration (ETL Concepts, Data Pipeline Design, ETL Tools) Apache Spark
   Linux LPIC1
   Apache Spark
   PySpark
Big Data Technologies (Apache Hadoop Ecosystem, Distributed Computing) Databricks
   Apache Hadoop Ecosystem
Data Streaming (Distributed Event Stores, Stream Processing) Apache Kafka
   Apache Kafka
Data Warehousing (Delta Lake, Data Lake Concepts) Delta Lake, AWS Athena
   Data Lake
Workflow Orchestration (Apache Airflow)
   Apache Airflow
Version Control and Collaboration (GitHub, GitLab)
   GitHub, GitLab
Containerization and Orchestration (Docker)
   Docker
Monitoring and Logging (Grafana)
   Grafana
Advanced Topics (Machine learning Pipelines)
   Machine learning Pipelines

جزئیات سرفصل آموزشی دوره جامع مهندسی داده را از طریق لینک زیر دریافت کنید:


سرفصل دوره سماتک