دوره آنلاین جامع مهندسی داده Data Engineer
در دوره جامع مهندسی داده به درک عمیقی از اجزای پلتفرم داده خواهید رسید و انواع مختلف پایگاه داده ای رابطهای مانند PostgreSQL و MySQL و پایگاه داده غیر رابطه ای مانند MongoDB ،زبان برنامه نویسی پایتون،Scala ، انبار داده, Lakehouse , Data Lake , مدل سازی داده ها، کلان داده ها و تکنیک های جستجو در آن با Elasticsearch ،Apache Spark ،Hadoop، انتقال و پردازش کلان داده ها، ذخیره سازی بهینه، نظارت بر داده ها، کنترل نسخ توزیع شده، استقرار و اجرای برنامه ها، ابزار مدیریت لاگ و مانیتورینگ با Grafana، Data Mesh و تکنیک های آماده سازی داده برای دانشمند علم داده جهت پیاده سازی الگوریتم های یادگیری ماشین بر بستر ویندوز و لینوکس ارائه خواهد شد.
این دوره به شما درک درستی از چرخه مهندسی داده را می دهد که شامل طراحی و معماری پلتفرم های داده ، طراحی انبارهای داده، آماده سازی و گرد آوری، جست جو و تجزیه و تحلیل داده ها داده می باشد.
آموزش دوره جامع مهندسی داده:
دوره جامع مهندسی داده Data Engineer
مدت دوره جامع مهندسی داده:
140 ساعت
پيش نياز دوره جامع مهندسی داده:
بدون پیش نیاز
مخاطب آموزش مهندسی داده:
علاقمندان به ورود به حوزه مهندسی داده ، پردازش کلان داده ها، تحلیلگران داده، دانشمندان علم داده
در انتهای دوره جامع مهندسی داده دانشجویان قادر خواهند بود:
یادگیری ایجاد، طراحی و مدیریت پایگاه داده های رابطه ای و اعمال مفاهیم مدیریت پایگاه داده MySQL, PostgreSQL
توسعه دانش کاری NoSQL و Big Data با استفاده از MongoDB، Hadoop، Apache Spark، Spark SQL، Spark ML و Spark Streaming
مدلسازی دادهها (نمودارهای موجودیت-رابطه، مفاهیم انبار داده، مفاهیم دریاچه داده، مدلسازی ابعادی)
یکپارچه سازی داده ها با Apache Kafka ,Airflow ,Data pipelines ETL,
فناوری های کلان داده (اکوسیستم آپاچی هادوپ، محاسبات توزیع شده)
پیاده سازی روشهای پاکسازی و اعتبارسنجی دادهها و اطمینان از بهره برداری اطلاعات بهطور مناسب برای کاربران
ایجاد داشبوردهای تعاملی
سرفصل دوره جامع مهندسی داده:
Learn a Programming Language: (Python, Scala)
Python
Scala
Database Fundamentals (NoSQL Databases, Relational Databases)
NoSQL Databases (MongoDB)
Relational Databases (PostgreSQL, MySQL)
Data Modeling (Data Warehouse Concepts, Data Lake Concepts, Dimensional Modeling, Entity-Relationship Diagrams, Elasticsearch, Kibana)
Data Warehouse Concepts, Data Lake Concepts, Dimensional Modeling, Entity-Relationship Diagrams
Elastic Search, Kibana
ETL and Data Integration (ETL Concepts, Data Pipeline Design, ETL Tools) Apache Spark
Linux LPIC1
Apache Spark
PySpark
Big Data Technologies (Apache Hadoop Ecosystem, Distributed Computing) Databricks
Apache Hadoop Ecosystem
Data Streaming (Distributed Event Stores, Stream Processing) Apache Kafka
Apache Kafka
Data Warehousing (Delta Lake, Data Lake Concepts) Delta Lake, AWS Athena
Data Lake
Workflow Orchestration (Apache Airflow)
Apache Airflow
Version Control and Collaboration (GitHub, GitLab)
GitHub, GitLab
Containerization and Orchestration (Docker)
Docker
Monitoring and Logging (Grafana)
Grafana
Advanced Topics (Machine learning Pipelines)
Machine learning Pipelines
جزئیات سرفصل آموزشی دوره جامع مهندسی داده را از طریق لینک زیر دریافت کنید: