25 آذر 1397
بنا به اصلاحات انجام شده و کاربردی تر کردن دوره های مربوط به حوزه علم داده این دوره با تغییر سرفصل های آموزشی در قالب دوره ای جدید ارائه می گردد برای اطلاع از دوره های جدید به لینک زیر مراجعه کنید.
دوره مهندس داده Data Engineer
Introduction to Big Data
What is Big Data-
Big Data opportunities, Challenges-
Characteristics of Big Data-
Introduction to Hadoop
Hadoop Distributed File System-
Comparing Hadoop & SQL-
Data Locality-
Hadoop Architecture-
Map Reduce & HDFS-
(Hadoop Distributed File System (HDFS
HDFS Design & Concepts-
Blocks, Name nodes and Data nodes-
HDFS High-Availability and HDFS Federation-
Hadoop DFS The Command-Line Interface-
Basic File System Operations-
Anatomy of File Read, File Write-
Metadata, FS image, Edit log, Secondary Name Node and Safe Mode-
(How to add New Data Node dynamically, decommission a Data Node dynamically (Without stopping cluster-
How to override default configuration at system level and Programming level-
Map Reduce
Map Reduce Functional Programming Basics-
Map and Reduce Basics-
How Map Reduce Works-
Anatomy of a Map Reduce Job Run-
Shuffling and Sorting-
Splits, Record reader, Partition, Types of partitions & Combiner-
(Distributed Cache and Hadoop Streaming (Python, Ruby and R–
Apache YARN-
Sequential Files and Map Files-
Map side Join with distributed Cache-
Map Reduce Programming – Java Programming
Hands on “Word Count” in Map Reduce in standalone and Pseudo Distribution Mode-
Write some Map Reduce programs to solve some real world problems-
Apache HIVE Installation
Installing Hive-
Configuring Hive-
Configuring Metastore of Hive-
Verifying Hive Installation-
Database Operations-
Create Database Statement-
Drop Database Statement-
Table Operations
Create Table Statement-
Load Data Statement-
Alter Table Statement-
Change Statement-
Add Columns Statement-
Replace Statement-
Drop Table Statement-
Apache Spark Basics
? What is Apache Spark-
Spark Installation-
Spark Configuration-
Spark Context-
Using Spark Shell-
Resilient Distributed Datasets (RDDs) – Features, Partitions, Tuning Parallelism-
Functional Programming with Spark-
Working with RDDs
RDD Operations – Transformations and Actions-
Types of RDDs-
Key-Value Pair RDDs – Transformations and Actions-
MapReduce and Pair RDD Operations-
Serialization-
Spark on a cluster
Overview-
A Spark Standalone Cluster-
The Spark Standalone Web UI-
Executors & Cluster Manager-
Spark on YARN Framework-
26 فروردین 1397
مفاهیم مقدماتی در اکسل:
-مفاهیم آدرس سلول، آدرس محدوده، نامگذاری محدوده، اضافه و مخفی کردن سطر، ستون و شیت
-شرح قالب بندي اطلاعات در اکسل
-مرتب سازي و فیلترینگ حرفه اي داده ها
-مفاهیم مقدماتی برای فرمول نویسی و استفاده از توابع:
-توضیح عملگر $ (آدرس دهی مطلق و نسبی)
-عملگرهای ریاضی منطقی و متنی
اصول استفاده از توابع:
-مفهوم تابع، سینتکس تابع، ورودی یا آرگومان های تابع، ورودی های الزامی یا اختیاری در توابع
-نحوه ی استفاده از پنجره ی Insert Function
-توابع ساده و پرکاربرد عمومی در اکسل:
-شرح مفصل توابع پرکاربرد شمارش، شمارش شرطی و جمع شرطی
Count,CountA,CountIF,CountIFs,SumIF,SumIFs
-فرمول نویسی شرطی و تصمیم گیري هاي منطقی در فرمول ها (IF,AND,OR,NOT )
-شرح توابع پرکاربرد از خانواده ی توابع LookUp & Reference شامل:
VLOOKUP,HLOOKUP, MATCH and INDEX
– شرح توابع ارزیابی و کنترل خطا در اکسل با استفاده از ifError ,isError
-نحوه نوشتن توابع تو در تو، شرط هاي تو در تو و توابع منطقی(Nested Ifs, Nested Functions)
-توابع تاریخ و زمان
-آشنایی با فرمول هاي آرایه اي و کاربردهاي آن (Array Functions)
-توابع مالی (مختص دانشجویان حسابداری و مالی)
شرح ابزارهای پرکاربرد اکسل:
-شرح نحوه افزودن انواع چارت و تنظیمات مربوط به آن
-شرح مفصل ابزار بسیار پرکاربرد Pivto Table
– ارزیابی و کنترل داده هاي ورودي کاربر(Data Validation)
-ابزار Spark Line
-ساخت Table در اکسل و تنظیمات مربوط به آن
-ابزار FlashFill
-ابزار Remove Duplicate
-ابزار Text to Column
-تنظیمات حرفه ای چاپ
-ضبط ماکرو
-کنترل های تب Developer
-فیلتر پیشرفته داده ها
-مرتب سازي پیشرفته و چند مرحله اي داده
-لیست های سفارشی
-مقدماتی از برنامه نویسی به زبان VBA (در صورت داشتن زمان)Mobile Application