دوره آموزشی Big Data

big data

اطلاعات بیشتر​

داده‌ها به عنوان یکی از عناصر اصلی در کسب و کارهای مدرن محسوب می‌شوند. کسب و کارها از این داده‌ها برای تصمیم گیری‌های مهم استفاده می‌کنند. هرچه یک کسب و کار، داده‌های بیشتری داشته باشد و بتواند این داده‌ها را با سرعت پردازش کند، قدرت بیشتری در تشخیص رفتار کاربر، پیش‌بینی آینده و محاسبه کسب‌وکار خواهد داشت.

کلان داده‌ (Big Data) به مجموعه‌ای از داده‌ها گفته می‌شود که حجم زیادی دارند و در عین حال حجم آن‌ها با گذشت زمان به صورت تصاعدی بیش‌تر می‌شود. این داده‌ها بسیار حجیم و پیچیده هستند، به طوری که هیچ یک از ابزارهای سنتی مدیریت داده‌ها، امکان ذخیره یا پردازش آن‌ها را به طور کارآمد ندارند.

مزایای big data:

نحوه‌ی استخراج اطلاعات از دیتاهای خام و استفاده‌ی بهینه‌ از آنها در برنامه‌ریزی‌های آتی اهمیت زیادی دارد. استخراج داده‌ها و تجزیه و تحلیل آنها کمک بسیاری به کاهش هزینه‌ها، صرفه‌جویی زمان، توسعه محصول جدید، تصمیم‌گیری هوشمندانه و .. می‌کند. از جمله مزایای big data میتوان به موارد زیر اشاره نمود:  

  • مدیریت ریسک
  • بهبود تجربه مشتری
  • افزایش بهره‌وری و درآمد
  • کاهش هزینه‌های سازمان
  • تصمیم‌گیری بهتر و سریع‌تر
  • کمپین‌های متمرکز و هدفمند
  • توسعه محصول و ایجاد نوآوری
  • شبکه‌های تامین‌کننده گسترده
  • تشخیص کلاهبرداری (Fraud Detection)

big-data

سایر دوره‌های مرتبط شامل دوره داده کاوی  و آموزش متن کاوی هستند.

 

سرفصل‌های آموزشی​

  • What is Big Data
  • Big Data opportunities, Challenges
  • Characteristics of Big Data
  • Hadoop Distributed File System
  • Comparing Hadoop & SQL
  • Industries using Hadoop
  • Data Locality
  • Hadoop Architecture
  • Map Reduce & HDFS
  • HDFS Design & Concepts
  • Blocks, Name nodes and Data nodes
  • HDFS High-Availability and HDFS Federation
  • Hadoop DFS The Command-Line Interface
  • Basic File System Operations
  • Anatomy of File Read, File Write
  • Block Placement Policy and Modes
  • Metadata, FS image, Edit log, Secondary Name Node and Safe Mode
  • Map Reduce Functional Programming Basics
  • Map and Reduce Basics
  • How Map Reduce Works
  • Anatomy of a Map Reduce Job Run
  • Shuffling and Sorting
  • Splits, Record reader, Partition, Types of partitions & Combiner
  • Distributed Cache
  • Sequential Files and Map Files
  • Map side Join with distributed Cache
  • Hands on “Word Count” in Map Reduce in standalone and Pseudo Distribution Mode
  • Write some Map Reduce programs to solve some real world problems
  • Architecture Overview
  • ResourceManager
  • YARN Scheduling Components
  • FIFO Scheduler
  • Capacity Scheduler
  • Fair Scheduler
  • NodeManager
  • YARN Resource Model
  • ApplicationMaster Container Allocation
  • What is Hive?
  • Architecture of Hive
  • Installing Hive
  • Configuring Hive
  • HIVE Data Types
  • Create Database Statement
  • Drop Database Statement
  • Create Table Statement
  • Load Data Statement
  • Alter Table Statement
  • Rename to… Statement
  • Change Statement
  • Add Columns Statement
  • Drop Table Statement
  • Partitioning
  • Views and Indexes
  • Creating a View Example
  • Creating an Index Example
  • Creating MySQL Database Tables
  • Setting the Environment
  • Importing into HDFS
  • Exporting from HDFS
  • Importing into Hive
  • Importing into HBase

سوالات متداول​

این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار می‌شود.

پس از گذراندن دوره و در صورت کسب نمره قبولی در آزمون‌ها و پروژه‌ها به فراگیران گواهینامه ارائه می‌شود.

دوره هایی که هزینه آن ها بالای 3 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.

برای شرکت در این دوره باید با تحلیل دیتا و برنامه نویسی پایتون آشنایی داشت.

جهت آشنایی با نحوه ترجمه مدارک جهاد دانشگاهی صنعتی شریف به این لینک مراجعه کنید.

2 دیدگاه

مشاوره و ثبت‌نام: