دوره آموزشی Big Data
اطلاعات بیشتر
دادهها به عنوان یکی از عناصر اصلی در کسب و کارهای مدرن محسوب میشوند. کسب و کارها از این دادهها برای تصمیم گیریهای مهم استفاده میکنند. هرچه یک کسب و کار، دادههای بیشتری داشته باشد و بتواند این دادهها را با سرعت پردازش کند، قدرت بیشتری در تشخیص رفتار کاربر، پیشبینی آینده و محاسبه کسبوکار خواهد داشت.
کلان داده (Big Data) به مجموعهای از دادهها گفته میشود که حجم زیادی دارند و در عین حال حجم آنها با گذشت زمان به صورت تصاعدی بیشتر میشود. این دادهها بسیار حجیم و پیچیده هستند، به طوری که هیچ یک از ابزارهای سنتی مدیریت دادهها، امکان ذخیره یا پردازش آنها را به طور کارآمد ندارند.
مزایای big data:
نحوهی استخراج اطلاعات از دیتاهای خام و استفادهی بهینه از آنها در برنامهریزیهای آتی اهمیت زیادی دارد. استخراج دادهها و تجزیه و تحلیل آنها کمک بسیاری به کاهش هزینهها، صرفهجویی زمان، توسعه محصول جدید، تصمیمگیری هوشمندانه و .. میکند. از جمله مزایای big data میتوان به موارد زیر اشاره نمود:
- مدیریت ریسک
- بهبود تجربه مشتری
- افزایش بهرهوری و درآمد
- کاهش هزینههای سازمان
- تصمیمگیری بهتر و سریعتر
- کمپینهای متمرکز و هدفمند
- توسعه محصول و ایجاد نوآوری
- شبکههای تامینکننده گسترده
- تشخیص کلاهبرداری (Fraud Detection)
سایر دورههای مرتبط شامل دوره داده کاوی و آموزش متن کاوی هستند.
سرفصلهای آموزشی
- What is Big Data
- Big Data opportunities, Challenges
- Characteristics of Big Data
- Hadoop Distributed File System
- Comparing Hadoop & SQL
- Industries using Hadoop
- Data Locality
- Hadoop Architecture
- Map Reduce & HDFS
- HDFS Design & Concepts
- Blocks, Name nodes and Data nodes
- HDFS High-Availability and HDFS Federation
- Hadoop DFS The Command-Line Interface
- Basic File System Operations
- Anatomy of File Read, File Write
- Block Placement Policy and Modes
- Metadata, FS image, Edit log, Secondary Name Node and Safe Mode
- Map Reduce Functional Programming Basics
- Map and Reduce Basics
- How Map Reduce Works
- Anatomy of a Map Reduce Job Run
- Shuffling and Sorting
- Splits, Record reader, Partition, Types of partitions & Combiner
- Distributed Cache
- Sequential Files and Map Files
- Map side Join with distributed Cache
- Hands on “Word Count” in Map Reduce in standalone and Pseudo Distribution Mode
- Write some Map Reduce programs to solve some real world problems
- Architecture Overview
- ResourceManager
- YARN Scheduling Components
- FIFO Scheduler
- Capacity Scheduler
- Fair Scheduler
- NodeManager
- YARN Resource Model
- ApplicationMaster Container Allocation
- What is Hive?
- Architecture of Hive
- Installing Hive
- Configuring Hive
- HIVE Data Types
- Create Database Statement
- Drop Database Statement
- Create Table Statement
- Load Data Statement
- Alter Table Statement
- Rename to… Statement
- Change Statement
- Add Columns Statement
- Drop Table Statement
- Partitioning
- Views and Indexes
- Creating a View Example
- Creating an Index Example
- Creating MySQL Database Tables
- Setting the Environment
- Importing into HDFS
- Exporting from HDFS
- Importing into Hive
- Importing into HBase
سوالات متداول
این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار میشود.
دوره هایی که هزینه آن ها بالای 3 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.
برای شرکت در این دوره باید با تحلیل دیتا و برنامه نویسی پایتون آشنایی داشت.
- تاریخ شروع: 1403/08/24
- مدت دوره: 40 ساعت
- روزهای برگزاری: پنجشنبه و جمعه
- شهریه: 5,700,000 تومان
- نحوه برگزاری: آنلاین
- امکان پرداخت بصورت اقساط وجود دارد
2 دیدگاه
سلام دوره جدید تو پاییز دارید؟
سلام وقت بخیر. در حال حاضر دوره جدید بیگ دیتا برگزار نمیشود اما در دوره جامع علم داده به مباحث big data پرداخته میشود.