داده کاوی Microsoft Data mining 

data mining

اطلاعات بیشتر​

داده‌ کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه داده‌های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.

به مجموعه‌ای از روش‌های قابل اعمال بر پایگاه داده‌های بزرگ و پیچیده به منظور کشف الگوهای پنهان و جالب توجه نهفته در میان داده‌ها، داده‌کاوی گفته می‌شود.

روش‌های داده‌کاوی تقریبا همیشه به لحاظ محاسباتی پر هزینه هستند. علم میان‌رشته‌ای داده‌کاوی، پیرامون ابزارها، متدولوژی‌ها و تئوری‌هایی است که برای آشکارسازی الگوهای موجود در داده‌ها مورد استفاده قرار می‌گیرند و گامی اساسی در راستای کشف دانش محسوب می‌شود. دلایل گوناگونی پیرامون چرایی مبدل شدن داده‌کاوی به چنین حوزه مهمی از مطالعات وجود دارد. برخی از این موارد در ادامه بیان شده‌اند.


مزایای استفاده از داده‌کاوی:

  • بهبود دید مدیران و کمک به عرضه‌یابی درست
  • فراهم شدن امکان پیش بینی وقایع و درک بهتر آینده
  • افزایش کارایی سازمان
  • کمک به شناخت به موقع ترندها و فرصت ها
  • جلوگیری از تصمیم گیری‌های احساسی و کاهش ریسک تصمیمات
  • کاهش هزینه‌ها و جلوگیری از اتلاف منابع

 

سرفصل‌های آموزشی​

    • آشنایی با ورژن‌های مختلف پایتون و نصب پایتون در لینوکس یا ویندوز همراه با نصب پکیج آناکوندا و آشنایی با پکیج‌های مهم
    • نصب و ایجاد محیط اولیه در Eclipse و اجرای یک برنامه پایتون
    • نصب و ایجاد محیط اولیه در Visual Studio Code و ایجاد یک برنامه پایتون
    • نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
    • داده و درک مفهوم ویژگی (Feature)، بعد (Dimension) و ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده‌کاوی
    • آشنایی و کار با کتابخانه‌ی Numpy و Scipy برای انجام عملیات آماری
    •  آنالیز مولفه‌ اصلی (PCA) و TSNE و کاربرد آن در نمایش داده‌ها و کاهش ابعاد
    • بارگزاری داده‌ها و تعامل با داده‌ها با استفاده از کتابخانه‌ی Pandas
    •  آشنایی با نمودارهای مختلف (Pie، Histogram، Bar، Line، Flow و…) و کاربرد هر یک از آن‌ها
    •  نحوه‌ی نمایش هیستوگرام و کاربرد آن با کتابخانه‌ی Matplotlib
    •  نمایش داده‌ها به صورت تعاملی در کتابخانه‌ی Boken
    •  آشنایی با نمونه داده‌های طبقه‌بندی و کاربردهای آن
    • بررسی مجموعه داده‌های iris (تشخص گل‌های زنبق از روی ویژگی‌ها)، MNIST (تشخیص تصاویر دست‌نوشته)، Boston Housing (قیمت‌گذاری هوشمند خانه) به عنوان نمونه‌های ساده و کاربردی
    •  آشنایی و پیاده‌سازی طبقه‌بندی با الگوریتم نزدیک‌ترین همسایه (KNN) در پایتون
    •  آشنایی و پیاده‌سازی طبقه‌بندی با الگوریتم ماشین بردار پشتیبان (SVM) و آشنایی با انواع مختلف پیاده‌سازی و پارامترهای آن در پایتون
    •  آشنایی و پیاده‌سازی طبقه‌بندی با الگوریتم بیز ساده (Naive Bayes) و انواع مختلف آن با توجه به توزیع آماری داده‌ها
    •  بررسی درخت‌های تصمیم (Decision Trees) و پیاده‌سازی آن‌ها در حل مسائل طبقه‌بندی در پایتون
    •  آشنایی و پیاده‌سازی طبقه‌بندی با الگوریتم‌های ترکیبی (RandomForest، AdaBoost و…) در پایتون
    •  آشنایی با الگوریتم‌های XGBoost و CatBoost و کتابخانه‌های XGBoost و CatBoost
    •  آشنایی با معیارهای مختلف ارزیابی کیفیت طبقه‌بندی

سوالات متداول​

این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار می‌شود.

پس از گذراندن دوره و در صورت کسب نمره قبولی در آزمون‌ها و پروژه‌ها به فراگیران گواهینامه ارائه می‌شود.

دوره هایی که هزینه آن ها بالای 3 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.

برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.

جهت آشنایی با نحوه ترجمه مدارک جهاد دانشگاهی صنعتی شریف به این لینک مراجعه کنید.

guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

مشاوره و ثبت‌نام: