داده کاوی با پایتون

data mining

اطلاعات بیشتر​

داده‌ کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه داده‌های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.

به مجموعه‌ای از روش‌های قابل اعمال بر پایگاه داده‌های بزرگ و پیچیده به منظور کشف الگوهای پنهان و جالب توجه نهفته در میان داده‌ها، داده‌کاوی گفته می‌شود.

روش‌های داده‌کاوی تقریبا همیشه به لحاظ محاسباتی پر هزینه هستند. علم میان‌رشته‌ای داده‌کاوی، پیرامون ابزارها، متدولوژی‌ها و تئوری‌هایی است که برای آشکارسازی الگوهای موجود در داده‌ها مورد استفاده قرار می‌گیرند و گامی اساسی در راستای کشف دانش محسوب می‌شود. دلایل گوناگونی پیرامون چرایی مبدل شدن داده‌کاوی به چنین حوزه مهمی از مطالعات وجود دارد. برخی از این موارد در ادامه بیان شده‌اند.


مزایای استفاده از داده‌کاوی:

  • بهبود دید مدیران و کمک به عرضه‌یابی درست
  • فراهم شدن امکان پیش بینی وقایع و درک بهتر آینده
  • افزایش کارایی سازمان
  • کمک به شناخت به موقع ترندها و فرصت ها
  • جلوگیری از تصمیم گیری‌های احساسی و کاهش ریسک تصمیمات
  • کاهش هزینه‌ها و جلوگیری از اتلاف منابع

سایر دوره‌های مرتبط شامل آموزش متن کاوی و دوره تحلیلگر داده هستند.

سرفصل‌های آموزشی​

    • طراحی مسائل و مجموعه داده‌هایی جهت شناخت داده، علم داده و کاربردهای آن در صنایع بیمه، بانک، بورس، طراحی نرم افزار با استفاده از علم داده، دیجیتال مارکتینگ هوشمند با داده کاوی، سیستم پیشنهاد دهنده وب سایت، متن کاوی در وب سایت و کاربردهای آن، تصویرکاوی و سیستم پیشنهاد موسیقی.
    • بررسی ویژگی‌های زبان پایتون و پاسخ به این سوال که چرا از پایتون استفاده میکنیم؟ بررسی امکانات و زیرساخت‌های زبان پایتون به همراه جزئیات پیاده سازی برخی از قسمت ها با زبان C
    • آشنایی عمومی با کتابخانه‌های موجود در زبان پایتون جهت انجام عملیات داده کاوی (Scikit Learn،Tensorflow ،Py Torch، Numpy، Pandas، Matplotlib و …)
    • آشنایی کلی با حوزه کلان داده (Big Data)، هوش نرم و چهارچوب‌های مورد استفاده آن به همراه کاربرد ارتباط با علم داده
    • آشنایی با ورژن‌های مختلف پایتون و نصب پایتون در لینوکس یا ویندوز همراه با نصب پکیج آناکوندا و آشنایی با پکیج‌های مهم
    • نصب و ایجاد محیط اولیه در Code Visual Studio و ایجاد یک برنامه پایتون
    • نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
    • داده و درک مفهوم ویژگی (Feature)، بعد (Dimension) و ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده کاوی
    • آشنایی و کار با کتابخانه ی Numpy و Scipy برای انجام عملیات آماری
    • آنالیز مولفه اصلی (PCA) و TSNE و کاربرد آن در نمایش داده‌ها و کاهش ابعاد
    • بارگذاری داده‌ها و تعامل با داده‌ها با استفاده از کتابخانه‌ی Pandas
    • آشنایی با نمودارهای مختلف (Pie، Histogram، Bar، Line، Flow و…) وکاربرد هریک از آن‌ها
    • نحوه‌ی نمایش هیستوگرام و کاربرد آن با کتابخانه‌ی Matplotlib
    • نمایش داده‌ها به صورت تعاملی در کتابخانه‌ی Boken
    • آشنایی با نمونه داده‌های طبقه بندی و کاربردهای آن
    • بررسی مجموعه داده‌های iris (تشخیص گل‌های زنبق از روی ویژگی‌ها)، MNIST (تشخیص تصاویر دست نوشته)، Boston Housing (قیمت گذاری هوشمند خانه) به عنوان نمونه‌های ساده و کاربردی
    • معرفی روش‌ها و مراجع جمع آوری داده‌ها و استفاده از آن
      • مثال پیش‌بینی هوشمند هزینه و تخمین ارزش کالا
      • مثال پیش‌بینی وضعیت هوا و هواشناسی
      • مثال کنترل ترافیک هوشمند با استفاده از داده‌های شهری
      • مثال تحلیل احساسات و استقبال/عدم استقبال کاربران از محصول یک فروشگاه با استفاده از کامنت‌های کاربران
      • مثال پیش‌بینی و توصیه محصول مورد نیاز کاربر در فروشگاه اینترنتی
      • مثال پیش‌بینی خرید کاربر با توجه به رفتار او در فروشگاه اینترنتی
      • مثال تشخیص هوشمند حملات هکرها به سرور
      • مثال پیش‌بینی هوشمند جرائم شهری و پیشگیری از وقوع جرم
      • مثال پیش‌بینی مصرف سوخت اتومبیل
    • آشنایی و پیاده سازی طبقه بندی با الگوریتم نزدیکترین همسایه (KNN) در پایتون
    • آشنایی و پیاده سازی طبقه بندی با الگوریتم ماشین بردار پشتیبان (SVM) و آشنایی با انواع مختلف پیاده سازی و پارامترهای آن در پایتون
    • بررسی درخت‌های تصمیم (Decision Trees) و پیاده سازی آن‌ها در حل مسائل طبقه بندی در پایتون
    • آشنایی و پیاده سازی طبقه بندی با الگوریتم‌های ترکیبی (RandomForest ،AdaBoost و…) در پایتون
    • آشنایی با الگوریتم‌های XGBoost و CatBoost و کتابخانه‌های XGBoost و CatBoost
    • آشنایی با معیارهای مختلف ارزیابی کیفیت طبقه بندی
      • Accuracy
      • Precision
      • Recall
      • F1
      • ROI AUC
      • و …
    • آشنایی با نمونه داده‌های خوشه بندی و حل مسائل کاربردی آن
    • کاربرد و آشنایی با روش‌های عملی خوشه بندی:
      • مثال گروه بندی مشتریان(وب سایت و فروشگاه) با روش RFM وRFM مبتنی بر زمان
      • مثال گروه بندی تصاویر دست نوشته
      • مثال گروه بندی هوشمند مطالب وب سایت بدون استفاده از ناظر
      • مثال گروه بندی حملات هکرها به یک سرور
    • آشنایی و پیاده سازی خوشه بندی با الگوریتم KMeans
    • بررسی و پیاده سازی خوشه بندی با DBSCAN
    • آشنایی با پیاده سازی DBSCAN سلسله مراتبی و کتابخانه‌ HDBSCAN
    • آشنایی و پیاده سازی خوشه بندی با الگوریتم MeanShift
    • آشنایی و پیاده سازی خوشه بندی با الگوریتم سلسله مراتبی(Hierarchical Clustering)
    • آشنایی و پیاده سازی خوشه بندی با الگوریتم خوشه بندی طیفی(Spectral Clustering)
    • آشنایی با روش‌های ارزیابی کیفیت خوشه‌ها
      • Silhouette ، کالینسکلی و …
    • الگوریتم های OverSampling ،SMOTE ، UnderSampling و… 

سوالات متداول​

این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار می‌شود.

پس از گذراندن دوره و در صورت کسب نمره قبولی در آزمون‌ها و پروژه‌ها به فراگیران گواهینامه ارائه می‌شود.

دوره هایی که هزینه آن ها بالای 4 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.

برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.

جهت آشنایی با نحوه ترجمه مدارک جهاد دانشگاهی صنعتی شریف به این لینک مراجعه کنید.

8 دیدگاه

  • درود
    دوره جدید احیانا کی شروع میشه

  • ساعات برگزاری این دوره کی هست؟

  • سلام و وقت به خیر.
    بنده فارغ التحصیل کارشناسی مدیریت و کارشناسی ارشد مدیریت فناوری اطلاعات گرایش منابع اطلاعاتی هستم. چه نرم افزاری مناسب با گرایش من و موقعیت بازار کار خوب پیشنهاد می فرمایید ممنون میشم.

    • سلام وقت بخیر
      شما بر اساس علاقه مندی در حوزه های متفاوتی میتونید فعالیت کنید. حوزه هایی مثل مهندسی داده و دانشمند داده میتونه براتون مناسب باشه حوزه های مرتبط با هوش تجاری هم میتونه مد نظرتون باشه.

  • سلام ، شهریه دوره را جایی ثبت نکرده اید تماس هم که کلا جواب نمیدین.

    • سلام. دوره دیتا ماینینگ در تقویم پاییز برگزار نمیشود به همین دلیل شهریه مشخص نشده است. تماس ها همیشه پاسخ داده میشوند و احتمالا در ساعت غیر کاری تماس گرفتید. از شنبه تا پنجشنبه ساعت 8 تا 4 میتوانید با شماره های قرار داده شده در هر صفحه تماس بگیرید.

مشاوره و ثبت‌نام: