داده کاوی با پایتون
اطلاعات بیشتر
داده کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه دادههای خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.
به مجموعهای از روشهای قابل اعمال بر پایگاه دادههای بزرگ و پیچیده به منظور کشف الگوهای پنهان و جالب توجه نهفته در میان دادهها، دادهکاوی گفته میشود.
روشهای دادهکاوی تقریبا همیشه به لحاظ محاسباتی پر هزینه هستند. علم میانرشتهای دادهکاوی، پیرامون ابزارها، متدولوژیها و تئوریهایی است که برای آشکارسازی الگوهای موجود در دادهها مورد استفاده قرار میگیرند و گامی اساسی در راستای کشف دانش محسوب میشود. دلایل گوناگونی پیرامون چرایی مبدل شدن دادهکاوی به چنین حوزه مهمی از مطالعات وجود دارد. برخی از این موارد در ادامه بیان شدهاند.
مزایای استفاده از دادهکاوی:
- بهبود دید مدیران و کمک به عرضهیابی درست
- فراهم شدن امکان پیش بینی وقایع و درک بهتر آینده
- افزایش کارایی سازمان
- کمک به شناخت به موقع ترندها و فرصت ها
- جلوگیری از تصمیم گیریهای احساسی و کاهش ریسک تصمیمات
- کاهش هزینهها و جلوگیری از اتلاف منابع
سایر دورههای مرتبط شامل آموزش متن کاوی و دوره تحلیلگر داده هستند.
سرفصلهای آموزشی
-
- طراحی مسائل و مجموعه دادههایی جهت شناخت داده، علم داده و کاربردهای آن در صنایع بیمه، بانک، بورس، طراحی نرم افزار با استفاده از علم داده، دیجیتال مارکتینگ هوشمند با داده کاوی، سیستم پیشنهاد دهنده وب سایت، متن کاوی در وب سایت و کاربردهای آن، تصویرکاوی و سیستم پیشنهاد موسیقی.
- بررسی ویژگیهای زبان پایتون و پاسخ به این سوال که چرا از پایتون استفاده میکنیم؟ بررسی امکانات و زیرساختهای زبان پایتون به همراه جزئیات پیاده سازی برخی از قسمت ها با زبان C
- آشنایی عمومی با کتابخانههای موجود در زبان پایتون جهت انجام عملیات داده کاوی (Scikit Learn،Tensorflow ،Py Torch، Numpy، Pandas، Matplotlib و …)
- آشنایی کلی با حوزه کلان داده (Big Data)، هوش نرم و چهارچوبهای مورد استفاده آن به همراه کاربرد ارتباط با علم داده
-
- آشنایی با ورژنهای مختلف پایتون و نصب پایتون در لینوکس یا ویندوز همراه با نصب پکیج آناکوندا و آشنایی با پکیجهای مهم
- نصب و ایجاد محیط اولیه در Code Visual Studio و ایجاد یک برنامه پایتون
- نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
-
- داده و درک مفهوم ویژگی (Feature)، بعد (Dimension) و ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده کاوی
- آشنایی و کار با کتابخانه ی Numpy و Scipy برای انجام عملیات آماری
- آنالیز مولفه اصلی (PCA) و TSNE و کاربرد آن در نمایش دادهها و کاهش ابعاد
- بارگذاری دادهها و تعامل با دادهها با استفاده از کتابخانهی Pandas
-
- آشنایی با نمودارهای مختلف (Pie، Histogram، Bar، Line، Flow و…) وکاربرد هریک از آنها
- نحوهی نمایش هیستوگرام و کاربرد آن با کتابخانهی Matplotlib
- نمایش دادهها به صورت تعاملی در کتابخانهی Boken
-
- آشنایی با نمونه دادههای طبقه بندی و کاربردهای آن
- بررسی مجموعه دادههای iris (تشخیص گلهای زنبق از روی ویژگیها)، MNIST (تشخیص تصاویر دست نوشته)، Boston Housing (قیمت گذاری هوشمند خانه) به عنوان نمونههای ساده و کاربردی
- معرفی روشها و مراجع جمع آوری دادهها و استفاده از آن
- مثال پیشبینی هوشمند هزینه و تخمین ارزش کالا
- مثال پیشبینی وضعیت هوا و هواشناسی
- مثال کنترل ترافیک هوشمند با استفاده از دادههای شهری
- مثال تحلیل احساسات و استقبال/عدم استقبال کاربران از محصول یک فروشگاه با استفاده از کامنتهای کاربران
- مثال پیشبینی و توصیه محصول مورد نیاز کاربر در فروشگاه اینترنتی
- مثال پیشبینی خرید کاربر با توجه به رفتار او در فروشگاه اینترنتی
- مثال تشخیص هوشمند حملات هکرها به سرور
- مثال پیشبینی هوشمند جرائم شهری و پیشگیری از وقوع جرم
- مثال پیشبینی مصرف سوخت اتومبیل
- آشنایی و پیاده سازی طبقه بندی با الگوریتم نزدیکترین همسایه (KNN) در پایتون
- آشنایی و پیاده سازی طبقه بندی با الگوریتم ماشین بردار پشتیبان (SVM) و آشنایی با انواع مختلف پیاده سازی و پارامترهای آن در پایتون
- بررسی درختهای تصمیم (Decision Trees) و پیاده سازی آنها در حل مسائل طبقه بندی در پایتون
- آشنایی و پیاده سازی طبقه بندی با الگوریتمهای ترکیبی (RandomForest ،AdaBoost و…) در پایتون
- آشنایی با الگوریتمهای XGBoost و CatBoost و کتابخانههای XGBoost و CatBoost
- آشنایی با معیارهای مختلف ارزیابی کیفیت طبقه بندی
- Accuracy
- Precision
- Recall
- F1
- ROI AUC
- و …
-
- آشنایی با نمونه دادههای خوشه بندی و حل مسائل کاربردی آن
- کاربرد و آشنایی با روشهای عملی خوشه بندی:
- مثال گروه بندی مشتریان(وب سایت و فروشگاه) با روش RFM وRFM مبتنی بر زمان
- مثال گروه بندی تصاویر دست نوشته
- مثال گروه بندی هوشمند مطالب وب سایت بدون استفاده از ناظر
- مثال گروه بندی حملات هکرها به یک سرور
- آشنایی و پیاده سازی خوشه بندی با الگوریتم KMeans
- بررسی و پیاده سازی خوشه بندی با DBSCAN
- آشنایی با پیاده سازی DBSCAN سلسله مراتبی و کتابخانه HDBSCAN
- آشنایی و پیاده سازی خوشه بندی با الگوریتم MeanShift
- آشنایی و پیاده سازی خوشه بندی با الگوریتم سلسله مراتبی(Hierarchical Clustering)
- آشنایی و پیاده سازی خوشه بندی با الگوریتم خوشه بندی طیفی(Spectral Clustering)
- آشنایی با روشهای ارزیابی کیفیت خوشهها
- Silhouette ، کالینسکلی و …
-
- الگوریتم های OverSampling ،SMOTE ، UnderSampling و…
-
- PCA، UMAP،TSNE، KernelPCA
سوالات متداول
این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار میشود.
دوره هایی که هزینه آن ها بالای 4 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.
برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.
- تاریخ شروع: 1403/09/29
- مدت دوره: 52 ساعت
- روزهای برگزاری: پنجشنبه و جمعه
- شهریه:5,700,000 تومان
- نحوه برگزاری: آنلاین
8 دیدگاه
درود
دوره جدید احیانا کی شروع میشه
سلام. از 9 آذر دوره جدید داده کاوی با پایتون شروع میشود.
ساعات برگزاری این دوره کی هست؟
سلام. روزهای پنجشنبه و جمعه ساعت 16 تا 20
سلام و وقت به خیر.
بنده فارغ التحصیل کارشناسی مدیریت و کارشناسی ارشد مدیریت فناوری اطلاعات گرایش منابع اطلاعاتی هستم. چه نرم افزاری مناسب با گرایش من و موقعیت بازار کار خوب پیشنهاد می فرمایید ممنون میشم.
سلام وقت بخیر
شما بر اساس علاقه مندی در حوزه های متفاوتی میتونید فعالیت کنید. حوزه هایی مثل مهندسی داده و دانشمند داده میتونه براتون مناسب باشه حوزه های مرتبط با هوش تجاری هم میتونه مد نظرتون باشه.
سلام ، شهریه دوره را جایی ثبت نکرده اید تماس هم که کلا جواب نمیدین.
سلام. دوره دیتا ماینینگ در تقویم پاییز برگزار نمیشود به همین دلیل شهریه مشخص نشده است. تماس ها همیشه پاسخ داده میشوند و احتمالا در ساعت غیر کاری تماس گرفتید. از شنبه تا پنجشنبه ساعت 8 تا 4 میتوانید با شماره های قرار داده شده در هر صفحه تماس بگیرید.