متن کاوی با پایتون

text mining

اطلاعات بیشتر​

امروزه علوم داده به یکی از جذاب‌ترین و پرطرفدارین تخصص‌ها و مشاغل در ایران و دنیا تبدیل شده است. اما برای تبدیل شدن به یک متخصص علوم داده، تسلط بر مفاهیم و تکنیک‌های داده کاوی‌های معمول و شناخته شده یا همان کاوش دیتای ساختار یافته (Structured Data) کافی نیست و تسلط به تحلیل داده‌های بدون ساختار (Unstructured Data) امری ضروری محسوب می‌شود. پردازش و کاوش متون و زبان‌های طبیعی نیز یک جزء ازداده‌های ساختار نیافته می‌باشد.

متن کاوی یا Text Mining به فرآیند داده کاوی Data Mining در متون و زبان‌های طبیعی گفته می‌شود. در واقع فرایند متن کاوی با طبقه‌بندی متون Classification، خوشه‌بندی متون (Document Clustering – Text Clustering)، استخراج معنا و مفاهیم از جملات، تولید رده‌بندی دانه‌ای، آنالیز احساسات، خلاصه‌سازی اسناد و در مراحل پیچیده‌تر مدلسازی رابطه میان موجودیت‌ها یک گزارش کمی یا در برخی از موارد یک گزارش کیفی از اطلاعات ارائه می‌دهد. متن کاوی با پایتون Python یکی از روش‌های رایج برای استخراج داده‌ها از متون مختلف می‌باشد. پایتون با داشتن کتابخانه‌هایی مثل (pandas-numpy-Matplotlib-scikit learn-tensorflow-nltk-keras) و قابلیت‌هایی که برای پردازش متن ارائه می‌کند یکی از محبوب‌ترین و کاربردی‌ترین زبان‌های برنامه‌نویسی برای متن کاوی محسوب می‌شود.

از کاربردهای آموزش متن کاوی «Text Mining» و پردازش زبان طبیعی می‌توان به موارد زیر اشاره کرد: 

  • از انواع منابع متن (کتاب، روزنامه، فایل pdf، فایل word، صفحات وب و …) اطلاعات کلیدی و مهم استخراج کرد. 
  • نظرات، کامنت‌ها و گفته‌های افراد را تحلیل کرد. 
  • طبقه‌بندی گزارشات و اسناد
  • خوشه‌بندی گزارشات و اسناد
  • از دل منبع اطلاعات متنی، ابر واژگان ساخت. 
  • یک سیستم ترجمه (برای تمام زبان‌های دنیا) ساخت. 
  • صوت را به متن تبدیل کرد. 
  • متن را به یک فایل صوتی (با فرمت mp3) تبدیل کرد. 
  • تبدیل متن به ویژگی (برای خوشه‌بندی و طبقه‌بندی متن مورد استفاده قرار می‌گیرد.) 

دوره آموزش متن کاوی برای چه کسانی مناسب است؟

کارشناسان و فارغ التحصیلان آمار، علوم کامپیوتر، نرم افزار و فناوری اطلاعات و افرادی که به دنبال آموزش‌های کاربردی و ارتقاء مهارت‌های خود هستند، می‌توانند در این دوره شرکت نمایند. سایر دوره‌های دیگری در گروه آموزشی علوم داده از جمله دووره داده کاوری و دوره علم داده نیز برگزار می‌شود.

سرفصل‌های آموزشی​

سوالات متداول​

این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار می‌شود.

پس از گذراندن دوره و در صورت کسب نمره قبولی در آزمون‌ها و پروژه‌ها به فراگیران گواهینامه ارائه می‌شود.

دوره هایی که هزینه آن ها بالای 3 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.

برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.

جهت آشنایی با نحوه ترجمه مدارک جهاد دانشگاهی صنعتی شریف به این لینک مراجعه کنید.

2 دیدگاه

  • مهرداد یادگاری

    سلام تاریخ حدودی برگزاری لطف میکنید؟

    • سلام. درحال حاضر برنامه ای برای شروع این دوره وجود ندارد. درصورت برگزاری، از طریق همین صفحه تاریخ برگزاری مشخص خواهد شد.

مشاوره و ثبت‌نام: