متن کاوی با پایتون
اطلاعات بیشتر
امروزه علوم داده به یکی از جذابترین و پرطرفدارین تخصصها و مشاغل در ایران و دنیا تبدیل شده است. اما برای تبدیل شدن به یک متخصص علوم داده، تسلط بر مفاهیم و تکنیکهای داده کاویهای معمول و شناخته شده یا همان کاوش دیتای ساختار یافته (Structured Data) کافی نیست و تسلط به تحلیل دادههای بدون ساختار (Unstructured Data) امری ضروری محسوب میشود. پردازش و کاوش متون و زبانهای طبیعی نیز یک جزء ازدادههای ساختار نیافته میباشد.
متن کاوی یا Text Mining به فرآیند داده کاوی Data Mining در متون و زبانهای طبیعی گفته میشود. در واقع فرایند متن کاوی با طبقهبندی متون Classification، خوشهبندی متون (Document Clustering – Text Clustering)، استخراج معنا و مفاهیم از جملات، تولید ردهبندی دانهای، آنالیز احساسات، خلاصهسازی اسناد و در مراحل پیچیدهتر مدلسازی رابطه میان موجودیتها یک گزارش کمی یا در برخی از موارد یک گزارش کیفی از اطلاعات ارائه میدهد. متن کاوی با پایتون Python یکی از روشهای رایج برای استخراج دادهها از متون مختلف میباشد. پایتون با داشتن کتابخانههایی مثل (pandas-numpy-Matplotlib-scikit learn-tensorflow-nltk-keras) و قابلیتهایی که برای پردازش متن ارائه میکند یکی از محبوبترین و کاربردیترین زبانهای برنامهنویسی برای متن کاوی محسوب میشود.
از کاربردهای آموزش متن کاوی «Text Mining» و پردازش زبان طبیعی میتوان به موارد زیر اشاره کرد:
- از انواع منابع متن (کتاب، روزنامه، فایل pdf، فایل word، صفحات وب و …) اطلاعات کلیدی و مهم استخراج کرد.
- نظرات، کامنتها و گفتههای افراد را تحلیل کرد.
- طبقهبندی گزارشات و اسناد
- خوشهبندی گزارشات و اسناد
- از دل منبع اطلاعات متنی، ابر واژگان ساخت.
- یک سیستم ترجمه (برای تمام زبانهای دنیا) ساخت.
- صوت را به متن تبدیل کرد.
- متن را به یک فایل صوتی (با فرمت mp3) تبدیل کرد.
- تبدیل متن به ویژگی (برای خوشهبندی و طبقهبندی متن مورد استفاده قرار میگیرد.)
دوره آموزش متن کاوی برای چه کسانی مناسب است؟
کارشناسان و فارغ التحصیلان آمار، علوم کامپیوتر، نرم افزار و فناوری اطلاعات و افرادی که به دنبال آموزشهای کاربردی و ارتقاء مهارتهای خود هستند، میتوانند در این دوره شرکت نمایند. سایر دورههای دیگری در گروه آموزشی علوم داده از جمله دووره داده کاوری و دوره علم داده نیز برگزار میشود.
سرفصلهای آموزشی
- مقدمهای بر متن کاوی text mining
- آشنایی با کتابخانه nltk
- پیشپردازش متن
- مقدمهای بر عبارات منظم
- ساخت بردار ویژگیها با استفاده از کلمات
- ردهبندی و خوشهبندی متنها
- تحلیل احساسات
- متنکاوی فارسی
- تعبیهسازی کلمات و کاربرد یادگیری عمیق( deep learning) در متن کاوی
سوالات متداول
این دوره بصورت آنلاین و در بستر ادوبی کانکت Adobe connect برگزار میشود.
دوره هایی که هزینه آن ها بالای 3 میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.
برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.
- تاریخ شروع: اعلام میگردد
- مدت دوره: 18 ساعت
- روزهای برگزاری: اعلام میگردد
- شهریه: اعلام میگردد
- نحوه برگزاری: آنلاین
2 دیدگاه
سلام تاریخ حدودی برگزاری لطف میکنید؟
سلام. درحال حاضر برنامه ای برای شروع این دوره وجود ندارد. درصورت برگزاری، از طریق همین صفحه تاریخ برگزاری مشخص خواهد شد.