علوم دادهمدیریت و مهندسی

داده های اکسل در پایتون

با روی کار آمدن پایتون از داده های اکسل در پایتون نیز می توان استفاده کرد. این روز ها می توان گفت که تقریباً تمام سازمان ها و شرکت ها از نرم افزار مایکروسافت اکسل به عنوان ابزاری همه منظوره، برای تجزیه و تحلیل داده ها و در مراحل پایه ای برای ثبت داده ها استفاده می کنند. جمع بندی و دسته بندی، مرتب سازی و فیلتر، استفاده از دستورها و توابع از کارهای پر اهمیت اکسل است. البته در اکسل میتوانیم ماکرو نویسی کنیم یا با خلاقیت فرمول های ترکیبی بنویسیم.

مهم نیست که داده های شرکت ها و سازمان ها متن یا صوت یا فیلم یا عکس باشد، داده ها ارزشمندترین دارایی برای یک سازمان یا شرکت به حساب می آیند. اما به دلیل اینکه بسیاری از سازمان ها و شرکت ها دیتا های خود را در اکسل نگهداری می کنند استفاده این نوع از دیتا اهمیت چندانی پیدا می کند. البته باید بپذیریم که داده علی رغم این که یکی از عناصر مهم و قدرتمند در هر سازمان است ولی متاسفانه به دلیل عدم وجود زیرساخت های لازم و یا مشکلاتی که به مرور زمان ایجاد و انباشته شده اند، مدیریت آن در جهت تبدیل به یک سرمایه استراتژیک بسیار ضعیف است .

بهترین حالت برای استفاده از دیتاها ذخیره سازی و مرتب سازی همه دیتاها در یک دیتابیس واحد است که معمولا از SQL استفاده می شود. اما برای تک دیتاها بد نیست که این نوع استفاده از دیتا مخصوصا داده‌های اکسل در پایتون را بلد باشیم. با شرکت در دوره SQL Server درک بهتری از این مفهوم پیدا خواهید کرد.



Pandas

خب لازم است اول pandas را نصب کنیم. برای این کار کافی است کد زیر را داخل cmd وارد کنیم:

pip install pandas

وقتی pandas را نصب کردیم باید فایلی از داده‌های اکسل داشته باشیم که آن را در پوشه کد قرار می‌دهیم.

چه کد هایی در پایتون باید بزنیم؟

وقتی فایل داده را آماده کردید کافی است طبق کد های زیر در jupyter notebook پیش بروید.

import pandas as pd
#تعریف کردن یک متغیر و قرار دادن فایل در آن(توجه داشته باشید اگر فرمت فایل چیزی دیگه ای بود باید به جای سی اس وی اسم اونو بنویسید)
file = pd.read_csv("cars.csv")
# چاپ کردن فایل(یک اطلاعات جزئی به ما میده)
print(file)
#پنج داده اول رو به ما نشون میده
print(file.head())
#پنج داده آخر رو به ما نشون میده
print(file.tail())
#می تونیم به این شکل تعداد ردیف موردنظر رو مشاهده کنیم و فقط کافیه به جای پنج یک عدد دیگه بزاریم
print(file[:5])
#ایندکس فایل رو به ما میده یعنی میگه چند داده داریم
print(file.index)

پیشنهاد مطالعه: داده پرت چیست؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا