Pandas Syllabus
2 اسفند 1403
ارسال شده توسط سمیرا خانی
28 بازدید

سیلابس Pandas – یک راهنمای جامع
۱. مقدمهای بر Pandas
- Pandas چیست؟
- نصب Pandas (
pip install pandas
) - وارد کردن Pandas
- آشنایی با
Series
وDataFrame
۲. ساختارهای داده در Pandas
- Series: ایجاد، اندیسگذاری، برش (Slicing)، عملیات
- DataFrame: ایجاد، اندیسگذاری، انتخاب دادهها (ردیفها و ستونها)
- ایجاد DataFrame از لیستها، دیکشنریها، آرایههای NumPy، فایلهای CSV و Excel
۳. عملیات ورودی و خروجی
- خواندن CSV (
pd.read_csv()
) - ذخیره CSV (
df.to_csv()
) - خواندن Excel (
pd.read_excel()
) - ذخیره Excel (
df.to_excel()
) - خواندن JSON (
pd.read_json()
) - ذخیره JSON (
df.to_json()
)
۴. انتخاب و فیلتر کردن دادهها
- انتخاب ردیفها و ستونها (
.loc[]
,.iloc[]
) - فیلتر کردن با شرطها
- استفاده از اندیسگذاری بولی (Boolean Indexing)
- استفاده از متد
query()
۵. پاکسازی داده و مدیریت مقادیر نامعتبر
- بررسی و مدیریت دادههای گمشده (
isna()
,dropna()
,fillna()
) - جایگزینی مقادیر (
replace()
) - حذف مقادیر تکراری (
drop_duplicates()
) - تغییر نوع دادهها (
astype()
) - مدیریت دادههای نامتناسـب
۶. تغییر و تبدیل دادهها
- تغییر نام ستونها (
rename()
) - تغییر اندیس (
set_index()
,reset_index()
) - مرتبسازی (
sort_values()
,sort_index()
) - اعمال توابع (
apply()
,map()
,applymap()
) - عملیات روی رشتهها (
str.contains()
,str.replace()
)
۷. گروهبندی و تجمیع دادهها
- گروهبندی دادهها (
groupby()
) - توابع تجمیعی (
sum()
,mean()
,count()
,agg()
) - جداول محوری (
pivot_table()
)
۸. ادغام، الحاق و ترکیب دادهها
- ترکیب DataFrameها با
concat()
- انجام عملیات
merge()
مشابهSQL
(ترکیب داخلی، خارجی، چپ و راست) - ترکیب دادهها با
join()
بر اساس ایندکس
۹. کار با دادههای سری زمانی
- مدیریت دادههای زمانی (
to_datetime()
) - تنظیم زمان به عنوان اندیس
- بازنمونهگیری (Resampling) دادههای سری زمانی
۱۰. مصورسازی دادهها با Pandas
- رسم نمودارهای پایه با
plot()
- نمودارهای خطی، میلهای، هیستوگرام، پراکندگی
- ادغام Pandas با Matplotlib و Seaborn
۱۱. ویژگیهای پیشرفته Pandas
- چند ایندکسی (Multi-indexing)
- توابع پنجرهای (
rolling()
,expanding()
) - کار با مجموعه دادههای بزرگ (
dask
,modin
)
۱۲. بهینهسازی عملکرد در Pandas
- مدیریت کارآمد دادههای حجیم
- استفاده از نوع داده
categorical
- مقایسه عملکرد عملیات برداری (Vectorized Operations) با حلقهها
۱۳. کاربردهای عملی و پروژهها
- تحلیل داده با Pandas
- وب اسکریپینگ و پاکسازی داده
- تحلیل دادههای مالی
- آمادهسازی داده برای یادگیری ماشین
دیدگاهتان را بنویسید