Pandas Syllabus
2 اسفند 1403
ارسال شده توسط سمیرا خانی
75 بازدید
سیلابس Pandas – یک راهنمای جامع
۱. مقدمهای بر Pandas
- Pandas چیست؟
- نصب Pandas (
pip install pandas) - وارد کردن Pandas
- آشنایی با
SeriesوDataFrame
۲. ساختارهای داده در Pandas
- Series: ایجاد، اندیسگذاری، برش (Slicing)، عملیات
- DataFrame: ایجاد، اندیسگذاری، انتخاب دادهها (ردیفها و ستونها)
- ایجاد DataFrame از لیستها، دیکشنریها، آرایههای NumPy، فایلهای CSV و Excel
۳. عملیات ورودی و خروجی
- خواندن CSV (
pd.read_csv()) - ذخیره CSV (
df.to_csv()) - خواندن Excel (
pd.read_excel()) - ذخیره Excel (
df.to_excel()) - خواندن JSON (
pd.read_json()) - ذخیره JSON (
df.to_json())
۴. انتخاب و فیلتر کردن دادهها
- انتخاب ردیفها و ستونها (
.loc[],.iloc[]) - فیلتر کردن با شرطها
- استفاده از اندیسگذاری بولی (Boolean Indexing)
- استفاده از متد
query()
۵. پاکسازی داده و مدیریت مقادیر نامعتبر
- بررسی و مدیریت دادههای گمشده (
isna(),dropna(),fillna()) - جایگزینی مقادیر (
replace()) - حذف مقادیر تکراری (
drop_duplicates()) - تغییر نوع دادهها (
astype()) - مدیریت دادههای نامتناسـب
۶. تغییر و تبدیل دادهها
- تغییر نام ستونها (
rename()) - تغییر اندیس (
set_index(),reset_index()) - مرتبسازی (
sort_values(),sort_index()) - اعمال توابع (
apply(),map(),applymap()) - عملیات روی رشتهها (
str.contains(),str.replace())
۷. گروهبندی و تجمیع دادهها
- گروهبندی دادهها (
groupby()) - توابع تجمیعی (
sum(),mean(),count(),agg()) - جداول محوری (
pivot_table())
۸. ادغام، الحاق و ترکیب دادهها
- ترکیب DataFrameها با
concat() - انجام عملیات
merge()مشابهSQL(ترکیب داخلی، خارجی، چپ و راست) - ترکیب دادهها با
join()بر اساس ایندکس
۹. کار با دادههای سری زمانی
- مدیریت دادههای زمانی (
to_datetime()) - تنظیم زمان به عنوان اندیس
- بازنمونهگیری (Resampling) دادههای سری زمانی
۱۰. مصورسازی دادهها با Pandas
- رسم نمودارهای پایه با
plot() - نمودارهای خطی، میلهای، هیستوگرام، پراکندگی
- ادغام Pandas با Matplotlib و Seaborn
۱۱. ویژگیهای پیشرفته Pandas
- چند ایندکسی (Multi-indexing)
- توابع پنجرهای (
rolling(),expanding()) - کار با مجموعه دادههای بزرگ (
dask,modin)
۱۲. بهینهسازی عملکرد در Pandas
- مدیریت کارآمد دادههای حجیم
- استفاده از نوع داده
categorical - مقایسه عملکرد عملیات برداری (Vectorized Operations) با حلقهها
۱۳. کاربردهای عملی و پروژهها
- تحلیل داده با Pandas
- وب اسکریپینگ و پاکسازی داده
- تحلیل دادههای مالی
- آمادهسازی داده برای یادگیری ماشین
دیدگاهتان را بنویسید