توضیحات
کتاب راهنمای کتابخانه Pandas در پایتون یک منبع جامع برای یادگیری کتابخانه پانداس در زبان برنامهنویسی پایتون است. این کتاب به تفصیل به مفاهیم پایهای، ساختارهای داده، و عملیات مختلفی که میتوان با دادهها انجام داد، میپردازد. پانداس ابزاری قدرتمند است که بر اساس نام پای(NumPy) ساخته شده و به تحلیل و پردازش دادهها کمک میکند.
خلاصه کتاب راهنمای کتابخانه Pandas در پایتون
کتاب با مقدمهای بر اهمیت پردازش دادهها آغاز میشود و توضیح میدهد که دادهها معمولاً در فرمتهای مناسب برای تحلیل موجود نیستند و نیاز به پردازش دارند. در فصل اول، دو ساختار اصلی داده در پانداس یعنی Series و DataFrame معرفی میشوند. Series یک آرایه یک بعدی است که میتواند انواع مختلف دادهها را ذخیره کند، در حالی که DataFrame یک ساختار دو بعدی است که شبیه به جدولهای پایگاه داده یا صفحات گسترده عمل میکند.
فصل دوم به بررسی عملیات مختلفی که میتوان بر روی دادهها انجام داد، اختصاص دارد. این فصل شامل خواندن فایلها، انتخاب ردیفها و ستونها، فیلتر کردن دادهها، و مرتبسازی آنها است. همچنین، نحوه کار با مقادیر گمشده (Null values) و انجام عملیات روی رشتهها نیز توضیح داده میشود.
فصلهای بعدی کتاب راهنمای کتابخانه Pandas به بررسی تکنیکهای پیشرفتهتر مانند گروهبندی دادهها (Groupby)، ادغام (Merge) و مدیریت ایندکسها میپردازند. در این فصول، روشهای مختلفی برای ترکیب و پردازش دادهها به صورت کارآمد معرفی میشوند.
کتاب همچنین به پردازش دادههای زمانسری (Time Series) میپردازد و توضیح میدهد که چگونه میتوان با تاریخها و زمانها کار کرد. این بخش شامل تولید سریهای زمانی، تبدیل رشتهها به تاریخ و انجام عملیات مختلف بر روی دادههای زمانی است.
در انتهای کتاب راهنمای کتابخانه Pandas، مثالهای واقعی از خواندن و تحلیل دادهها از چندین فایل ارائه میشود که نشان میدهد چگونه میتوان از پانداس برای تحلیل دادههای واقعی استفاده کرد. این بخشها شامل تجزیه و تحلیل روند نامهای نوزادان و استفاده از توابع تجمیع و Pivot Table است.
فهرست مطالب کتاب
1. مبانی Pandas
1.1 مقدمه
1.2 ساختارهای داده
– 1.2.1 سری (Series)
– 1.2.2 دیتافریم (DataFrame)
2. بررسی کلی
2.1 خواندن فایلها
2.2 عملیات داده
– 2.2.1 انتخاب ردیف و ستون
– 2.2.2 فیلتر کردن دادهها
– 2.2.3 مرتبسازی
– 2.2.4 مقادیر گمشده
– 2.2.5 عملیات بر روی رشتهها
– 2.2.6 شمارش مقادیر
– 2.2.7 نمودارها
2.3 گروهبندی (Groupby)
– 2.3.1 گروهبندی با نام ستونها
– 2.3.2 گروهبندی با فیلدهای سفارشی
2.4 Unstack
2.5 ادغام (Merge)
– 2.5.1 ادغام با فایلهای مختلف
– 2.5.2 ادغام جدول با خودش
2.6 ایندکس
– 2.6.1 ایجاد ایندکس
– 2.6.2 ایندکسهای چندگانه
– 2.6.3 بازنشانی ایندکس
2.7 پیادهسازی با استفاده از کتابخانه Python-CSV
3. نام پای (NumPy)
3.1 ایجاد آرایهها
3.2 ایندکسگذاری بولی
3.3 تغییر شکل آرایهها
3.4 ادغام دادهها
4. پردازش داده
4.1 ایندکسگذاری سلسلهمراتبی
4.2 عملیات فایل
– 4.2.1 خواندن فایلها
– 4.2.2 نوشتن دادهها به فایل
4.3 ادغام
– 4.3.1 بسیاری به یک
– 4.3.2 اتصال داخلی و خارجی
– 4.3.3 ادغام دادهها
4.4 تبدیل داده
– 4.4.1 حذف تکراریها
– 4.4.2 جایگزینی مقادیر
4.5 گروهبندی و تجمیع داده
5. سری زمانی
5.1 تاریخها و زمانها
5.2 کاربردها
6. خواندن چندین فایل
کتاب راهنمای کتابخانه Pandas منبعی ارزشمند برای برنامهنویسان و تحلیلگران داده است که میخواهند با استفاده از این کتابخانه به پردازش و تحلیل دادههای خود بپردازند. بهتر است پیش از کار با پانداز، با کتابخانه Numpy هم آشنا شوید. برای آشنایی با این کتابخانه، می توانید کتاب 100 مثال برای تسلط بر Numpy در پایتون را به رایگان از وبسایت ویتایک دریافت کنید.
نظرات
هیچ دیدگاهی نوشته نشده است.