وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

محاسبه میانگین در چند فریم داده در پانداها

0 58
زمان لازم برای مطالعه: 3 دقیقه


معرفی

کتابخانه Pandas توابع فراوانی را ارائه می‌کند که دستکاری و تجزیه و تحلیل داده‌ها را بسیار ساده (یا حداقل ساده) می‌کند.er). یکی از این تابع ها است mean() تابع، که به شما امکان می دهد میانگین مقادیر یک DataFrame را محاسبه کنید. اما اگر با چندین DataFrame کار می کنید چه؟ در این بایت، نحوه محاسبه میانگین در چندین DataFrame را بررسی خواهیم کرد.

چرا میانگین را در چند فریم داده محاسبه کنیم؟

سناریوهای متعددی وجود دارد که ممکن است چندین DataFrame داشته باشید و باید میانگین همه آنها را محاسبه کنید. به عنوان مثال، ممکن است به دلیل اندازه داده ها، منابع مختلف داده، داده ها در چندین DataFrame پخش شده باشد، یا شاید داده ها به سادگی برای دستکاری یا ذخیره سازی آسان تر در فایل ها تقسیم بندی شوند. در این موارد، محاسبه میانگین در تمام این DataFrame ها می تواند یک نمای کلی از داده ها ارائه دهد و می تواند برای تجزیه و تحلیل های آماری خاص مفید باشد.

محاسبه میانگین در یک DataFrame واحد

قبل از اینکه به محاسبه میانگین در چندین DataFrame بپردازیم، ابتدا نحوه محاسبه میانگین در یک DataFrame را درک می کنیم. در اینجا این است که چگونه این کار را انجام می دهیم:

import pandas as pd


df = pd.DataFrame({
   'A': (1, 2, 3, 4, 5),
   'B': (2, 3, 4, 5, 6),
   'C': (3, 4, 5, 6, 7)
})


mean = df.mean()

print(mean)

وقتی این کد را اجرا می کنید، خروجی زیر را دریافت خواهید کرد:

A    3.0
B    4.0
C    5.0
dtype: float64

در این مثال ساده، mean() تابع میانگین هر ستون در DataFrame را محاسبه می کند.

پیشنهاد می‌کنیم بخوانید:  Python - روش مرتب سازی لیست با sort() و sorted()

گسترش به چند دیتا فریم

اکنون که می دانیم چگونه میانگین را در یک DataFrame واحد محاسبه کنیم، اجازه دهید این را به چندین DataFrame تعمیم دهیم. برای انجام این کار، اگر DataFrames را به هم متصل کنیم و سپس میانگین را محاسبه کنیم، ساده‌ترین کار خواهد بود. این را می توان با استفاده از concat() روش.


df1 = pd.DataFrame({
   'A': (6, 7, 8, 9, 10),
   'B': (7, 8, 9, 10, 11),
   'C': (8, 9, 10, 11, 12)
})

df2 = pd.DataFrame({
   'A': (11, 12, 13, 14, 15),
   'B': (12, 13, 14, 15, 16),
   'C': (13, 14, 15, 16, 17)
})


df_concat = pd.concat((df, df1, df2))


mean_concat = df_concat.mean()

print(mean_concat)

خروجی خواهد بود:

A     8.0
B     9.0
C    10.0
dtype: float64

ابتدا سه DataFrame را با استفاده از یکدیگر به هم متصل می کنیم pd.concat(). سپس میانگین DataFrame به هم پیوسته جدید را با استفاده از mean() تابع.

توجه داشته باشید: را pd.concat() تابع به طور پیش فرض در امتداد محور عمودی به هم متصل می شود. اگر DataFrames شما ستون‌های یکسانی دارد، معمولاً این همان چیزی است که می‌خواهید.

با این حال، اگر DataFrames شما دارای ستون‌های متفاوتی است، ممکن است بخواهید در امتداد آن‌ها به هم بپیوندید افقی محور. می توانید این کار را با تنظیم کردن انجام دهید axis پارامتر به 1: pd.concat((df1, df2), axis=1). اگر ستون‌های متفاوتی داشته باشند و شما فقط می‌خواهید آنها را در یک DataFrame مشترک قرار دهید تا تجزیه و تحلیل روی آن انجام شود، مفید خواهد بود، مانند mean() روش.

موارد استفاده

محاسبه میانگین در چندین DataFrame در پانداها می تواند در سناریوهای مختلف کمک کند. بیایید چند مورد استفاده ممکن را ببینیم.

پیشنهاد می‌کنیم بخوانید:  ایجاد دایرکتوری و دایرکتوری های والد آن در پایتون

یکی از رایج‌ترین سناریوها زمانی است که با مجموعه داده‌های بزرگی سروکار دارید که برای مدیریت آسان‌تر به چند DataFrame تقسیم شده‌اند. در چنین مواردی، محاسبه میانگین در میان این DataFrame ها می تواند درک جامع تری از داده های خود به شما بدهد.

موردی را در نظر بگیرید که یک تحلیلگر داده با داده های فروش یک شرکت چند ملیتی کار می کند. داده ها بر اساس منطقه تقسیم می شوند که هر کدام با یک DataFrame جداگانه نمایش داده می شوند. برای به دست آوردن یک دیدگاه جهانی در مورد میانگین فروش، تحلیلگر باید میانگین را در تمام این DataFrames محاسبه کند.

import pandas as pd


df1 = pd.DataFrame({'sales': (100, 200, 300)})
df2 = pd.DataFrame({'sales': (400, 500, 600)})
df3 = pd.DataFrame({'sales': (700, 800, 900)})


mean_sales = pd.concat((df1, df2, df3)).mean()
print(mean_sales)

خروجی:

sales    500.0
dtype: float64

مورد استفاده دیگر می تواند تجزیه و تحلیل سری زمانی باشد، که در آن ممکن است داده ها در چندین DataFrame تقسیم شوند که هر یک دوره زمانی متفاوتی را نشان می دهد. محاسبه میانگین در این DataFrames می تواند بینش بهتری در مورد روندها و الگوها در طول زمان ارائه دهد.

نتیجه

در این بایت، ما میانگین را در چندین DataFrame در پانداها محاسبه کردیم. ما با درک محاسبه میانگین در یک DataFrame شروع کردیم، سپس این مفهوم را به چندین DataFrame گسترش دادیم. ما همچنین به برخی موارد استفاده اشاره کردیم که در آن این تکنیک به ویژه مفید است، مانند زمانی که با مجموعه داده‌های تقسیم شده یا انجام تجزیه و تحلیل سری‌های زمانی سروکار داریم.





منتشر شده در 1402-12-26 16:29:04

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید