از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
محاسبه میانگین در چند فریم داده در پانداها
سرفصلهای مطلب
معرفی
کتابخانه Pandas توابع فراوانی را ارائه میکند که دستکاری و تجزیه و تحلیل دادهها را بسیار ساده (یا حداقل ساده) میکند.er). یکی از این تابع ها است mean()
تابع، که به شما امکان می دهد میانگین مقادیر یک DataFrame را محاسبه کنید. اما اگر با چندین DataFrame کار می کنید چه؟ در این بایت، نحوه محاسبه میانگین در چندین DataFrame را بررسی خواهیم کرد.
چرا میانگین را در چند فریم داده محاسبه کنیم؟
سناریوهای متعددی وجود دارد که ممکن است چندین DataFrame داشته باشید و باید میانگین همه آنها را محاسبه کنید. به عنوان مثال، ممکن است به دلیل اندازه داده ها، منابع مختلف داده، داده ها در چندین DataFrame پخش شده باشد، یا شاید داده ها به سادگی برای دستکاری یا ذخیره سازی آسان تر در فایل ها تقسیم بندی شوند. در این موارد، محاسبه میانگین در تمام این DataFrame ها می تواند یک نمای کلی از داده ها ارائه دهد و می تواند برای تجزیه و تحلیل های آماری خاص مفید باشد.
محاسبه میانگین در یک DataFrame واحد
قبل از اینکه به محاسبه میانگین در چندین DataFrame بپردازیم، ابتدا نحوه محاسبه میانگین در یک DataFrame را درک می کنیم. در اینجا این است که چگونه این کار را انجام می دهیم:
import pandas as pd
df = pd.DataFrame({
'A': (1, 2, 3, 4, 5),
'B': (2, 3, 4, 5, 6),
'C': (3, 4, 5, 6, 7)
})
mean = df.mean()
print(mean)
وقتی این کد را اجرا می کنید، خروجی زیر را دریافت خواهید کرد:
A 3.0
B 4.0
C 5.0
dtype: float64
در این مثال ساده، mean()
تابع میانگین هر ستون در DataFrame را محاسبه می کند.
گسترش به چند دیتا فریم
اکنون که می دانیم چگونه میانگین را در یک DataFrame واحد محاسبه کنیم، اجازه دهید این را به چندین DataFrame تعمیم دهیم. برای انجام این کار، اگر DataFrames را به هم متصل کنیم و سپس میانگین را محاسبه کنیم، سادهترین کار خواهد بود. این را می توان با استفاده از concat()
روش.
df1 = pd.DataFrame({
'A': (6, 7, 8, 9, 10),
'B': (7, 8, 9, 10, 11),
'C': (8, 9, 10, 11, 12)
})
df2 = pd.DataFrame({
'A': (11, 12, 13, 14, 15),
'B': (12, 13, 14, 15, 16),
'C': (13, 14, 15, 16, 17)
})
df_concat = pd.concat((df, df1, df2))
mean_concat = df_concat.mean()
print(mean_concat)
خروجی خواهد بود:
A 8.0
B 9.0
C 10.0
dtype: float64
ابتدا سه DataFrame را با استفاده از یکدیگر به هم متصل می کنیم pd.concat()
. سپس میانگین DataFrame به هم پیوسته جدید را با استفاده از mean()
تابع.
توجه داشته باشید: را pd.concat()
تابع به طور پیش فرض در امتداد محور عمودی به هم متصل می شود. اگر DataFrames شما ستونهای یکسانی دارد، معمولاً این همان چیزی است که میخواهید.
با این حال، اگر DataFrames شما دارای ستونهای متفاوتی است، ممکن است بخواهید در امتداد آنها به هم بپیوندید افقی محور. می توانید این کار را با تنظیم کردن انجام دهید axis
پارامتر به 1: pd.concat((df1, df2), axis=1)
. اگر ستونهای متفاوتی داشته باشند و شما فقط میخواهید آنها را در یک DataFrame مشترک قرار دهید تا تجزیه و تحلیل روی آن انجام شود، مفید خواهد بود، مانند mean()
روش.
موارد استفاده
محاسبه میانگین در چندین DataFrame در پانداها می تواند در سناریوهای مختلف کمک کند. بیایید چند مورد استفاده ممکن را ببینیم.
یکی از رایجترین سناریوها زمانی است که با مجموعه دادههای بزرگی سروکار دارید که برای مدیریت آسانتر به چند DataFrame تقسیم شدهاند. در چنین مواردی، محاسبه میانگین در میان این DataFrame ها می تواند درک جامع تری از داده های خود به شما بدهد.
موردی را در نظر بگیرید که یک تحلیلگر داده با داده های فروش یک شرکت چند ملیتی کار می کند. داده ها بر اساس منطقه تقسیم می شوند که هر کدام با یک DataFrame جداگانه نمایش داده می شوند. برای به دست آوردن یک دیدگاه جهانی در مورد میانگین فروش، تحلیلگر باید میانگین را در تمام این DataFrames محاسبه کند.
import pandas as pd
df1 = pd.DataFrame({'sales': (100, 200, 300)})
df2 = pd.DataFrame({'sales': (400, 500, 600)})
df3 = pd.DataFrame({'sales': (700, 800, 900)})
mean_sales = pd.concat((df1, df2, df3)).mean()
print(mean_sales)
خروجی:
sales 500.0
dtype: float64
مورد استفاده دیگر می تواند تجزیه و تحلیل سری زمانی باشد، که در آن ممکن است داده ها در چندین DataFrame تقسیم شوند که هر یک دوره زمانی متفاوتی را نشان می دهد. محاسبه میانگین در این DataFrames می تواند بینش بهتری در مورد روندها و الگوها در طول زمان ارائه دهد.
نتیجه
در این بایت، ما میانگین را در چندین DataFrame در پانداها محاسبه کردیم. ما با درک محاسبه میانگین در یک DataFrame شروع کردیم، سپس این مفهوم را به چندین DataFrame گسترش دادیم. ما همچنین به برخی موارد استفاده اشاره کردیم که در آن این تکنیک به ویژه مفید است، مانند زمانی که با مجموعه دادههای تقسیم شده یا انجام تجزیه و تحلیل سریهای زمانی سروکار داریم.
منتشر شده در 1402-12-26 16:29:04