وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید

0 3
زمان لازم برای مطالعه: < 1 دقیقه


Scikit-Learn چندین مجموعه داده را برای بازی با آنها ارائه می دهد – بیشتر آنها مجموعه داده های اسباب بازی برای یادگیری و آزمایش چیزها هستند.

برخی از مبتدیان راحتی پانداهای جدولی را پیدا می کنند DataFrame فرمت بصری تر از آرایه های NumPy. خوشبختانه، شما می توانید import یک مجموعه داده به عنوان یک Bunch شیء حاوی الف DataFrame با تنظیم as_frame به True:

import pandas as pd
import numpy as np
from sklearn.datasets import fetch_california_housing

data = fetch_california_housing(as_frame=True)

این Bunch شی شامل data و target “X” و “y” ما، اما آنها جدا هستند! را data میدان یک است DataFrame:

data.data

مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید

در حالی که هدف ما یک Series:

data.target
0        4.526
1        3.585
2        3.521
3        3.413
4        3.422
         ...  
20635    0.781
20636    0.771
20637    0.923
20638    0.847
20639    0.894
Name: MedHouseVal, Length: 20640, dtype: float64

ساده ترین راه برای ترکیب آنها این است که به سادگی سری را به a اختصاص دهید DataFrame:

df = data.data.assign(MedHouseVal=data.target)
df

این نتیجه در:

مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید

یا می توانید یک قاب جدید با استفاده از data و feature_names، هدف را با اختصاص دادن آن به یک ستون جدید اضافه کنید:

df = pd.DataFrame(data=data.data, columns=data.feature_names)
df('MedHouseVal') = data.target
df

مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید

(برچسب‌ها به ترجمه)# python



منتشر شده در 1403-01-04 22:20:04

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید