از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید
Scikit-Learn چندین مجموعه داده را برای بازی با آنها ارائه می دهد – بیشتر آنها مجموعه داده های اسباب بازی برای یادگیری و آزمایش چیزها هستند.
برخی از مبتدیان راحتی پانداهای جدولی را پیدا می کنند DataFrame فرمت بصری تر از آرایه های NumPy. خوشبختانه، شما می توانید import یک مجموعه داده به عنوان یک Bunch شیء حاوی الف DataFrame با تنظیم as_frame به True:
import pandas as pd
import numpy as np
from sklearn.datasets import fetch_california_housing
data = fetch_california_housing(as_frame=True)
این Bunch شی شامل data و target “X” و “y” ما، اما آنها جدا هستند! را data میدان یک است DataFrame:
data.data

در حالی که هدف ما یک Series:
data.target
0 4.526
1 3.585
2 3.521
3 3.413
4 3.422
...
20635 0.781
20636 0.771
20637 0.923
20638 0.847
20639 0.894
Name: MedHouseVal, Length: 20640, dtype: float64
ساده ترین راه برای ترکیب آنها این است که به سادگی سری را به a اختصاص دهید DataFrame:
df = data.data.assign(MedHouseVal=data.target)
df
این نتیجه در:

یا می توانید یک قاب جدید با استفاده از data و feature_names، هدف را با اختصاص دادن آن به یک ستون جدید اضافه کنید:
df = pd.DataFrame(data=data.data, columns=data.feature_names)
df('MedHouseVal') = data.target
df



(برچسبها به ترجمه)# python
منتشر شده در 1403-01-04 22:20:04

