از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
مجموعه داده Scikit-Learn را به عنوان Pandas DataFrame بارگیری کنید
Scikit-Learn چندین مجموعه داده را برای بازی با آنها ارائه می دهد – بیشتر آنها مجموعه داده های اسباب بازی برای یادگیری و آزمایش چیزها هستند.
برخی از مبتدیان راحتی پانداهای جدولی را پیدا می کنند DataFrame
فرمت بصری تر از آرایه های NumPy. خوشبختانه، شما می توانید import یک مجموعه داده به عنوان یک Bunch
شیء حاوی الف DataFrame
با تنظیم as_frame
به True
:
import pandas as pd
import numpy as np
from sklearn.datasets import fetch_california_housing
data = fetch_california_housing(as_frame=True)
این Bunch
شی شامل data
و target
“X” و “y” ما، اما آنها جدا هستند! را data
میدان یک است DataFrame
:
data.data
در حالی که هدف ما یک Series
:
data.target
0 4.526
1 3.585
2 3.521
3 3.413
4 3.422
...
20635 0.781
20636 0.771
20637 0.923
20638 0.847
20639 0.894
Name: MedHouseVal, Length: 20640, dtype: float64
ساده ترین راه برای ترکیب آنها این است که به سادگی سری را به a اختصاص دهید DataFrame
:
df = data.data.assign(MedHouseVal=data.target)
df
این نتیجه در:
یا می توانید یک قاب جدید با استفاده از data
و feature_names
، هدف را با اختصاص دادن آن به یک ستون جدید اضافه کنید:
df = pd.DataFrame(data=data.data, columns=data.feature_names)
df('MedHouseVal') = data.target
df
(برچسبها به ترجمه)# python
منتشر شده در 1403-01-04 22:20:04