وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

خط لوله رگرسیون جنگل تصادفی سرتاسر با Scikit-Learn

0 2
زمان لازم برای مطالعه: < 1 دقیقه


رگرسیون تکنیکی در آمار و یادگیری ماشینی است که در آن ارزش یک متغیر مستقل از طریق رابطه آن با سایر متغیرها پیش‌بینی می‌شود.

چارچوب‌هایی مانند Scikit-Learn انجام رگرسیون را با مدل‌های مختلف آسان‌تر از همیشه می‌کنند – یکی از قوی‌ترین مدل‌های ساخته شده روی را الگوریتم جنگل تصادفی.

اگر می خواهید راهنمای عمیق جنگل های تصادفی را بخوانید، “الگوریتم جنگل تصادفی با پایتون و Scikit-Learn” ما را بخوانید!

با استفاده از خطوط لوله Scikit-Learn، می توانید یک خط لوله سرتاسر بسازید، یک مجموعه داده را بارگذاری کنید، مقیاس بندی ویژگی ها را انجام دهید و داده ها را در یک مدل رگرسیون در 4 خط کد ارائه دهید:

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from sklearn.ensemble import RandomForestRegressor
from sklearn.pipeline import Pipeline

X, y = datasets.fetch_california_housing(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y)

pipeline = Pipeline((('scaler', MinMaxScaler()), ('regressor', RandomForestRegressor())))
pipeline.fit(X_train, y_train)

r2 = pipeline.score(X_test, y_test)
print(f"RFR: {r2}") 

از طرف دیگر، می توانید مراحل خارج از خط لوله را که کمی پرمخاطب تر و در عین حال انعطاف پذیرتر است، جدا کنید:

X, y = datasets.fetch_california_housing(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y)

scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

rfr = ensemble.RandomForestRegressor().fit(X_train_scaled, y_train)

r2 = rfr.score(X_test_scaled, y_test)
print(f"RFR: {r2}") 

(برچسب‌ها به ترجمه)# python



منتشر شده در 1403-01-05 12:39:04

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید