وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

نقل قول ها را از تمام ردیف ها در ستون DataFrame حذف کنید

0 5
زمان لازم برای مطالعه: < 1 دقیقه


وقتی ستون‌های رشته‌ای دارای نقل قول هستند – ما اغلب می‌خواهیم از شر آنها خلاص شویم، تا حد زیادی به این دلیل که 'string از نظر فنی یک رشته متفاوت است string، که اغلب تمایزی نیست که ما بخواهیم ایجاد کنیم.

این که آیا NLP را انجام می دهید و کلمات را نشانه گذاری می کنید (در این صورت، نشانه های متفاوتی برای کلمات مشابه خواهید داشت، زیرا آنها به یک نقل قول “چسبانده شده اند”) یا هر شکل دیگری از دستکاری – حذف نقل قول ها مهم خواهد بود. .

چند راه برای حذف نقل قول در پاندا وجود دارد DataFrame.

DataFrame.applymap (لامبدا…)

برای حذف تمام نقل قول ها از تمام ردیف ها و ستون های یک کل DataFrame، شما می توانید استفاده کنید applymap() با یک lambda تابع:


df = df.applymap(lambda x: x.replace('"', ''))

توجه داشته باشید: این تابع لامبدا را اعمال می کند روی هر ردیف از هر ستون، و اگر همه ستون‌ها از آن نباشند، منجر به خطا می‌شود str نوع

برای حذف همه نقل‌قول‌ها از تمام ردیف‌ها در یک ستون، کافی است تابع را در یک ستون واحد اعمال کنید:


df('ColumnName') = df('ColumnName').apply(lambda x: x.replace('"', ''))

این دو رویکرد عمومی هستند و می‌توانند هر تابع لامبدا را به‌جز یکی از اهرم‌ها اعمال کنند replace().

روش str سری – str.replace()

هر یک Series ارائه می دهد str تابع، که به شما امکان می دهد از توابع دیگری مانند replace() برای دستکاری رشته ها در ردیف های یک ستون:

df('ColumnName') = df('ColumnName').str.replace(r'"', '')

str.replace() با RegEx

برای استفاده از عبارات منظم با replace() روش، شما عبور می کنید regex=True:

df('ColumnName').replace(regex=True,inplace=False,to_replace=r'"',value=r'')

(برچسب‌ها به ترجمه)# python



منتشر شده در 1403-01-04 23:27:05

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید