از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
نقل قول ها را از تمام ردیف ها در ستون DataFrame حذف کنید
سرفصلهای مطلب
وقتی ستونهای رشتهای دارای نقل قول هستند – ما اغلب میخواهیم از شر آنها خلاص شویم، تا حد زیادی به این دلیل که 'string
از نظر فنی یک رشته متفاوت است string
، که اغلب تمایزی نیست که ما بخواهیم ایجاد کنیم.
این که آیا NLP را انجام می دهید و کلمات را نشانه گذاری می کنید (در این صورت، نشانه های متفاوتی برای کلمات مشابه خواهید داشت، زیرا آنها به یک نقل قول “چسبانده شده اند”) یا هر شکل دیگری از دستکاری – حذف نقل قول ها مهم خواهد بود. .
چند راه برای حذف نقل قول در پاندا وجود دارد DataFrame
.
DataFrame.applymap (لامبدا…)
برای حذف تمام نقل قول ها از تمام ردیف ها و ستون های یک کل DataFrame
، شما می توانید استفاده کنید applymap()
با یک lambda
تابع:
df = df.applymap(lambda x: x.replace('"', ''))
توجه داشته باشید: این تابع لامبدا را اعمال می کند روی هر ردیف از هر ستون، و اگر همه ستونها از آن نباشند، منجر به خطا میشود str
نوع
برای حذف همه نقلقولها از تمام ردیفها در یک ستون، کافی است تابع را در یک ستون واحد اعمال کنید:
df('ColumnName') = df('ColumnName').apply(lambda x: x.replace('"', ''))
این دو رویکرد عمومی هستند و میتوانند هر تابع لامبدا را بهجز یکی از اهرمها اعمال کنند replace()
.
روش str سری – str.replace()
هر یک Series
ارائه می دهد str
تابع، که به شما امکان می دهد از توابع دیگری مانند replace()
برای دستکاری رشته ها در ردیف های یک ستون:
df('ColumnName') = df('ColumnName').str.replace(r'"', '')
str.replace() با RegEx
برای استفاده از عبارات منظم با replace()
روش، شما عبور می کنید regex=True
:
df('ColumnName').replace(regex=True,inplace=False,to_replace=r'"',value=r'')
(برچسبها به ترجمه)# python
منتشر شده در 1403-01-04 23:27:05