وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

مرتب سازی الگوریتم ها در پایتون

0 29
زمان لازم برای مطالعه: 10 دقیقه


معرفی

گاهی اوقات، داده‌هایی که در یک برنامه ذخیره یا بازیابی می‌کنیم، می‌توانند ترتیب کمی داشته باشند یا اصلاً سفارشی نداشته باشند. ممکن است مجبور شویم داده ها را به درستی مرتب کنیم process یا به طور موثر از آن استفاده کنید. در طول سال‌ها، دانشمندان کامپیوتر الگوریتم‌های مرتب‌سازی زیادی برای سازمان‌دهی داده‌ها ایجاد کرده‌اند.

در این مقاله نگاهی به الگوریتم های مرتب سازی محبوب خواهیم داشت، روش کار آنها را درک می کنیم و آنها را در پایتون کدنویسی می کنیم. ما همچنین مقایسه می کنیم که آنها با چه سرعتی موارد را در یک لیست مرتب می کنند.

توجه داشته باشید: برای سادگی، پیاده سازی الگوریتم باید فهرست اعداد را به ترتیب صعودی مرتب کند. البته، شما آزادید که آنها را با نیازهای خود تطبیق دهید.

مرتب سازی حباب

این الگوریتم مرتب‌سازی ساده روی یک لیست تکرار می‌شود، عناصر را به صورت جفتی مقایسه می‌کند و آن‌ها را عوض می‌کند تا زمانی که عناصر بزرگ‌تر تا انتهای لیست «حباب» شوند و عناصر کوچک‌تر در «پایین» باقی بمانند.

مرتب‌سازی حبابی چگونه کار می‌کند؟

ما شروع می کنیم مقایسه دو عنصر اول از لیست اگر عنصر اول بزرگتر از عنصر دوم باشد، ما swap آنها اگر آنها از قبل مرتب هستند آنها را همانطور که هستند رها می کنیم. سپس به جفت عنصر بعدی می رویم، مقادیر آنها را مقایسه می کنیم و swap تا جایی که لازم است. این process تا آخرین جفت از آیتم های لیست ادامه می یابد.

پس از رسیدن به انتهای لیست، این کار را تکرار می کند process برای هر مورد اگرچه، این است بسیار ناکارآمد. چه می شود اگر فقط یک مجرد swap باید در آرایه ساخته شود؟ چرا هنوز باید \(n^{2}\) بار آن را تکرار کنیم، حتی اگر قبلا مرتب شده است؟

بدیهی است که برای بهینه‌سازی الگوریتم، باید پس از اتمام مرتب‌سازی، آن را متوقف کنیم، در غیر این صورت، آرایه‌ای که قبلا مرتب شده‌اند را بارها ارزیابی می‌کند.

چگونه بفهمیم که مرتب سازی را به پایان رسانده ایم؟ اگر اقلام مرتب بودند، مجبور نبودیم swap هر بنابراین، هر زمان که ما swap مقادیری که یک پرچم را روی آنها قرار می دهیم True برای تکرار مرتب سازی process. اگر مبادله ای رخ نداد، پرچم باقی می ماند False و الگوریتم متوقف می شود.

چگونه مرتب سازی حباب را در پایتون پیاده سازی کنیم؟

با بهینه سازی، می توانیم مرتب سازی حباب را در پایتون به صورت زیر پیاده سازی کنیم:

def bubble_sort(nums):
    
    swapped = True
    while swapped:
        swapped = False
        for i in range(len(nums) - 1):
            if nums(i) > nums(i + 1):
                
                nums(i), nums(i + 1) = nums(i + 1), nums(i)
                
                swapped = True



random_list_of_nums = (5, 2, 1, 8, 4)
bubble_sort(random_list_of_nums)
print(random_list_of_nums)


الگوریتم در a اجرا می شود while حلقه، تنها زمانی شکسته می شود که هیچ موردی مبادله نشود. تنظیم کردیم swapped به True در ابتدا مطمئن شوید که الگوریتم حداقل یک بار اجرا می شود.

پیچیدگی زمانی مرتب سازی حباب

در بدترین سناریو (زمانی که لیست به ترتیب معکوس است)، این الگوریتم باید swap تک تک آیتم های آرایه ما swapped پرچم تنظیم خواهد شد True روی هر تکرار

بنابراین اگر داریم n عناصر موجود در لیست خود را خواهیم داشت n تکرار در هر مورد – بنابراین پیچیدگی زمانی مرتب‌سازی حبابی \(O(n^2)\) است.

انتخاب مرتب سازی

این الگوریتم لیست را بخش می کند به دو بخش: مرتب شده است و طبقه بندی نشده. ما به طور مداوم کوچکترین عنصر از بخش مرتب نشده لیست را حذف می کنیم و آن را به بخش مرتب شده اضافه می کنیم.

چگونه انتخاب مرتب سازی کار می کند؟

در عمل، ما نیازی به ایجاد یک لیست جدید برای عناصر مرتب شده نداریم، کاری که انجام می دهیم این است که سمت چپ لیست را به عنوان بخش مرتب شده در نظر می گیریم. سپس کل لیست را برای کوچکترین عنصر جستجو می کنیم و swap آن را با عنصر اول.

اکنون می دانیم که اولین عنصر لیست مرتب شده است، کوچکترین عنصر از آیتم های باقی مانده را دریافت می کنیم و swap آن را با عنصر دوم. این تا زمانی تکرار می شود که آخرین مورد از لیست، عنصر باقی مانده برای بررسی باشد.

روش پیاده سازی Selection Sort در پایتون

def selection_sort(nums):
    
    for i in range(len(nums)):
        
        lowest_value_index = i
        
        for j in range(i + 1, len(nums)):
            if nums(j) < nums(lowest_value_index):
                lowest_value_index = j
        
        
        nums(i), nums(lowest_value_index) = nums(lowest_value_index), nums(i)



random_list_of_nums = (12, 8, 3, 20, 11)
selection_sort(random_list_of_nums)
print(random_list_of_nums)


ما آن را به عنوان i افزایش می یابد، ما باید موارد کمتری را بررسی کنیم.

پیچیدگی زمانی مرتب سازی انتخاب

ما به راحتی می توانیم پیچیدگی زمانی را با بررسی آن بدست آوریم for حلقه ها در الگوریتم Selection Sort. برای یک لیست با n عناصر، حلقه بیرونی تکرار می شود n بار.

حلقه داخلی تکرار می شود n-1 چه زمانی من برابر 1 است و سپس n-2 مانند من برابر 2 است و غیره.

میزان مقایسه است (n - 1) + (n - 2) + ... + 1، که به Selection Sort پیچیدگی زمانی \(O(n^2)\) می دهد.

مرتب سازی درج

مانند Selection Sort، این الگوریتم لیست را به قسمت های مرتب شده و مرتب نشده تقسیم می کند. روی بخش مرتب نشده تکرار می شود و عنصر مورد مشاهده را در موقعیت صحیح لیست مرتب شده قرار می دهد.

مرتب سازی درج چگونه کار می کند؟

ما فرض می کنیم که اولین عنصر لیست مرتب شده است. سپس به عنصر بعدی می رویم، بیایید آن را صدا کنیم x. اگر x بزرگتر از اولین عنصری است که آن را به همان صورت باقی می گذاریم. اگر x کوچکتر است، مقدار عنصر اول را در موقعیت دوم کپی می کنیم و سپس عنصر اول را روی آن قرار می دهیم x.

همانطور که به سایر عناصر بخش مرتب نشده می رویم، به طور مداوم عناصر بزرگتر را در قسمت مرتب شده به سمت بالا حرکت می دهیم تا زمانی که با عنصری کوچکتر از x یا به انتهای بخش مرتب شده برسید و سپس قرار دهید x در موقعیت صحیح خود

روش پیاده سازی مرتب سازی درج در پایتون

def insertion_sort(nums):
    
    for i in range(1, len(nums)):
        item_to_insert = nums(i)
        
        j = i - 1
        
        
        while j >= 0 and nums(j) > item_to_insert:
            nums(j + 1) = nums(j)
            j -= 1
        
        nums(j + 1) = item_to_insert



random_list_of_nums = (9, 1, 15, 28, 6)
insertion_sort(random_list_of_nums)
print(random_list_of_nums)


پیچیدگی زمانی مرتب سازی درج

در بدترین حالت، یک آرایه به ترتیب معکوس مرتب می شود. بیرونی for loop در تابع مرتب سازی درج همیشه تکرار می شود n-1 بار.

در بدترین حالت، درونی for loop خواهد شد swap یک بار، پس swap دو، و غیره. سپس تعداد مبادله ها خواهد بود 1 + 2 + ... + (n - 3) + (n - 2) + (n - 1) که به Insertion Sort پیچیدگی زمانی \(O(n^2)\) می دهد.

مرتب سازی پشته

این الگوریتم مرتب‌سازی محبوب، مانند مرتب‌سازی Insertion و Selection، فهرست را به بخش‌های مرتب‌شده و مرتب‌نشده تقسیم می‌کند. بخش مرتب نشده لیست را به یک ساختار داده Heap تبدیل می کند تا بتوانیم به طور موثر بزرگترین عنصر را تعیین کنیم.

مرتب سازی هیپ چگونه کار می کند؟

ما با تبدیل لیست به یک شروع می کنیم ماکس هیپ – یک درخت باینری که بزرگترین عنصر آن است root node. سپس آن مورد را در انتهای لیست قرار می دهیم. سپس ما خود را بازسازی می کنیم ماکس هیپ که اکنون یک مقدار کمتر دارد و بزرگترین مقدار جدید را قبل از آخرین مورد لیست قرار می دهد.

ما این را تکرار می کنیم process ساخت پشته تا زمانی که همه گره ها حذف شوند.

روش پیاده سازی مرتب سازی هیپ در پایتون

ما یک تابع کمکی ایجاد خواهیم کرد heapify برای پیاده سازی این الگوریتم:

def heapify(nums, heap_size, root_index):
    
    largest = root_index
    left_child = (2 * root_index) + 1
    right_child = (2 * root_index) + 2

    
    
    if left_child < heap_size and nums(left_child) > nums(largest):
        largest = left_child

    
    if right_child < heap_size and nums(right_child) > nums(largest):
        largest = right_child

    
    if largest != root_index:
        nums(root_index), nums(largest) = nums(largest), nums(root_index)
        
        heapify(nums, heap_size, largest)


def heap_sort(nums):
    n = len(nums)

    
    
    
    
    
    for i in range(n, -1, -1):
        heapify(nums, n, i)

    
    for i in range(n - 1, 0, -1):
        nums(i), nums(0) = nums(0), nums(i)
        heapify(nums, i, 0)



random_list_of_nums = (35, 12, 43, 8, 51)
heap_sort(random_list_of_nums)
print(random_list_of_nums)


پیچیدگی زمانی مرتب‌سازی هیپ

بیایید ابتدا به پیچیدگی زمانی آن نگاه کنیم heapify تابع. در بدترین حالت، بزرگترین عنصر هرگز این نیست root عنصر، این باعث یک تماس بازگشتی به heapify. در حالی که تماس های بازگشتی ممکن است بسیار گران به نظر برسند، به یاد داشته باشید که ما با یک درخت باینری کار می کنیم.

درخت دودویی را با 3 عنصر تجسم کنید، ارتفاع آن 2 است. حالا درخت دودویی را با 7 عنصر تجسم کنید، ارتفاع آن 3 است. درخت به صورت لگاریتمی رشد می کند تا n. این heapify تابع آن درخت را در زمان \(O(log(n))\) طی می کند.

این heap_sort تابع در آرایه \(n\) بارها تکرار می شود. بنابراین پیچیدگی کلی زمانی الگوریتم مرتب‌سازی هیپ \(O(nlog(n))\) است.

ادغام مرتب سازی

این الگوریتم تقسیم و غلبه یک لیست را به نصف تقسیم می کند و تا زمانی که فقط دارای عناصر منفرد باشد، لیست را بر 2 تقسیم می کند.

عناصر مجاور به جفت های مرتب شده تبدیل می شوند، سپس جفت های مرتب شده ادغام شده و با جفت های دیگر نیز مرتب می شوند. این process ادامه می یابد تا زمانی که یک لیست مرتب شده با تمام عناصر لیست ورودی مرتب نشده بدست آوریم.

مرتب سازی ادغام چگونه کار می کند؟

ما به صورت بازگشتی لیست را به نصف تقسیم می کنیم تا زمانی که لیست هایی با اندازه یک داشته باشیم. سپس هر نیمه را که تقسیم شده بود با هم ادغام می کنیم و آنها را در قسمت مرتب می کنیم process.

مرتب سازی با مقایسه کوچکترین عناصر هر نیمه انجام می شود. اولین عنصر هر لیست اولین عنصری است که مقایسه می شود. اگر نیمه اول با مقدار کمتری شروع شود، آن را به لیست مرتب شده اضافه می کنیم. سپس دومین کوچکترین مقدار نیمه اول را با اولین کوچکترین مقدار نیمه دوم مقایسه می کنیم.

هر بار که مقدار کوچک‌تری را در ابتدای نیمه انتخاب می‌کنیم، شاخص موردی که باید با یک مورد مقایسه شود را جابه‌جا می‌کنیم.

روش پیاده سازی Merge Sort در پایتون

def merge(left_list, right_list):
    sorted_list = ()
    left_list_index = right_list_index = 0

    
    left_list_length, right_list_length = len(left_list), len(right_list)

    for _ in range(left_list_length + right_list_length):
        if left_list_index < left_list_length and right_list_index < right_list_length:
            
            
            
            if left_list(left_list_index) <= right_list(right_list_index):
                sorted_list.append(left_list(left_list_index))
                left_list_index += 1
            
            
            else:
                sorted_list.append(right_list(right_list_index))
                right_list_index += 1

        
        
        elif left_list_index == left_list_length:
            sorted_list.append(right_list(right_list_index))
            right_list_index += 1
        
        
        elif right_list_index == right_list_length:
            sorted_list.append(left_list(left_list_index))
            left_list_index += 1

    return sorted_list


def merge_sort(nums):
    
    if len(nums) <= 1:
        return nums

    
    mid = len(nums) // 2

    
    left_list = merge_sort(nums(:mid))
    right_list = merge_sort(nums(mid:))

    
    return merge(left_list, right_list)



random_list_of_nums = (120, 45, 68, 250, 176)
random_list_of_nums = merge_sort(random_list_of_nums)
print(random_list_of_nums)


توجه داشته باشید که merge_sort() تابع، برخلاف الگوریتم‌های مرتب‌سازی قبلی، به جای مرتب‌سازی فهرست موجود، فهرست جدیدی را که مرتب شده است، برمی‌گرداند.

بنابراین، مرتب سازی ادغام به فضایی برای ایجاد یک لیست جدید به اندازه لیست ورودی نیاز دارد.

پیچیدگی زمانی مرتب سازی ادغام

بیایید ابتدا نگاهی به merge تابع. دو لیست می گیرد و تکرار می شود n بارها، کجا n اندازه ورودی ترکیبی آنها است.

این merge_sort تابع آرایه داده شده خود را به 2 تقسیم می کند و به صورت بازگشتی آرایه های فرعی را مرتب می کند. از آنجایی که ورودی بازگشتی نیمی از آنچه داده شده است، مانند درختان دودویی این باعث می شود که زمان لازم برای دریافت آن باشد process رشد لگاریتمی به n.

بنابراین پیچیدگی کلی زمانی الگوریتم Merge Sort \(O(nlog(n))\) است.

مرتب سازی سریع

این الگوریتم تقسیم کن و غلبه کن، متداول ترین الگوریتم مرتب سازی است که در این مقاله به آن پرداخته شده است. هنگامی که به درستی پیکربندی شود، بسیار کارآمد است و نیازی به فضای اضافی استفاده از Merge Sort ندارد. ما لیست را حول یک عنصر محوری تقسیم بندی می کنیم و مقادیر را در اطراف محور مرتب می کنیم.

مرتب سازی سریع چگونه کار می کند؟

مرتب سازی سریع با پارتیشن بندی لیست شروع می شود – انتخاب یک مقدار از لیست که در مکان مرتب شده آن قرار خواهد گرفت. این مقدار Pivot نامیده می شود. تمام عناصر کوچکتر از محور به سمت چپ آن منتقل می شوند. تمام عناصر بزرگتر به سمت راست آن منتقل می شوند.

با دانستن اینکه pivot در جای مناسب خود قرار دارد، به صورت بازگشتی مقادیر اطراف محور را مرتب می کنیم تا زمانی که کل لیست مرتب شود.

روش پیاده سازی مرتب سازی سریع در پایتون



def partition(nums, low, high):
    
    
    
    
    pivot = nums((low + high) // 2)
    i = low - 1
    j = high + 1
    while True:
        i += 1
        while nums(i) < pivot:
            i += 1

        j -= 1
        while nums(j) > pivot:
            j -= 1

        if i >= j:
            return j

        
        
        nums(i), nums(j) = nums(j), nums(i)


def quick_sort(nums):
    
    def _quick_sort(items, low, high):
        if low < high:
            
            split_index = partition(items, low, high)
            _quick_sort(items, low, split_index)
            _quick_sort(items, split_index + 1, high)

    _quick_sort(nums, 0, len(nums) - 1)



random_list_of_nums = (22, 5, 1, 18, 99)
quick_sort(random_list_of_nums)
print(random_list_of_nums)


پیچیدگی زمانی مرتب سازی سریع

بدترین سناریو زمانی است که کوچکترین یا بزرگترین عنصر همیشه به عنوان محور انتخاب می شود. این باعث ایجاد پارتیشن هایی با اندازه می شود n-1، باعث تماس های بازگشتی می شود n-1 بار. این ما را به پیچیدگی زمانی در بدترین حالت \(O(n^2)\) هدایت می کند.

در حالی که این یک بدترین حالت وحشتناک است، مرتب سازی سریع به شدت مورد استفاده قرار می گیرد زیرا میانگین پیچیدگی زمانی آن بسیار سریعتر است. در حالی که partition تابع از تودرتو استفاده می کند while حلقه، مقایسه می کند روی تمام عناصر آرایه برای انجام مبادله های آن. به این ترتیب، پیچیدگی زمانی \(O(n)\) دارد.

با یک پیوت خوب، تابع مرتب سازی سریع آرایه را به دو نیم تقسیم می کند که به صورت لگاریتمی با \(n\) رشد می کند. بنابراین میانگین پیچیدگی زمانی الگوریتم مرتب‌سازی سریع \(O(nlog(n))\) است.

توابع مرتب سازی داخلی پایتون

در حالی که درک این الگوریتم‌های مرتب‌سازی مفید است، در اکثر پروژه‌های پایتون احتمالاً از توابع مرتب‌سازی که قبلاً در زبان ارائه شده است استفاده می‌کنید.

می‌توانیم فهرست خود را طوری تغییر دهیم که محتویات آن با فهرست مرتب شوند sort() روش:

apples_eaten_a_day = (2, 1, 1, 3, 1, 2, 2)
apples_eaten_a_day.sort()
print(apples_eaten_a_day) 

یا می توانیم از آن استفاده کنیم sorted() تابع ایجاد یک لیست مرتب شده جدید:

apples_eaten_a_day_2 = (2, 1, 1, 3, 1, 2, 2)
sorted_apples = sorted(apples_eaten_a_day_2)
print(sorted_apples) 

هر دو به ترتیب صعودی مرتب می‌شوند، اما شما می‌توانید به راحتی با تنظیم کردن به ترتیب نزولی مرتب کنید reverse پرچم به True:


apples_eaten_a_day.sort(reverse=True)
print(apples_eaten_a_day) 


sorted_apples_desc = sorted(apples_eaten_a_day_2, reverse=True)
print(sorted_apples_desc) 

برخلاف توابع الگوریتم مرتب‌سازی که ایجاد کردیم، هر دوی این توابع می‌توانند فهرست‌های تاپل و کلاس‌ها را مرتب کنند. این sorted() تابع می تواند هر شی قابل تکرار را مرتب کند و شامل لیست ها، رشته ها، تاپل ها، دیکشنری ها، مجموعه ها و تکرار کننده های سفارشی می شود که می توانید ایجاد کنید.

این توابع مرتب سازی اجرا می کنند تیم مرتب کردن الگوریتم، الگوریتمی الهام گرفته از Merge Sort و Insertion Sort.

مقایسه سرعت

برای اینکه ایده ای از سرعت عملکرد آنها داشته باشیم، لیستی از 5000 عدد بین 0 تا 1000 را ایجاد می کنیم. سپس زمان بندی می کنیم که تکمیل هر الگوریتم چقدر طول می کشد. این کار 10 بار تکرار می شود تا بتوانیم با اطمینان بیشتری الگوی عملکرد را ایجاد کنیم.

این نتایج بود، زمان بر حسب ثانیه است:

اجرا کن حباب انتخاب درج پشته ادغام سریع
1 5.53188 1.23152 1.60355 0.04006 0.02619 0.01639
2 4.92176 1.24728 1.59103 0.03999 0.02584 0.01661
3 4.91642 1.22440 1.59362 0.04407 0.02862 0.01646
4 5.15470 1.25053 1.63463 0.04128 0.02882 0.01860
5 4.95522 1.28987 1.61759 0.04515 0.03314 0.01885
6 5.04907 1.25466 1.62515 0.04257 0.02595 0.01628
7 5.05591 1.24911 1.61981 0.04028 0.02733 0.01760
8 5.08799 1.25808 1.62603 0.04264 0.02633 0.01705
9 5.03289 1.24915 1.61446 0.04302 0.03293 0.01762
10 5.14292 1.22021 1.57273 0.03966 0.02572 0.01606
میانگین 5.08488 1.24748 1.60986 0.04187 0.02809 0.01715

اگر خودتان تست را تنظیم کنید مقادیر متفاوتی دریافت خواهید کرد، اما الگوهای مشاهده شده باید یکسان یا مشابه باشند. مرتب‌سازی حباب‌ها کندترین و بدترین عملکرد در بین همه الگوریتم‌ها است. در حالی که به عنوان مقدمه ای برای مرتب سازی و الگوریتم ها مفید است، برای استفاده عملی مناسب نیست.

ما همچنین متوجه شدیم که مرتب‌سازی سریع بسیار سریع است، تقریباً دو برابر سریع‌تر از Merge Sort و برای اجرا به فضای زیادی نیاز ندارد. به یاد بیاورید که پارتیشن ما مبتنی بود روی عنصر میانی لیست، پارتیشن های مختلف می توانند نتایج متفاوتی داشته باشند.

از آنجایی که Insertion Sort مقایسه‌های بسیار کمتری نسبت به Selection Sort انجام می‌دهد، پیاده‌سازی‌ها معمولاً سریع‌تر هستند، اما در این اجراها، Selection Sort کمی سریع‌تر است.

Insertion Sorts مبادله های بسیار بیشتری نسبت به Selection Sort انجام می دهد. اگر مبادله مقادیر به طور قابل توجهی زمان بیشتری نسبت به مقایسه مقادیر طول بکشد، آنگاه این نتیجه “برعکس” قابل قبول خواهد بود.

توجه داشته باشید: هنگام انتخاب الگوریتم مرتب سازی مراقب محیط باشید، زیرا بر عملکرد تأثیر می گذارد.

نتیجه

الگوریتم های مرتب سازی راه های زیادی را در اختیار ما قرار می دهند تا داده های خود را مرتب کنیم. ما 6 الگوریتم مختلف را بررسی کردیم – مرتب‌سازی حباب، مرتب‌سازی انتخابی، مرتب‌سازی درج، مرتب‌سازی ادغام، مرتب‌سازی پشته، مرتب‌سازی سریع – و پیاده‌سازی آنها در پایتون.

میزان مقایسه ها و مبادله هایی که الگوریتم انجام می دهد همراه با محیطی که کد اجرا می کند، تعیین کننده های کلیدی عملکرد هستند. در برنامه های واقعی پایتون، توصیه می شود برای انعطاف پذیری، از توابع مرتب سازی داخلی پایتون استفاده کنیم. روی ورودی و سرعت

(برچسب‌ها به ترجمه)# python



منتشر شده در 1403-01-23 21:14:09

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید