از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
مشکل زیرساخت در پشت مشکلات عملکرد SaaS
سرفصلهای مطلب
در یک نگاه
-
داشبوردهای شما افزایش تاخیر را نشان می دهند روی صبح سهشنبهای که به نظر شبیه هر صبح سهشنبهای دیگر است
-
لایه پایگاه داده، وابستگی های خارجی، و کد برنامه همگی تمیز بررسی می شوند
-
یک هفته بعد، ردیابی مشکل به حجم کاری که هرگز نمیدانستید سختافزار شما را به اشتراک میگذارد، میشود
-
جلوه های همسایه پر سر و صدا در گزارش های شما نشان داده نمی شوند زیرا در لایه ای رخ می دهند که نمی توانید ببینید
-
سوال این نیست که آیا معماری شما سالم است یا خیر. این به این بستگی دارد که آیا ابر شما به شما محیط اطراف خود را دید
وقتی مشکل عملکرد در کد شما نیست
پنجره ارسال صبحگاهی شما جایی است که محصول ذخیره خود را به دست می آورد. سفارشها از بین میروند، برچسبهای شرکت مخابراتی تولید میشوند، و موجودی در مکانها همگامسازی میشود، قبل از اینکه اولین راننده آن را ترک کند. نظارت کسی برای پس از مرگ، افزایش ترافیک نیست. یک صبح سهشنبه معمولی، نمایه باری که آنقدر بدون حادثه اجرا میکنید که هیچکس آن را به عنوان یک خطر تلقی نمیکند.
این پنجره زمانی است که زمان پاسخ شروع به بالا رفتن می کند.
فرض اول: چیزی که اخیراً مستقر شده است. داشبوردها را میکشید، تأخیر را در چندین سرویس مشاهده میکنید و تاریخچه ارتکاب هفته گذشته را بررسی میکنید. هیچ چیز واضحی نیست سرویسها پاسخ میدهند، پرسشها در حال اجرا هستند. گزارشها زمانهای پاسخدهی بالا را در سراسر صفحه نشان میدهند، بدون منبع واضح. این الگوی سختتر است زیرا هیچ چیز در آن به چیزی اشاره نمیکند که بتوانید فوراً آن را جدا کرده و آن را برطرف کنید.
بعدی: لایه پایگاه داده. نسبتهای خواندن/نوشتن را میکشید، در لاگهای پرس و جو کند میگردید، و چند نامزد پیدا میکنید، اما هیچ چیز قطعی نیست. استفاده از استخر اتصال بالا است. شما پیکربندی را تنظیم می کنید و فضای سر را اضافه می کنید. اعداد کمی بهبود یافتند، اما زمان پاسخ همچنان بالا بود.
بنابراین به سمت وابستگی های خارجی می روید. زمانهای پاسخ API شرکا، محدودیتهای نرخ شخص ثالث، تأخیرهای شبکه و ردیابیها. هیچ چیز غیرعادی نیست خدمات اصلی سالم هستند. تأخیر از بیرون پشته نمی آید.
تا زمانی که تیم هر کدام دو بار توضیحات واضح را پوشش داده است، شما چندین بار تشدید شده اید. تدارک بیش از حد لایه برنامه، تأخیر قابل توجهی ایجاد نکرده است. نمایه سازی چیزی قابل عمل ظاهر نشده است. بار با ماه های قبل تفاوت مادی ندارد.
لایه ای که تیم شما نمی تواند ببیند
هنگامی که کسی آنها را به پنجره زمان طولانی تری می کشد و آنها را با آنها می پوشاند، در نهایت چه چیزی را نشان می دهد. hostسطح استفاده از داده ها، این است که تخریب هیچ ارتباطی با ترافیک شما ندارد. آن را با یک پنجره خاص از روز ردیابی می کند، پنجره ای که با بارهای کاری دیگر مطابقت دارد روی همان سرور اصلی که در همان ساعت به اوج خود می رسد.
یک هفته اشکال زدایی برنامه. مشکل در لایه ای بود که تیم نمی توانست ببیند.
این نوردهی خاصی است که hyperscale برای پلتفرم هایی با پنجره های اوج مکرر ایجاد می کند: عملکرد شما توسط معماری یا تصمیمات مهندسی شما تعیین نمی شود. مشخص می شود که چه چیز دیگری در حال اجرا است روی همان سخت افزار مجازی سازی شده در همان زمان، در محیطی که هیچ دید و راهی برای تأثیرگذاری ندارید.
سوالی که از چنین اتفاقی پیش می آید این نیست که “چگونه برنامه را تعمیر کنیم؟” مهم این است که آیا ابر شما روی لایه ای که این اتفاق افتاده است به شما دید و کنترل می دهد یا خیر. اگر تعهدات SLA را به مشتریان میدهید، قبل از شروع رویداد اوج بعدی، ارزش آزمایش فشار را دارد.
منتشر شده در 2026-06-26 19:16:03

