وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

هزینه های پنهان پشتیبانی از ارائه دهنده هاست زیرساخت بد

0 0
زمان لازم برای مطالعه: 5 دقیقه


بعد از ظهر چهارشنبه است و کاربران شما در حال گزارش تاخیر و خطا در سراسر سیستم هستند. شما با کانال پشتیبانی ارائه‌دهنده زیرساخت خود تماس می‌گیرید، فقط در صف بلیط قرار می‌گیرید، با یک حلقه تریاژ ربات مواجه می‌شوید و خود را برای انتظار طولانی پیش رو آماده می‌کنید.

خواه یک قطعی منطقه ای باشد یا وقفه عملکردی در حین عرضه محصول، فقدان پشتیبانی به موقع و قوی چیزی است که اغلب سازمان ها در یک نقطه با آن مواجه هستند.

اما وقتی هر دقیقه اضافی که منتظر صحبت با یک متخصص هستید به این معنی است که پلت فرم شما ضعیف عمل می کند (یا اصلاً کار نمی کند)، بیشتر از زمان در خطر است. این درآمد و شهرت است. در واقع میانگین هزینه خرابی فناوری اطلاعات تقریباً می باشد 5600 دلار در دقیقه.

این یک واقعیت جهانی است که فناوری گاهی اوقات شکست می خورد، اما آسیب پایدار به ندرت مربوط به همان خطای دیسک یا DNS است. تقریبا همیشه در مورد شکست پشتیبانی است.

شکاف پشتیبانی میزبانی زیرساخت

مدل‌های پشتیبانی زیرساخت استاندارد به‌عنوان یک سرویس (IaaS) تمایل دارند به روش‌های قابل پیش‌بینی شکسته شوند: حلقه‌های تریاژ ربات واکنش‌های حادثه را کاهش می‌دهند، تشدیدات غیرشفاف مشتریان را در تاریکی رها می‌کنند، و سیلوهای فروشنده مشتریان را بین دسته‌های صف باز می‌گردانند.

اغلب، همان مشتریان با تعطیلی های بعد از ساعت کاری یا تعطیلات آخر هفته مواجه می شوند که در زمانی که بیشتر به کمک نیاز دارند آنها را کاملاً سرگردان می کند. این تمرکز را به غول‌های بازار محدود کنید و یک مشکل دیگر، بی‌معناتر، در بازی وجود دارد: اولویت‌بندی نابرابر حساب‌ها.

یکی از رایج ترین تصورات غلط در مورد ارائه دهندگان ابر مقیاس بزرگ این است که به طور پیش فرض باید با پشتیبانی جامع ارائه شوند. اما، پشتیبانی hyperscaler به یک اندازه جیره بندی نمی شود و تنها بزرگترین کاربران صورتحساب (یا آنهایی که مایل به پرداخت برای سطوح پشتیبانی اضافی هستند) مراقبت کافی را دریافت می کنند. برای بقیه، «فقط رفع مشکل» استاندارد است، و ممکن است هفته‌ها طول بکشد تا پس از بالا بردن بلیط، پاسخی دریافت کنید – مهم نیست که مشکل چقدر مهم است. شما کسب و کار

اثر خالص این است که حوادث شما بیشتر طول می کشد، راه اندازی های شما ریسک بیشتری را به همراه دارد و تیم شما همان کاری را که ارائه دهنده هاست شما باید جذب کند، بر عهده می گیرد. همانطور که یکی از مدیران جهانی فناوری در یک پلتفرم پیشرو iGaming به servers.com گفت:

«شما به ندرت به چیزهایی که برای کسب و کارتان مهم هستند، اما برای شما حیاتی نیستند، توجه لازم را به خود جلب می کنید [hyperscale] ارائه دهنده ابر به عنوان مثال، اتصال پهنای باند بین دو منطقه فقط به این دلیل که باعث تاخیر می شود برای آنها مهم نیست. حتی اگر این تأخیر باعث از دست دادن درآمد شما شود، قرار نیست جذب شما شود روی درک آنچه اتفاق افتاده و دریافت راه حل (یا حتی یک راه حل داغ) برای مشکل.”

به طور خلاصه، تیم‌های پشتیبانی ارائه‌دهنده میزبانی به سادگی به عنوان یک توسعه دهنده تیم شما عمل نمی‌کنند: مشکل اینجاست.

وقتی حمایت تنبل به یک مشکل بزرگ تبدیل می شود

برای کسب‌وکارهایی که پس از پیمایش چالش‌های زیرساختی بدون دسترسی به پشتیبانی کافی، هنوز پیامدهای آن را تجربه نکرده‌اند، به راحتی می‌توان آن را فقط یک مرکز هزینه دیگر در نظر گرفت. اما این یکی از بزرگترین اشتباهات میزبانی زیرساخت است که مشاغل مرتکب می شوند.

وقتی نمی توان برای رفع سریع مشکلات به پشتیبانی زیرساخت اعتماد کرد، منجر به یک اثر دومینو می شود. برای مثال، اگر کسب‌وکاری هستید که برای اولین بار پلتفرم جدیدی را برای بازاریابی راه‌اندازی می‌کنید، حوادث حل‌نشده می‌توانند کل راه‌اندازی شما را به تاخیر بیندازند. اگر مجبور شدید سرورهای بیشتری را برای جبران آن بچرخانید، هزینه بیشتری نیز متحمل می‌شوید.

به طور مشابه، اگر پلتفرم ثابتی دارید که خراب می‌شود، ناتوانی در رفع سریع مشکل منجر به نارضایتی مشتری، کشش مهندسی (با جمع شدن بلیط‌های پشتیبانی کاربران شما) و ضربه منفی به حفظ کاربر می‌شود. و اگر مشکل شما به امنیت مربوط می شود، خطر قانونی و مبتنی بر انطباق نیز وجود دارد، از جمله جریمه ها و مجازات های احتمالی. به سرعت، آنچه به عنوان یک بلیط پشتیبانی شروع شد، شروع به ضربه زدن به نتیجه شما می کند.

روش محاسبه کل هزینه های یک حادثه

اما هزینه واقعی یک حادثه با پشتیبانی ضعیف چقدر است؟ بیایید یک مثال را در نظر بگیریم. تصور کنید که یک پلتفرم پخش زنده هستید. شما در آخرین رویداد ورزشی زنده خود دچار قطعی 45 دقیقه ای شدید. درآمد شما توسط تبلیغات و اشتراک‌های پرداخت به ازای مشاهده تامین می‌شود و وقتی پخش‌ها با شکست مواجه می‌شوند، پیامدهای اجتماعی سنگینی به همراه خواهد داشت.

بیایید تعدادی اعداد را وصل کنیم تا ببینیم این دوره از کار افتادگی ممکن است برای شما چقدر هزینه داشته باشد:

فرض کنید که رویداد شما به طور متوسط ​​200000 دلار درآمد ساعتی ایجاد می کند و شما با قطعی موثر 0.75 ساعت مواجه می شوید. یعنی 150000 دلار درآمد از دست رفته. اگر به 15 مهندس و سه مدیر برای حل این حادثه نیاز باشد و به ترتیب 120 و 160 دلار در ساعت صورتحساب دریافت کنند، این چیز دیگری است. 5700 دلار روی رسیدگی به حادثه. این قطعی همچنین باعث پیامدهای اجتماعی شدید شد، بنابراین مهندسان شما 60 ساعت اضافی را صرف می کنند روی پیگیری های پس از حادثه 7200 دلار هزینه دارد.

شما 90000 دلار بابت بازپرداخت و اعتبار مشتری مدیون هستید، که شامل 120 ساعت کارمند پشتیبانی اضافی با هزینه 40 دلار در ساعت برای مدیریت است که در مجموع 94800 دلار روی اصلاح مشتری. شما همچنین به تبلیغ کنندگان شریک خود مدیون هستید 30000 دلار کالای ساخت برای برداشت های از دست رفته، صرف شده است 4200 دلار روی رعایت و گزارش (30 ساعت با 140 دلار در ساعت)، و برای دو ماه ثبت نام کنید ظرفیت محاسباتی مازاد 40000 دلار هزینه دارد.

در نهایت، شما پیش بینی می کنید که متحمل خواهید شد 144000 دلار در ریزش احتمالی (مبتنی بر روی 12 دلار در ماه ARPA، یک برآورد کاهش دلتای ناشی از حادثه 0.5٪ در ماه و میانگین مدت پرداختی باقیمانده شش ماهه).

کل هزینه حادثه است 475900 دلار.

در حالی که این اعداد فقط به عنوان یک مثال عمل می کنند، نشان می دهد که وقتی یک حادثه حل نشده (حتی فقط برای 45 دقیقه) چقدر سریع هزینه ها افزایش می یابد و هزینه اضافی که حتی پس از حل شدن یک حادثه به دنبال دارد.

اگر قبلاً این نوع تمرین را انجام نداده‌اید، ارزش آن را دارد که شماره‌های خود را وصل کنید تا ببینید یک قطعی مشابه چقدر می‌تواند برای کسب‌وکار شما هزینه داشته باشد.

برای محاسبه هزینه کل یک حادثه حل نشده، مجموع موارد زیر را محاسبه کنید:

  • درآمد ناشی از این حادثه از دست رفت
    Lost revenue = revenue per hour x business hours down
  • بهره وری به دلیل این حادثه از دست رفت
    Lost productivity = number of affected staff x loaded rate per hour x hours disrupted
  • هزینه رسیدگی به حادثه
    Incident handling = role involved in incident handling x rate per hour x hours
  • هزینه تعمیر مشتری
    Customer remediation = value of refunds/ credits + extra support hours x support rate
  • هزینه های قابل انتساب به ریزش
    Impacted paying customers x average revenue per user (ARPA) x churn rate x remaining contract months
  • هر گونه پرداخت مبلغ یکجا اضافی که در نتیجه مستقیم حادثه ایجاد شده باشد



منتشر شده در 1404-12-04 13:32:03

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید