گفتگو با بهنام طلعتی معمار زیرساختهای ابری؛ نگاهی به چالشها و آینده DR

در گفتوگویی اختصاصی با بهنام طلعتی، تیملید زیرساختهای ابری آسیاتک کلود، به بررسی نقش و جایگاه Disaster Recovery (DR) در معماریهای ابری، چالشهای امنیتی، و آینده این حوزه با ورود هوش مصنوعی و اتوماسیون پرداختیم. آنچه در ادامه میخوانید، حاصل این گفتوگوی تخصصی است.
نقش Disaster Recovery در معماریهای ابری امروز
بهنام طلعتی در ابتدای این گفتگو تأکید کرد که نقش بازیابی بحران یا DR در فضای فناوری اطلاعات امروز از یک راهکار جانبی برای مواقع اضطراری به یک جزء اصلی معماری IT و Cyber Resilience ارتقا یافته است. به گفته او، دیگر نمیتوان DR را یک سرویس اختیاری دانست، بلکه بخشی از استراتژی کلان سازمانها برای تداوم کسبوکار محسوب میشود.
وی در ادامه توضیح داد: «تفاوتهای مهمی میان پیادهسازی DR در محیطهای سنتی و محیطهای کلود وجود دارد. مقیاسپذیری بالا، هزینه کمتر، وجود ریجنهای مختلف و تخصص تیمهای ارائهدهنده کلود باعث شده است که اجرای DR در فضای ابری کارآمدتر و انعطافپذیرتر باشد.»
بهنام بزرگترین چالش سازمانها را نبود نقشه جامع DR و عدم توجه به اولویتبندی سرویسها دانست. او تأکید کرد بدون یک استراتژی دقیق، حتی بهترین ابزارهای ابری هم نمیتوانند موفقیت کامل را تضمین کنند.
تهدیدهای امنیتی در اجرای DR
به گفته او، معیارهایی مانند RPO (Recovery Point Objective)، RTO (Recovery Time Objective)، BCP (Business Continuity Plan) و Tiering برای هر سرور از مهمترین شاخصها برای سنجش آمادگی و کارایی یک برنامه DR هستند.
طلعتی معتقد است که در فناوریهای موجود، latency نباید از ۵ میلیثانیه بیشتر باشد، زیرا در غیر این صورت احتمال از دست رفتن دادهها بالا میرود. به همین دلیل، انتخاب محل مناسب دیتاسنتر و در نظر گرفتن موقعیت جغرافیایی در طراحی DR اهمیت بسیار زیادی دارد.
وی سه تهدید عمده را برای موفقیت DR در زیرساختهای کلود پر اهمیت میداند:
- حملات باجافزاری (Ransomware) که حتی میتوانند بکاپها و snapshotها را رمزنگاری کرده و کل استراتژی DR را بیاثر کنند.
- حملات DDoS که دسترسی به محیط کلود مقصد DR را مختل میسازند.
- عدم ایزوله بودن محیط DR که میتواند باعث گسترش همزمان حمله از محیط اصلی به محیط DR شود.
بهنام در ادامه به مدل Shared Responsibility اشاره کرد و گفت: «یکی از دلایل اصلی شکستهای DR، پیکربندی نادرست است. زمانی که مسئولیتها میان ارائهدهنده کلود و سازمان بهطور شفاف تقسیم نشود، نقاط ضعف امنیتی بروز میکند. این مدل کمک میکند وظایف مشخص شده و چیزی از قلم نیفتد.»
مزایا و ریسکهای Multi-Cloud و Hybrid Cloud
به اعتقاد او، استفاده از رویکردهای چندابری و هیبریدی باعث کاهش Single Point of Failure و انعطافپذیری بیشتر در استراتژی DR میشود. اما همزمان، پیچیدگی طراحی و ناسازگاری احتمالی ابزارها و APIهای ارائهدهندگان مختلف، ریسکهایی است که باید مدیریت شود.
طلعتی تأکید کرد: «برای رسیدن به RTO و RPO پایین باید از Replication همزمان و Snapshot مداوم استفاده کرد. اما این موضوع ریسک امنیتی دارد. راهکار پیشنهادی این است که برای سرویسهای حیاتی، Replication نزدیک به Real-Time اجرا شود، در حالی که نسخههای قدیمی به شکل Immutable نگهداری شده و لایههای مختلف رمزنگاری نیز اعمال شوند.»
اهمیت تستهای دورهای
به گفته بهنام طلعتی مدیر بهش ، بهترین رویکرد برای اطمینان از آمادگی در شرایط بحران، اجرای سناریوهای متنوع و تستهای دورهای دستکم دو بار در سال است. این تستها باید روی بستر واقعی صورت گیرند تا نقاط ضعف بهموقع شناسایی و اصلاح شوند.
آینده DR با هوش مصنوعی و اتوماسیون
طلعتی آینده بازیابی بحران در کلود را روشن توصیف کرد و گفت: «DR به سمت پیشبینیگر شدن و خودکار شدن حرکت میکند. با استفاده از هوش مصنوعی و اتوماسیون، این فرآیند از یک اقدام واکنشی به یک سرویس پویا و مداوم تبدیل خواهد شد.»
وی در پایان توصیه کرد: «سازمانها باید ابتدا نیازمندیهای کسبوکار خود را مشخص کنند، مدل Shared Responsibility را بهخوبی درک کرده و یک برنامه جامع تداوم کسبوکار (BCP) طراحی نمایند. تنها در این صورت میتوان یک استراتژی DR امن و اثربخش را پیادهسازی کرد.»




