Backup And Archive

ادمین ۱۴ خرداد ۱۳۹۹آخرین به روز رسانی: ۱۰ دی ۱۴۰۱

۰ 385 خواندن این مطلب 13 دقیقه زمان میبرد

نحوه عملکرد Backup

در عملیات بکاپ گیری ۴ جزء کلیدی زیر وجود دارند:

Backup Server (BS)

Backup Client (BC)

Storage Node (SN)

Backup Device (BD)

نقش Backup client جمع کردن دیتا و ارسال آن برای storage node است. Agent مربوط به BC را بر روی سرورهایمان نصب می کنیم. این Agent تمامی tracking information ها را نیز برای Backup Server ارسال می کند.

نقش Backup Server مدیریت عملیات بکاپ گیری و نگهداری Backup Catalog است که شامل اطلاعاتی در رابطه با پیکربندی بکاپ (چه ساعتی اجرا شود، چه دیتایی بکاپ گرفته شود و … ) و متادیتای بکاپ ها است.

نقش Storage Node سازماندهی دیتاها بر روی خود و ذخیره دیتا بر روی BD است. در بیشتر پیاده سازی ها، SN بر روی BS قرار گرفته است.

Backup device که می تواند یک سخت افزاری مانند tape library باشد یا بصورت مستقیم و یا از طریق شبکه به SN وصل شده است. زمانی که SN دیتا را بر روی BD ذخیره می کند، tracking information ها را برای BS ارسال می کند. این اطلاعات بیشتر برای recovery استفاده می شود.

رنج بزرگی از تجهیزات ذخیره سازی وجود دارد مانند tape، disk و virtual tape library . همچنین امروزه می توان بر روی cloud storage نیز بکاپ گرفت که با نام BaaS ارائه می گردد.

عکس 1

عملیات بکاپ گیری معمولا توسط بکاپ سرور آغاز می گردد البته در بعضی از سناریوها BC نیز می تواند آنرا آغاز نماید. این عملیات بر اساس برنامه زمان بندی شده بکاپ گیری از client های مختلف، انجام می گیرد. تمامی هماهنگی ها بین اجزای مختلف پروسه بکاپ، توسط بکاپ سرور انجام می شود. بکاپ سرور هدایت های لازم را به BC برای جمع آوری دیتاها از client مربوطه و ارسال آنها به سمت SN ارائه می دهد. بعد از اینکه بکاپ دیتا بطور کامل برای SN ارسال شد، BC ، متادیتای اطلاعات را که حاوی اطلاعاتی مانند تعداد فایل ها، نام فایل ها و غیره است را برای بکاپ سرور ارسال می کند. سپس SN بعد از سازماندهی دیتاهای دریافت شده آنها را برای BD ارسال می کند و آن نیز اطلاعات دیگری از متادیتا مانند جای دیتاها در BD، زمان بکاپ و غیره را برای بکاپ سرور ارسال می کند. بکاپ سرور نیز Backup catalog خود را با این اطلاعات دریافتی بروزرسانی می کند. دیتا می تواند از سمت BC به سمت BD از طریق شبکه LAN یا SAN ارسال شود.

دو روش بکاپ گیری بر اساس حالت نرم افزار در زمان بکاپ گرفتن با نام های Cold Backup و Hot Backup وجود دارد.

در حالت Hot Backup یا همان Online Backup، در زمان بکاپ گیری، نرم افزار در حالت اجرا قرار دارد و کاربران به دیتاهای خود دسترسی دارند. این روش بسیار چالش برانگیز است زیرا در زمانی که بکاپ گرفته می شود دیتاها فعال و در حال تغییر هستند. در حالت عادی اگر یک فایل باز باشد امکان بکاپ گرفتن آن وجود ندارد. در این حالت به یک open file agent نیاز است که بتوان از این نوع فایل ها بکاپ گرفت. عیب این روش در اینست که این agent ها بر روی کارائی نرم افزارها تاثیر منفی می گذارند.

در روش Cold Backup یا همان Offline Backup، نرم افزار باید در زمان بکاپ گیری از کار بیافتد و عیب این روش نیز در همین مورد است که در زمان بکاپ دسترسی کاربران کاملا قطع می شود.

انواع روش های بکاپ گیری

روش های مختلفی برای بکاپ گیری وجود دارد که با توجه به نیازمندی های کسب و کار و همچنین میزان RTO/RPO مورد نیاز، می بایست روش مناسب را پیدا کرد. البته در بیشتر مواقع سازمان ها از ترکیب این روش ها برای تامین نیازمندی های خود استفاده می کنند.

Full Backup

همانطور که از نام آن پیداست در این روش از تمامی دیتا بکاپ تهیه می شود. معمولا از این روش بصورت دوره ای استفاده می شود زیرا فضای بسیار زیادی از استوریج به خود اختصاص می دهد. ریکاوری دیتا در این روش از سرعت زیادی برخوردار است.

Incremental Backup

در این روش تنها از دیتای تغییر یافته نسبت به روز قبل بکاپ گرفته می شود. این روش فضای بسیار کمی را به خود اختصاص می دهد اما عیب آن سرعت پایین در ریکاوری دیتا می باشد. این عملیات از طریق Changed block tracking انجام می شود.

Cumulative (differential) backup

در این روش از دیتای تغییر یافته نسبت به آخرین full backup، بکاپ گرفته می شود. این روش فضای بیشتری را نسبت به روش قبل به خود اختصاص می دهد اما در ریکاوری سرعت آن بالاتر است زیرا هیچ گاه به بیشتر از دو بکاپ احتیاج نخواهد داشت.

Synthetic backup

راه دیگری که می توان یک فول بکاپ ساخت، همین روش است. بدین شکل عمل می کند که تمامی دیتای فول بکاپ را گرفته و سپس آن را با دیتای incremental و یا cumulative ترکیب کرده و یک فول بکاپ بروزرسانی شده ایجاد می کند بدون اشغال هیچگونه منابع I/O و شبکه از سیستم.

Incremental forever backup

در این روش دیگر بصورت دوره ای فول بکاپ گرفته نمی شود و تنها یک بکاپ گرفته شده و از آن به بعد تا ابد بکاپ incremental گرفته خواهد شد و بصورت اتوماتیک با فول بکاپ ترکیب می شود به گونه ای که دیگر نیازی به گرفتن فول بکاپ نباشد.

نرم افزار بکاپ و سیستم مجازی سازی

امروزه معمولا نرم افزارهای کسب و کار بر روی ماشین های مجازی نصب می شوند. این ماشین های مجازی بر روی یک سرور فیزیکی و یا یک کلاستر قرار گرفته اند. یک سیستم مرکزی مانند vCenter نیز مدیریت این محیط مجازی را برعهده دارد. پس در نتیجه برقراری ارتباط بین نرم افزار بکاپ سرور و نرم افزار مرکزی محیط مجازی، از ضروریات هر سازمانی می باشد.

وقتی که سازمان ها به سمت تکنولوژی های پلتفرم ۳ حرکت می کنند، مهم است که نرم افزار بکاپ بتواند با نرم افزارهای مختلف کسب و کار integrate شود تا بتواند از دیتای آنها نگهداری نماید. به این قابلیت Application Awareness می گویند.

همچنین خیلی مهم است که عملیات بکاپ و ریکاوری بصورت اتوماتیک انجام شود بدین صورت که اگر ماشین مجازی جدیدی ساخته شود بصورت اتوماتیک در بکاپ اضافه گردد و به همان شکل اگر ماشینی حذف شد، از سیستم بکاپ نیز پاک شود. یک نرم افزار بکاپ باید این قابلیت را در اختیار کاربران خود بگذارد که ریکاوری را در دو سطح VM و فایل انجام دهد تا با توجه به نیاز یکی از این دو انتخاب شود.

روش های بکاپ گیری:

۱/ Agent-based backup

در این رویکرد یک Agent یا همان Client بر روی ماشین مجازی یا سرور فیزیکی نصب می گردد و دیگر از فایل های تنظیمات ماشین مجازی بکاپ گرفته نمی شود. عیب این روش در اینست که Agent در هنگام بکاپ گرفتن بر روی application server بار زیادی ایجاد می کند که در رابطه با نرم افزارهای بسیار مهم، کاهش کارایی را در هنگام عملیات بکاپ خواهیم داشت.

برای مقابله با این چالش باید کاری کنیم که عملیات بکاپ به جای اینکه بر روی ماشین اصلی بار ایجاد کند، بصورت آفلاین از روی یک پراکسی سرور از آن ماشین بکاپ بگیرد. با استفاده از رویکرد image-based می توانیم به این خواسته دست پیدا کنیم.

عکس 2

۲/ Image-based backup

در این رویکرد از دیسک مجازی و فایل پیکربندی آن ماشین، کپی گرفته می شود. این نوع از بکاپ برای بازگردانی کل ماشین مجازی بسیار مناسب است، هر چند که می توان از طریق آن اقدام به بازگردانی فایل تکی نیز کرد. در این رویکرد دیگر نیازی به نصب Agent بر روی ماشین های مجازی نیست و عملیات بکاپ توسط یک پراکسی بکاپ سرور انجام می شود که در واقع نقش همان Backup Client را برای ما بازی می کند. نحوه عملکرد آن بدین گونه است که پراکسی سرور یک دستور به vCenter ارسال می کند که از ماشین مجازی مربوطه یک Snapshot گرفته شود و آنرا بر روی پراکسی سرور که در همان vCenter قرار دارد mount کند. سپس بصورت آفلاین از آن بکاپ گرفته می شود.

عکس 3

Recovery-in-place (Instant VM Recovery)

اصطلاحی است که بر اساس آن در هنگام ریکاوری کردن برای افزایش سرعت، ماشین را بصورت مستقیم بر روی بکاپ سرور بالا آورده و سپس بعد از زیر بار رفتن سرویس مربوطه، آنرا به استوریج اصلی migrate می کنیم.

۳/ NDMP-based backup

پروتکل NDMP که مخفف Network Data Management Protocol است مبتنی بر TCP/IP و مخصوص محیط های NAS یعنی file level طراحی شده است و صرف نظر از نوع سیستم عامل از فایل سیستم های NFS و یا CIFS بکاپ می گیرد. در این روش دیگر نیاز نیست دیتا از سرور مربوطه و بر روی شبکه منتقل گردد و بار اضافه بر روی سرور ایجاد کند، بلکه دیتا مستقیم از روی NAS head به Backup device ارسال می شود و تنها متادیتا را از روی شبکه به بکاپ سرور ارسال می کند. با توجه به اینکه روش NDMP مخصوص بکاپ گیری از NAS است، تمامی attribute های فایل ها نیز با توجه به نوع فایل سیستم که می تواند NFS باشد یا CIFS، بدرستی منتقل می شود (برای مثال انتقال فایل ها با تمام دسترسی ها و مجوزهای مربوطه)

عکس 4

مطابق شکل NDMP Client که بر روی بکاپ سرور نصب است، به NDMP Server که همان NAS Head می باشد می گوید که عملیات بکاپ را آغاز کند. NAS Head نیز شروع به کپی دیتا از استوریج خود به روی Backup device می کند.

۴/ Direct primary storage backup

بر اساس این رویکرد دیتا مستقیما از روی استوریج در Backup device و بر روی بستر SAN بکاپ گرفته می شود. دیگر در این روش نیازی به بکاپ سرور نیست و تنها بر روی ماشین ها و یا سرورهای اختصاصی خود یک Agent نصب می نماییم.

در این روش اگر از یک سرور اختصاصی به عنوان بکاپ سرور استفاده می کنیم، می بایست آنرا به San Switch وصل کنیم تا بتواند بصورت فیزیکی Lun های روی استوریج را ببیند. سپس بدون نیاز به نصب Agent و بصورت مستقیم از روی شبکه SAN بکاپ گرفته می شود و پهنای باندی از شبکه اشغال نمی شود.

عکس 5

Deduplication چیست؟

با رشد روز افزون دیتا، سازمان ها با چالش هایی در محافظت از آنها روبرو هستند. معمولا میزان زیادی از دیتای تکراری همیشه بکاپ گرفته می شود که باعث افزایش قابل ملاحظه window size بکاپ و در ادامه، مصرف غیر ضروری منابعی مانند فضای استوریج و پهنای باند شبکه می شود. همچنین بکاپ گرفتن از مقدار زیادی از دیتا در سایت های ریموت برای هدف تامین DR نیز دارای زحمت زیاد است که به پهنای باند زیادی نیز نیاز دارد. قابلیت data deduplication راهکاری را برای سازمان ها فراهم می کند که آنها را قادر می سازد بر اینگونه از چالش ها در بکاپ غلبه کنند.

نحوه عملکرد آن اینگونه است که دیتا به قطعات کوچکتری به نام بلاک یا chunk تقسیم می شوند، برای هر بلاک یک امضای دیجیتال یا hash value ساخته و آنرا index می کند. از آن به بعد هر بلاکی که تشخیص داده شود تکراری است بجای ذخیره مجدد آن، یک pointer به بلاک اصلی در آن اضافه می شود.

میزان اثربخشی این قابلیت با یک نرخ تعیین می گردد. برای مثال اگر ۲۰۰ گیگ دیتا داشته باشیم که بعد از انجام این عملیات به ۲۰ گیگ کاهش پیدا کرده است بصورت Ratio 10:1 نمایش داده می شود. شرکت های مختلف نرخ های متفاوتی را برای این مساله ارائه می دهند که تعیین این نرخ ها بر اساس پارامترهای مختلفی است.

در بسیاری از مواقع سازمان ها عملیات deduplication را در سطح استوریج اصلی خود انجام می دهند. اینکار باعث می شود حجم زیادی از فضای استوریج بیهوده استفاده نشود ولی عیب آن در اینست که با توجه به اینکه این عملیات منابعی از استوریج را مصرف می کند، باعث کاهش کارایی در سیستم خواهد شد.

Cloud-based Backup

با توسعه تکنولوژی و حرکت به سمت پلتفرم ۳، میزان کمی و کیفی دیتا به میزان زیادی افزایش یافته است که نگهداری آن زحمت و هزینه بسیار زیادی را برای شرکت ها به همراه دارد. این انفجار دیتا چالش هایی را نیز در زمینه بکاپ و بازیابی دیتا به همراه دارد. Cloud-based backup و یا همان Backup as a service راهکار بسیار مناسب برای غلبه بر این چالش بسیار جدی می باشد.

سرویس بکاپ یکی از سرویس های بسیار مهمی است که شرکت های ارائه دهنده خدمات پردازش ابری بر اساس درخواست به مشتریان خود عرضه می کنند. با استفاده از این روش دیگر سازمان ها نیازی به سرمایه گذاری بالا در تجهیزات IT ندارند و در نتیجه ماهیت هزینه ها از CAPEX به سمت OPEX تغییر می کنند. شما حتی می توانید بر اساس میزان استفاده از منابع (Pay-per-use) اقدام به پرداخت نمایید.

در این روش برای بازگردانی دیتا نیز دو راه وجود دارد. در راه اول که web-based restore نام دارد، دیتای درخواستی جمع شده و به سمت سروری که cloud backup agent بر روی آن نصب است ارسال می گردد. این روش برای زمان هایی مناسب است که دارای پهنای باند مناسبی هستید. اما اگر می خواهید میزان زیادی از اطلاعات را بازگردانی کنید و پهنای باند مناسبی نیز ندارید، بهتر است از روش Backup media استفاده نمایید که از طریق آن دیتای درخواست شده جمع شده و بر روی یک مدیا مانند DVD رایت شده و برای شما ارسال می گردد.

روش های رایج Cloud-based Backup

Local Backup Service

این روش زمانی مناسب است که سرویس دهنده شما علاوه بر سرویس بکاپ، سرویس هایی مانند Compute System و SaaS را نیز ارائه دهد و شما نیز از این سرویس ها استفاده نمایید. در این رویکرد عملیات بکاپ در داخل مرکز داده و توسط ارائه دهنده سرویس انجام می شود.

Remote Backup Service

در این رویکرد مشتریان هیچ بکاپی را بصورت لوکال نمی گیرند بلکه همه ی بکاپ ها برای یک ارائه دهنده خدمات بکاپ ارسال می گردد. در این روش می بایست یک Backup Agent بر روی سرورهایی که می خواهید از آنها بکاپ تهیه نمایید، نصب کنید. بعد از نصب، این Agent است که یک ارتباط با جایی که می بایست بکاپ در آن ریخته شود ایجاد کند.

Replicated Backup Service

این گزینه برای مشتریانی است که بصورت لوکال بکاپ می گیرند اما در عین حال نمی خواهند هزینه ای برای مالکیت یک سایت ریموت برای DR پرداخت کنند. این دسته از مشتریان یک Replicated backup service گرفته و بین بکاپ لوکال خود و سرویس مربوطه یک replication ایجاد می نمایند.

Mobile Device Backup

با توجه به رویکرد BYOD در سازمان های امروزی و میزان اطلاعات مهمی که بر روی گوشی های موبایل و یا تبلت ها وجود دارد، بکاپ گرفتن از اطلاعات این نوع از سخت افزارها نیز در دستور کار بسیاری از سازمان ها قرار گرفته است. برای دستیابی به این هدف می بایست بر روی این سخت افزارها، نرم افزار Backup Client مربوطه را نصب کرد تا از این طریق بتوان بصورت دوره ای از دیتای آنها بکاپ تهیه و بر روی سرویس cloud قرار داد. همچنین بسیار مهم است که این دیتا بصورت encrypt شده ارسال شود و همچنین با استفاده از روش های فشرده سازی، deduplication و incremental backup نیز می توان میزان دیتای ارسالی را بشکل قابل توجهی کاهش داد تا از این طریق هزینه استفاده از پهنای باند را نیز کاهش داد.

البته انجام اینکار چالش های بسیار زیادی را به همراه خواهد داشت که برای غلبه بر آنها نیاز به اتخاذ تصمیمات و سیاست های دقیق و منظم از طرف سازمان است.

Data Archiving

به پروسه مشخص کردن و انتقال دیتاهای غیرفعال کسب و کار به tier های با دیسک های کم سرعت استوریج برای نگهداری در زمان های طولانی و استفاده در آینده، می گویند. سازمان ها سیاست های مختلفی را برای تعیین این نوع از دیتا در نظر می گیرند که این فرآیند بصورت اتوماتیک انجام شود. سازمان ها از این روش استفاده می کنند تا هزینه استوریج اصلی خود را به میزان قابل توجهی پایین بیاورند و همچنین حجم بکاپ را نیز کاهش دهند.

در بررسی lifecycle اطلاعات، دیتا ساخته می شود، دسترسی داده می شود و بارها تغییر می یابد. همانطور که سن این دیتا بالا می رود میزان احتمال تغییر در آن کمتر می شود و در نهایت ثابت می شود اما دسترسی به آن از طریق نرم افزارها و کاربران همچنان ادامه خواهد داشت. به این نوع از دیتا fixed content می گویند که هر سال بیش از ۹۰ درصد رشد دارد.

معماری آرشیو دارای سه جزء کلیدی است. جزء اول Archiving Agent، نرم افزاری است که بر روی سرورهایی مانند فایل سرور یا ایمیل سرور نصب می گردد و وظیفه اسکن و آرشیو دیتا بر مبنای سیاستی که در Archive Server تعیین شده است را دارد. بعد از اینکه مشخص شد چه دیتایی می بایست آرشیو شود، آنها را برای جزء دوم یعنی Archive Storage device ارسال می کند. بعد از انتقال، دیتا در استوریج اصلی با یک stub file که حجم بسیار کمی دارد جایگزین می شود. این فایل شامل آدرس فایل مربوطه در استوریج آرشیو می باشد. وقتی که یک کاربر تلاش می کند به یکی از این فایل های آرشیو شده دسترسی پیدا کند، این stub file است که تلاش می کند فایل اصلی را از استوریج آرشیو، دریافت کند. جزء سوم Archiving Server ، نرم افزاری است که مدیر شبکه تمامی سیاست های آرشیو را در آن تعیین می کند. این سیاست ها می تواند بر اساس سایز فایل، نوع فایل و یا زمان ساخت، تغییر یا دسترسی به فایل باشد. وقتی که مشخص شد چه دیتایی باید آرشیو شود، سرور یک index از فایل های انتقالی در خود نگاه می دارد. با استفاده از این ایندکس ها کاربران قادرند از طریق ابزار تحت وب اقدام به جستجو و یا دریافت فایل های آرشیو شده کنند.

در گذشته از مدیاهایی مانند CD ، DVD یا Tape برای آرشیو fixed content استفاده می کردند ولی این روش ها کارایی لازم را ندارند. امروزه نوع مخصوصی از استوریج های object based به نام CAS (Content Addressed Storage) برای همین هدف طراحی شده اند. در این نوع از استوریج تمامی دیتاها به همراه attribute های همراه آن بصورت Object ذخیره می گردند که یک آدرس منحصربه فرد نیز دارند. این نوع از آدرس دهی نرم افزارها را از دانستن آدرس فیزیکی دیتاها در استوریج بی نیاز می کند که باعث بالاتر رفتن کارایی سیستم می شود. البته برای استفاده از این آدرس ها می بایست از CAS API در سمت Application server ها استفاده کرد.

همچنین امروزه بسیاری از سازمان ها از cloud-based Archiving نیز بشکل قابل توجهی برای آرشیو کردن دیتا استفاده می کنند زیرا نه تنها دیگر نیاز به خرید تجهیزات آرشیو نداریم بلکه می توانیم با توجه به نیاز، حجم فضای خود را نیز به راحتی از هر جایی افزایش دهیم. علاوه بر این با توجه به نوع سرویس انتخابی (Pay-as-you-go) می توانیم بر اساس میزان استفاده اقدام به پرداخت شارژ نماییم.

معرفی محصول

EMC Data Domain

این محصول بسیار قدیمی توسط شرکتی با همین نام عرضه شد که هدف اصلی آن انتقال بکاپ از tape های قدیمی به دیسک درایوهای جدید بود و همچنین بعدها این شرکت در زمینه تکنولوژی data deduplication شناخته شده بود. سپس شرکت emc توانست با خرید اکثریت سهام این شرکت آنرا به مالکیت خود در آورد. این محصول که به شکل یک appliance عرضه شد، سهم بزرگی از بازار بکاپ را به خود اختصاص داد و در سال های اخیر نیز جای خود را به نسل بعدی یعنی PowerProtect داده است.

EMC PowerProtect

این محصول بسیار قدرتمند بصورت نرم افزاری و سخت افزاری عرضه شده است که می تواند سرویس cloud نیز ارائه دهد. در قسمت نرم افزاری می تواند جایگزین مناسبی برای نرم افزارهای BackupExec و NetBackup باشد و در بخش appliance نیز جایگزین data domain شده است. در محیط های Multi-Cloud بسیار کاربرد دارد و با vmware نیز به بهترین شکل integrate می شود. در مدل های سخت افزاری جدید این محصول از دیسک های ssd و با density بسیار بالا استفاده شده است.

EMC Centera

این محصول در سال ۲۰۰۳ به بازار معرفی شد و به عنوان اولین استوریج WORM یا Write-Once-Read-Many شناخته شد. این استوریج از دیسک های SATA استفاده می کند. در مدت کوتاهی بعد از معرفی به دلیل کارایی بسیار زیاد به عنوان انتخاب اول بسیاری از شرکت ها برای آرشیو دیتا تبدیل شد.

EMC ECS

EMC Avamar

EMC Spanning

EMC Carbonite

برچسب ها