ISMدانشنامهمجازی سازی

مقدمه ای بر Information Storage

رشد دنیای دیجیتال

ما در دنیای دیجیتال زندگی می کنیم، این دنیای دیجیتال بوسیله نرم افزار ساخته و تعریف شده است و در آن مقدار عظیمی از دیتای دیجیتال، بوسیله نرم افزار بصورت همزمان تولید، جمع آوری، ذخیره سازی و تجزیه و تحلیل می شوند. در تحقیقی که در سال ۲۰۱۴ توسط IDC انجام گرفت تخمین زده شد که سالانه تقریبا ۴.۴ تریلیون گیگابایت دیتا، در دنیای دیجیتال تولید می شود که هر دو سال نیز مقدار آن دو برابر می شود. با یک تخمین سر انگشتی به عدد ۴۴ تریلیون گیگابایت در سال ۲۰۲۰ خواهیم رسید. عدد بسیار بزرگ و شگفت انگیزیست. حالا متوجه می شوید که با دنیای بسیار بزرگی مواجه هستید که با روش های سنتی قادر به مواجه شدن با آن نخواهیم بود. این حجم از دیتا از منابع مختلفی می آیند، از زندگی روزمره افراد و کارهای آنلاین و سازمان ها بگیرید تا بسیاری از وسایل هوشمند امروزی که به اینترنت متصل می گردند مانند یخچال، ماشین ظرف شویی و حتی لامپ های خانه. 

اهمیت اطلاعات در سازمان ها بسیار زیاد است و حجم این اطلاعات با نرخ های عجیب و غریبی در حال رشد می باشند. افراد نیز بصورت همزمان از طریق فعالیت های مختلفی، هم اطلاعات تولید می کنند و هم مصرف می کنند، فعالیت هایی مانند جستجو در وب، ایمیل، آپلود و دانلود محتویات مختلف و به اشتراک گذاشتن فایل ها. همچنین تکثیر سریع شبکه های اجتماعی و گوشی های هوشمند و تبلت ها در زندگی ما انسان ها، در رشد قابل توجه دنیای دیجیتال تاثیر بسزایی گذاشته است. 

ظهور و پیدایش اینترنت اشیا یا همان IoT نیز به تدریج باعث رشد روزافزون این دنیای دیجیتال شده است. اینترنت اشیا، بطور کلی اشاره دارد به بسیاری از اشیا و وسایل محیط پیرامون‌ مان که به شبکه اینترنت متصل شده و توسط اپلیکیشن‌های موجود در تلفن‌های هوشمند و تبلت قابل کنترل و مدیریت هستند. اینترنت اشیا به زبان ساده، ارتباط سنسورها و دستگاه‌ها با شبکه‌ای است که از طریق آن می‌توانند با یکدیگر و با کاربرانشان تعامل کنند. نمونه هایی از این سخت افزارها عبارتند از گجت های پوشیدنی، ساعت های هوشمند، سنسورهای الکترونیکی، سنسورهای دما و بسیاری از وسایل خانه مانند تلویزیون، ترموستات و لوسترها. 

اهمیت اطلاعات در سازمان ها

سازمان ها در قرن ۲۱ بشکل فزاینده ای وابسته به اطلاعات شده اند و  این اطلاعات می بایست در هر زمان و مکانی که نیاز است فراهم گردند. بسیار حیاتی است که بتوانیم سه پارامتر سرعت، قابلیت اعتماد و امنیت را، در دسترسی به اطلاعات، برای کاربران بصورت همزمان فراهم کنیم. نمونه ای از این سازمان ها عبارتند از بانکها و موسسات مالی، شرکت های دولتی، خرده فروشان آنلاین، شرکت های رزرو بلیت، شرکت های حمل و نقل، شبکه های اجتماعی، کارگزارهای سهام و شرکت هایی که در حوزه سلامتی فعالیت می کنند.

ذخیره سازی، محافظت، پردازش و مدیریت این اطلاعات به روش موثر و مقرون به صرفه، برای سازمان ها بسیار ضروری است. اهمیت اطلاعات و تجزیه و تحلیل آن، تا بدانجا رسیده است که به عنوان یک مزیت رقابتی بین سازمانها در نظر گرفته می شود. به عنوان مثال یک خرده فروش آنلاین مثل دیجی کالا را در نظر بگیرید. این شرکت اگر بتواند با استفاده از تجزیه و تحلیل جستجو، صفحات باز شده و الگوی خرید مشتریان، محصولات و برندهای ارجح را تشخیص داده و در نتیجه، اقدام به تامین موجودی کافی از آنها در انبار، برای مشتریان موجود و بالقوه خود نماید، باعث سودآوری و شکل دادن صحیح به کسب و کار خود شده است و یک مزیت رقابتی فوق العاده را نسبت به سایر رقبا در بازار بدست آورده است.

در نتیجه این اهمیت که در بالا توضیح داده شد، سازمان ها بشدت به دنبال راهکارهای موثر در ذخیره سازی اطلاعات و مدیریت آن می باشند و راهکار استفاده از استوریج های هوشمند، امروزه از طرفداران بسیاری برخوردار است.

دیجیتال دیتا چیست؟

تعریف عمومی دیتا عبارت است از همه دانسته ها، داشته ها، آمارها، شناسه ها، پیشینه ها و پنداشته ها که معمولا به منظور تحلیل یا مرجع، جمع آوری می شود. دیتا به شکل های مختلفی وجود دارد مانند حقایقی که در ذهن شخص است، عکس ها، نقاشی ها، متن ها و عکس های یک کتاب، یک حساب بانک یا نتیجه یک نظرسنجی علمی و … . در ضمن عبارت data جمع کلمه datum است، ولی در فرهنگ عامه بصورت مفرد از کلمه data استفاده می شود.

عکس 94

در علوم کامپیوتری، دیجیتال دیتا مجموعه ایست که در شکل الکترونیکی انتقال پیدا کرده و ذخیره می شود و از طریق نرم افزار پردازش می شود. دیجیتال دیتا توسط سخت افزارهای مختلفی تولید می شود مانند کامپیوترهای خانگی، لپ تاپ، تبلت، موبایل و سنسورهای الکترونیکی.

دیجیتال دیتا بصورت باینری (مجموعه ای از صفر و یک) در استوریج ذخیره می شود و قابل دسترسی است. نمونه هایی از دیجیتال دیتا عبارتند از فایل های متنی، ایمیل ها، ویدئوهای دیجیتال، صداهای دیجیتال و تصاویر دیجیتال 

انواع دیجیتال دیتا

در بسیاری از مباحث داده کاوی، یادگیری ماشین و Big data، داده ها را می توان به دو گروه اصلی زیر طبقه بندی کرد:

Structured data – داده های ساختار یافته

Unstructured data – داده های غیرساختار یافته

داده های ساختار یافته در رشته های ثابتی در فایل سازماندهی شده اند. برای مثال اگر پیش از این مطالعه ای در زمینه دیتابیس داشته اید، می دانید که داده ها در سطرها و ستون های مختلف قرار گرفته اند و در اصطلاح یک data model برای ارتباطات بین عناصر داده ها در آن وجود دارد. این نوع از داده ها به راحتی برای ماشین قابل فهم هستند و می توان بر روی آنها عملیات های مختلفی با الگوریتم های شناخته شده کامپیوتری انجام داد. 

اما داده‌هایی مانند اخبار روزانه که به صورت متنی هستند، یا داده‌های موجود در فیلم‌ها و ویدیوهایی که در شبکه‌های اجتماعی به اشتراک گذاشته می‌شوند، فایل های pdf و ایمیل ها، با نوع قبلی فرق دارند. آن‌ها به خاطرِ تنوع، قادر به نگهداری به صورت ساختاریافته در پایگاه‌های داده نیستند. به این نوع از داده ها، غیر ساختار یافته می گویند که data model در آنها بی معنا هستند. 

در واقع اگر کامپیوتر بتواند توسط الگوریتم‌هایی از پیش تعیین شده به سرعت داده‌ها را پردازش کند آنگاه می‌توانیم بگوییم که داده‌ها ساختاریافته‌اند. ولی داده‌هایی مانند ویدیو یا تصویر یا متن بایستی پردازش‌های اضافه‌تری بر روی آن‌ها انجام شود و زمان بیشتری می‌گیرند. این داده‌ها غیرساختاریافته شناخته می‌شوند.

البته دو نوع دیگر از داده نیز در بین این دو وجود دارند:

Semi Structured data – نیمه ساختار یافته

Quasi Structured data – شبه ساختار یافته

 مدل نیمه ساختار یافته برخلاف داده های ساختار یافته، یک data model رسمی ندارند و در واقع یک الگوی خود تعریف دارند. مانند فایل های Excell و XML . 

مدل Quasi Structured نیز ساختار متفاوتی با سایر داده ها دارد. نمونه ای از این داده ها، اطلاعات مربوط به clickstream می باشد. اطلاعاتی که از ورود یک کاربر به سایت و کارهایی که در آنجا انجام می دهد را نمایش می دهد.

البته باید در نظر داشت که اکثریت حجم دیجیتال دیتا، که نزدیک به ۹۰ درصد است، متعلق به داده های غیرساختار یافته است. البته در واقعیت همیشه ترکیبی از این ۴ دسته ساخته می شود. برای مثال یک مرکز تلفن خدمات مشتری یک نرم افزار را در نظر بگیرید. گزارش تماس ها بصورت ساختار یافته با اطلاعاتی مانند زمان و تاریخ، نوع ماشین، نوع مشکل و غیره ذخیره می شوند. سپس این اطلاعات بصورت ایمیل که غیرساختار یافته یا نیمه ساختار یافته تلقی می شود به سمت تیم فنی ارسال می شود.

اطلاعات چیست؟

اصطلاح داده یا همان data و اطلاعات یا همان information، معنای بسیار نزدیکی به هم دارند و حتی در بسیاری از مواقع بجای یکدیگر استفاده می شوند. با این حال دانستن تفاوت این دو برای دانشجویان دوره ISM بسیار مهم است. داده یا همان دیتا برای مفید بودن و قابلیت استفاده، نیاز به پردازش دارد. برای مثال ارقام فروش سالانه یک شرکت، دیتا محسوب می شود. اما وقتی که دیتا پردازش می شود و قابلیت تفسیر شدن پیدا می کند، دیگر به آن information گفته می شود. برای مثال وقتی که داده های فروش سالانه در درون گزارش فروش پردازش می شود، اطلاعات بسیار مفیدی را فراهم می کند مثل میانگین فروش محصول و یا مقایسه فروش واقعی و پیش بینی شده. بنابراین می توان گفت که اطلاعات باعث ایجاد دانش شده و در ادامه آن تصمیم سازی به همراه خواهد داشت. 

همانطور که قبلا گفته شد پردازش و تجزیه و تحلیل داده ها برای هر سازمانی حیاتی است. پردازش داده های ساختار یافته در شکل سازمان یافته خود بسیار آسان است ولی پردازش داده های غیر ساختار یافته و استخراج اطلاعات از آنها با استفاده از نرم افزارهای سنتی، مشکل و زمان بر است و به منابع قابل توجهی نیز نیاز دارد. اما با ظهور تکنیک ها، تکنولوژی ها و معماری های جدید (در مبحث پلتفرم ۳ توضیح داده خواهد شد) فرآیند ذخیره سازی، مدیریت و تجزیه و تحلیل داده های غیرساختار یافته بسیار راحت شده است و در زمان بسیار کوتاهی انجام می شود. 

ذخیره سازی اطلاعات

حال که متوجه شدیم information چیست، می بایست با محل ذخیره سازی اطلاعات که استوریج نامیده می شود نیز آشنا شویم. تمامی انواع استوریج های ذخیره سازی با نام NVM یا Non-volatile media شناخته می شوند. NVM یعنی مدیایی که برای نگهداری اطلاعات نیازی به برق دائم ندارد و حتی اگر به آن برق نرسد و خاموش باشد همچنان اطلاعات را در خود نگاه می دارد.

انواع استوریج عبارتند از:

  • استوریج های مغناطیسی یا Magnetic Storage – مانند هارد دیسک و نوارهای مغناطیسی
  • استوریج های نوری یا Optical Storage – مانند سی دی، دی وی دی و دیسک های بلو ری
  • استوریج های Flash-based – مانند هارد های ssd، کارت مموری و حافظه های فلش

استوریج جزء مرکزی در زیرساخت انفورماتیک یک سازمان است. فاکتورهای مختلفی مانند نوع رسانه، معماری، ظرفیت، قابلیت اعتماد و کارایی در انتخاب نوع استوریج در سازمان های بزرگ، تاثیر می گذارند. برای مثال هارد دیسک و هارد های ssd برای ذخیره سازی اطلاعات مهم استفاده می شوند که نیاز دارند بصورت همزمان توسط نرم افزارها نیز استفاده شوند، در حالی که از نوارهای مغناطیسی و دیسک های نوری برای پشتیبان گیری و آرشیو کردن استفاده می شود. 

در سازمان های بزرگ عموما اطلاعات در Array ها ذخیره می شوند. این Array ها سخت افزارهایی هستند که مجموعه ای از یک نوع استوریج در کابینت آن مونتاژ شده اند. این سخت افزارها برای ایجاد ظرفیت های بالا و همراه با امنیت و توسعه پذیری، برای نیازمندی های کسب و کارهای بزرگ ساخته شده اند. در شکل زیر نمونه ای از array های شرکت HP و EMC را مشاهده می نمایید:

عکس 95

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همچنین ببینید
بستن
دکمه بازگشت به بالا