VoIPدانشنامهسیسکوشبکه و اینترنت

فصل اول : صدای آنالوگ در مقابل دیجیتال

به دنیای voice خوش آمدید. نه، منظور من VoIP نیست، هنوز خیلی برای ورود به آن زود است. برای ورود به دنیای VoIP نیاز به یک پایه قوی در زمینه voice دارید. شبکه تلفن سنتی در دهه ۱۹۰۰ به جهانیان عرضه شد و مطمئنا خیال ندارد که یک شبه نابود شود. پس تا آن زمان شبکه های VoIP باید با شبکه های تلفن سنتی ادغام شوند تا بتوانند با هم کار کنند. پس اکنون متوجه شدید که چرا باید درک درستی نسبت به مفاهیم سیستم های تلفنی سنتی داشته باشید!

در این فصل در رابطه با شبکه های PSTN، سیستم های PBX و مدارهای دیجیتال و آنالوگ صحبت خواهد شد.

همه چیز از کجا شروع شد : خطوط آنالوگ

در دنیای امروز که همه چیز از طریق فرم های مختلف کابل به یکدیگر متصل شده اند، از جریان الکتریکی برای ارسال سیگنال های آنالوگ استفاده می شود. وقتی شما در داخل یک گوشی تلفن آنالوگ صحبت می کنید، صدایی که از دهان شما خارج می شود، به جریان الکتریکی تبدیل می شود. در جریان الکتریکی، ویژگی هایی مانند ولتاژ، فرکانس، جریان و شارژ از مواردی هستند که در تعیین خواص و ویژگی های صدای شما تاثیر گذارند.

در شکل زیر می توانید شکل موجی صدای انسان را بصورت جریان الکتریکی و آنالوگ که در حال انتقال است را مشاهده نمایید:

عکس 159

 

هر مدار آنالوگ از یک جفت سیم تشکیل شده است. سیم اول با نام Ground یا قسمت مثبت ارتباط، شناخته می شود و اغلب به آن tip هم می گویند. سیم دوم با نام Battery یا قسمت منفی ارتباط، شناخته می شود و اغلب به آن Ring هم می گویند.

عکس 160

 

شاید شما نیز از صحبت های میان متخصصین تلفن عبارت tip and ring را شنیده باشید که اشاره به همین دو رشته سیم دارند. اهمیت این جفت سیم را می توان با کابلی که باطری ماشین را به خود ماشین متصل می کند مقایسه نمود که در صورت نبود آن سیستم کاملا بلااستفاده خواهد بود.

این دو رشته سیم در داخل تلفن دارای دو وضعیت می باشند. در وضعیت اول که در اصطلاح به آن وضعیت On-Hook می گویند، تلفن در حالت غیرفعال می باشد و به بیان ساده تر گوشی تلفن در سر جای خودش است. در این حالت تلفن اتصال دو رشته سیم را از یکدیگر جدا می کند.

در وضعیت دوم که در اصطلاح به آن وضعیت Off-Hook می گویند، تلفن در وضعیت فعال می باشد و شخص گوشی تلفن را از روی دستگاه برداشته و آماده شماره گیری می باشد، در این حالت تلفن اتصال دو رشته سیم را با هم برقرار می کند و در نتیجه آن، یک جریان الکتریکی با ولتاژ ۴۸ از سمت مخابرات به سمت تلفن ما ارسال می شود. در اصطلاح انگلیسی به این وضعیت ایجاد شده Loop start signaling می گویند.

عکس 161

 

Loop start signaling یکی از انواع سیگنالینگ ها می باشد که در محیط های خانگی استفاده می شود و نه در محیط های کسب و کار. دلیل اصلی عدم استفاده آن در محیط کسب و کار مشکلی است که در این نوع سیگنالینگ وجود دارد و آنرا با نام glare می شناسیم.

اما glare چیست و در چه زمان هایی اتفاق می افتد؟ زمانی را تصور نمایید که گوشی تلفن را بر می دارید تا با جایی تماس بگیرید، در همان لحظه یک تماس ورودی نیز وارد تلفن می شود. بله حالا مجبورید به جای تماس گرفتن با مقصد مورد نظر، با شخص دیگری صحبت کنید که انتظارش را نداشته اید!

در محیط های خانگی این مشکل معمولا خیلی مهم نیست و به چشم نمی آید زیرا احتمال وقوع آن بسیار کم است، اما در محیط های کسب و کار با توجه به تعداد بالای پرسنل و تماس ها در شرکت، این مشکل بسیار اساسی و مهم خواهد بود. به همین دلیل از این سیگنالینگ در محیط های کسب و کار استفاده نمی شود.

به دلیل مشکل glare، بیشتر مراکز تلفن که با نام PBX نیز شناخته می شوند با سیگنالینگ Ground start signaling به بازار عرضه می شوند. این نوع سیگنالینگ به مرکز تلفن اجازه می دهد که خطوط ورودی و خروجی را از یکدیگر جدا نماید. همچنین برای دریافت بوق آزاد از سمت مخابرات، مرکز تلفن می بایست یک Ground signal بر روی سیم ارسال نماید.

وقوع انقلاب : ارتباطات دیجیتال

با اینکه ارتباطات آنالوگ در زمان خود انقلابی محسوب می شد ولی مشکلاتی نیز در این نوع ارتباطات وجود داشت. برای نمونه در فواصل طولانی این سیگنال های الکتریکی ضعیف شده و بعد از مدتی محو می شدند و شاید حتی به مقصد نیز نمی رسیدند، در نتیجه مراکز مخابراتی مجبور بودند در میانه راه این سیگنال ها از repeater استفاده نمایند تا آنها را تقویت نمایند. متاسفانه این تقویت کننده ها، قادر به تشخیص افتراق بین صدای در حال انتقال و نویز خط نیستند و هر بار که دست به بازسازی صدا می زنند، نویز را نیز تقویت می کنند و تا جایی می رسد که درک صدا بسیار مشکل می گردد.

مشکل دومی که در ارتباطات آنالوگ با آن مواجه می شویم این است که شرکت مخابرات مجبور است برای پشتیبانی از یک منطقه جغرافیایی بزرگ یا یک کسب و کار با تعداد تلفن های زیاد، به مقدار زیاد کابل کشی انجام دهد، زیرا همانطور که گفته شد برای هر خط تلفن می بایست یک جفت سیم کشیده شود، تصور نمایید که نگهداری از این سیستم چقدر مشکل می شود. یکی از راه حل های رفع این مشکل این است که چندین تماس بتوانند بر روی یک سیم انتقال پیدا کنند، بله ارتباط دیجیتال راه حل این مشکل می باشد.

انتقال از آنالوگ به دیجیتال

به بیان ساده سیستم های دیجیتال به جای استفاده از سیگنال های الکتریکی، از اعداد برای نشان دادن سطوح مختلف صدا استفاده می نمایند. به مرحله تبدیل سیگنال های صدای آنالوگ به یکسری از اعداد، در اصطلاح digitizing voice می گویند.

عکس 162

 

اساساٌ هر عدد نشاندهنده ی یک صدا از شخصی است که در حال صحبت در پای تلفن است. دستگاه های امروزی قادرند که به راحتی یک مقدار عددی را در فواصل طولانی انتقال دهند، بدون ایجاد هرگونه تخریبی در صدا و یا حتی ایجاد نویز.

با این حال آیا ارتباطات دیجیتال قادرند که حجم بسیار زیاد سیم ها که در ارتباطات آنالوگ وجود دارند را حذف نمایند؟ بله می توانند، اما چگونه؟

صدای دیجیتال از یک تکنولوژی با نام TDM که مخفف Time-division multiplexing می باشد استفاده می نماید. TDM اجازه می دهد که چندین مکالمه از روی یک سیم در یک لحظه عبور نمایند. سیگنال های دیجیتال ارسال شده بر اساس زمانی که هر کدام ارسال شده اند در سمت مخابرات تشخیص و دوباره ساخته می شوند. پس با توجه به اینکه time slot هر کدام از این صداها با یکدیگر متفاوت می باشند، در سمت مخابرات این مکالمات کاملاٌ از یکدیگر تمیز داده می شوند.

عکس 163

در بسیاری از کشورها از خطوط T1 برای اتصال به شبکه PSTN استفاده می شود. در نظر داشته باشید که هر مدار T1 از ۲۴ کانال ۶۴kbps تشکیل شده است، در اصطلاح به هر کدام از این کانال ها یک DS0 یا همان digital signal 0 گفته می شود. هر کدام از این کانال ها قادرند یک تماس صوتی را انتقال دهند.

در بعضی دیگر از کشورها از خطوط E1 استفاده می شود که این نوع مدار از ۳۰ کانال DS0 تشکیل شده است.

مجموع نرخ ارسال و دریافت در خطوط T1 برابر است با ۱/۵۴۴Mbps و در خطوط E1 برابر است با ۲/۰۴۸Mbps.

با اینکه فناوری دیجیتال دو مشکل اساسی سیستم های آنالوگ که عبارت بودند از افت سیگنال در مسیرهای طولانی و عدم قابلیت انتقال چند مکالمه بر روی یک سیم را حل نمود، ولی نیاز به یک طرح ریزی برای کنترل وضعیت ارتباطی در این نوع از ارتباطات وجود داشت که در نتیجه آن روش های سیگنالینگ به وجود آمد.

وظیفه اصلی سیگنالینگ برقراری و کنترل وضعیت ارتباطی بین ترمینال های دیجیتال می باشد. در مدارهای آنالوگ، سیگنال های کنترلی از طریق اتصال سیم های tip و ring به یکدیگر، ارسال میشد. ولی در سیستم های دیجیتال این فرآیند به این سادگی ها نبود و نیاز به طرح ریزی پیچیده تری داشت.

در ادامه دو شیوه اصلی در سیگنالینگ مدارهای دیجیتال را معرفی می نماییم :

Channel Associated Signaling (CAS) :

بیت های مختص این نوع سیگنالینگ با بیت های ترافیک صدا، ادغام شده و از کانال های موجود در خطوط ما اعم از E1 یا T1 ارسال می شوند.

Common Channel Signaling (CCS) :

بسته به نوع خطوط ما، یکی از کانال ها به سیگنالینگ اختصاص داده می شود و در نتیجه مسیر ارسال بیت های سیگنالینگ با بیت های ترافیک صدا متفاوت می باشد.

پس باید در نظر داشته باشید که در این روش، خطوط T1 تنها می توانند از ۲۳ کانال خود برای انتقال ترافیک صدا استفاده کنند و از کانال ۲۴ برای انتقال سیگنالینگ استفاده می شود. به همین ترتیب برای خطوط E1 نیز همین وضعیت وجود دارد.

به دلیل انعطاف پذیری بالا، داشتن پهنای باند بیشتر و امنیت بالاتر، روش CCS در تمام دنیا از محبوبیت بیشتری برخوردار است.

نکته: در خطوط T1 بیست و چهارمین time slot و در خطوط E1 هفدهمین time slot مخصوص سیگنالینگ می باشد.

در ادامه با پروتکل های مختلف سیگنالینگ که می توانند از تنظیمات CAS و یا CCS استفاده نمایند، بیشتر آشنا خواهید شد.

مفهوم PSTN

PSTN یا همان Public Switched Telephone Network، به بستر شبکه ای گفته می شود که توسط اپراتورهای محلی، ناحیه ای و جهانی، سرویس هایی را برای ارتباطات عمومی فراهم می نمایند. شبکه PSTN شامل خطوط تلفنی، کابل های فیبرنوری، لینک های انتقالی مایکروویو، شبکه های موبایل، ارتباطات ماهواره ای و کابل های ارتباطی زیر دریایی می باشد. همه این موارد توسط مراکز سوئیچینگ به یکدیگر متصل می گردند و در نتیجه این امکان ایجاد می گردد که از یک نقطه دنیا با نقطه ای دیگر، ارتباطات صوتی ایجاد گردد.

اجزای شبکه PSTN

شبکه PSTN یک شبکه جهانی می باشد که اجزای تشکیل دهنده ی آن عبارتند از:

Analog telephone:

تلفن آنالوگ، عمومی ترین جزء در این شبکه می باشد که وظیفه اصلی آن تبدیل صدای آنالوگ به سیگنال های الکتریکی و ارسال آن به سمت مخابرات می باشد.

Local Loop:

به لینک بین تلفن شما در خانه و یا شرکت تا مخابرات، local loop می گویند.

CO Switch:

به سخت افزارهایی که وظیفه اصلی آنها ارائه سرویس به تلفن های شما در local loop است، CO switch می گویند.

Trunk:

به ارتباط بین سوئیچ های مخابراتی با یکدیگر trunk می گویند.

Private Switch:

بسیاری از کسب و کارها برای خود یک PSTN کوچک در داخل شرکت راه اندازی می کنند که باعث افزایش کارایی و کاهش هزینه ها می گردد. زیرا با اینکار دیگر نیازی نیست از هر تلفن تا سوئیچ های مخابراتی یک ارتباط مستقیم ایجاد نمود.

Digital telephone:

این نوع از تلفن ها معمولاٌ به سیستم PBX متصل می شوند و صدای ورودی را به باینری تبدیل می کنند که باعث افزایش کارایی ارتباط نسبت به تلفن های آنالوگ می شوند.

عکس 164

مفهوم PBX و Key system :

بسیاری از کسب و کارها دارای ده ها، صدها و یا حتی هزاران تلفن در داخل سازمان خود هستند، اگر بخواهیم تک تک این تلفن ها را به شبکه PSTN متصل نماییم، هزینه اینکار نجومی خواهد شد. تقریباٌ تمامی سازمان ها در این موارد از PBX و یا در ابعاد کوچکتر از key system استفاده می کنند.

از این طریق پرسنل می توانند با داخلی های یکدیگر در سازمان تماس بگیرند بدون اینکه نیازی باشد از منابع شبکه PSTN استفاده نمایند. ارتباط با بیرون نیز از طریق لینک trunk برقرار می گردد.

وقتی به یک سیستم PBX نگاهی می اندازیم، تعداد زیادی کارت در داخل آن می بینیم که هرکدام از این کارت ها یکی از سه رول زیر را خواهد داشت:

Line Cards:

تلفن های پرسنل از طریق این کارت به PBX متصل می شوند.

Trunk Cards:

اتصال بین PBX و شبکه PSTN از طریق این کارت انجام می گیرد.

Control Complex:

مغز هوشمند سیستم PBX در این نوع کارت ها قرار دارد. تمامی تنظیمات، مسیریابی و مدیریت وظایف سیستم جزئی از آن می باشد.

شرکت هایی که کمتر از ۵۰ نفر پرسنل دارند می توانند از key system استفاده نمایند زیرا به دلیل قابلیت های کمتری که نسبت به PBX دارند، قیمت کمتری نیز دارند. ولی بسیاری از ویژگیها نیز بین این دو یکسان است.

اتصال به شبکه PSTN

وقتی می خواهیم به شبکه PSTN متصل شویم چند گزینه برای انتخاب داریم. کاربران خانگی و شرکت های خیلی کوچک می توانند از پورت های آنالوگ استفاده نمایند، که هر زوج سیم آن قابلیت انتقال تنها یک تماس را دارد.

اما خطوط آنالوگ برای شرکت هایی با ابعاد بزرگتر دیگر پاسخگو نیست و آنها نیاز به خطوط E1 و یا T1 دارند. حتی سازمان های بسیار بزرگتر می بایست چند خط دیجیتال E1 و یا T1 داشته باشند.

عکس 165

 

شبکه PSTN نیز کاملا شبیه اینترنت می باشد و بصورت تارعنکبوتی کل دنیا را به هم وصل نموده است. همانطور که پروتکل TCP/IP در دنیای اینترنت زبان مشترک می باشد، در شبکه ی PSTN نیز نیاز به یک زبان مشترک وجود دارد، این پروتکل سیگنالینگ صدا SS7 نام دارد.

این پروتکل از روش CCS که پیش از این در رابطه با آن توضیح داده شد، در سیگنالینگ خود استفاده می نماید. وقتی ما یک تماس می گیریم، اولین مرکز مخابراتی که تماس را دریافت می کند یک جستجوی SS7 برای پیدا کردن شماره انجام می دهد، وقتی مقصد پیدا شد، پروتکل SS7 مسئول مسیریابی تماس تا مقصد و فراهم نمودن تمامی اطلاعات سیگنالینگ مانند ring back، billing و غیره می باشد.

نحوه تعیین شماره ها در PSTN

همانطور که در شبکه اینترنت از آدرس های IP برای تعیین مکان منابع مختلف موجود در آن استفاده می شود، شبکه PSTN نیز دارای یک طرح تعیین شماره برای تلفن ها در سرتاسر دنیا می باشد.

برای تعیین شماره های تلفن در هر کشوری می بایست از استاندارد E.164 که توسط سازمان ITU تعیین شده، پیروی نمود. این استاندارد شماره گذاری دارای سه جزء می باشد:

Country Code

National Destination Code

Subscriber Number

در استاندارد E.164 حداکثر طول شماره تا ۱۵ رقم می باشد.

عکس 166

وقوع انقلاب دوم : VoIP

در فناوری VoIP چه اتفاق جدیدی افتاد که از آن به عنوان انقلاب دوم پس از سیستم تلفنی دیجیتال نام می برند؟

پاسخ به این سوال همه چیز را روشن می کند، ما با فناوری VoIP از سیستم دیجیتال که بر پایه ی ارسال صدا بر مبنای ۰ و ۱ هست، عبور کردیم و به جای آن از آدرس های IP در هدر بسته های صدا استفاده کرده و آنرا بصورت پکت در شبکه اینترنت ارسال کردیم. اما آیا همه چیز به همین سادگی است؟

نه لزوماٌ، ما در اینجا نیز نگرانی های فراوانی داریم. نگرانی هایی مانند دریافت به موقع پکت های صدای ارسالی، انتخاب روش های مناسب coding و decoding، اطمینان از اینکه بسته های صدا به دست سارقان این نوع اطلاعات نیوفتد و بسیاری دیگر از این دست نگرانی ها.

مزیت VoIP برای کسب و کارها

وقتی بسیاری از مردم به یادگیری VoIP می پردازند، اکثراٌ در رابطه با مزیت آن می گویند: “ما صدا را به جای کابل های صدا از کابل های data ارسال می کنیم.” بزرگترین مزیت این جمله، صرفه جویی در مصرف کابل می باشد و نه بیشتر. اما وقتی در آن عمیق تر می شویم، مزیت هایی فراوان دیگری نیز برای کسب و کارهای مختلف می یابیم که در زیر به مهمترین آنها اشاره می کنیم:

– کاهش هزینه ارتباطات که بدلیل ارسال صدا بر روی شبکه WAN صورت می گیرد

– کاهش هزینه کابل کشی بدلیل استفاده از کابل اترنت شبکه

– جابجایی آسان و بدون هزینه تلفن ها

– قابلیت افزایش نامحدود ظرفیت

– استفاده از تلفن های نرم افزاری softphone

– افزایش بهره وری

– استفاده از Email و Voice mail در ارتباطات

فرآیند تبدیل صدا به پکت

زمانی که حرف می زنیم ، صدا به صورت دیجیتالی در مبنای دو (باینری ) شامل صفر ها و یک ها از دهان ما خارج نمی شود. اما اگر صدای ما بخواهد از میان یک شبکه صوت بر روی IP عبور کند ، در این صورت صدای ما باید چگونه باشد؟ در حالت عادی ، صدای ما آنالوگ است یعنی به صورت یک سری موج های غیر یکسان متوالی می باشد. شبکه های دیجیتال، با استفاده از کد کننده باینری ، صدای ما را به صورت دیجیتالی ، یعنی رشته ای از صفر ها و یک ها ، انتقال می دهند. بدیهی است تبدیل هایی باید انجام شود، راه های زیادی برای تبدیل صدای آنالوگ به دیجیتال وجود دارد. اما فقط تبدیل صدای آنالوگ به دیجیتال کافی نیست، بلکه باید راهی وجود داشته باشد تا صدای دیجیتال را دوباره به آنالوگ تبدیل کند. در غیر این صورت، افرادی که در آن سمت تماس شما هستند، نمی توانند بفهمند که چه می گویید.

عکس 167

به این نکات توجه نمایید:

– گوش انسان به صورت میانگین قادر است فرکانس هایی بین ۲۰ تا ۲۰،۰۰۰ هرتز را بشنود.

– انسان به هنگام صحبت کردن از محدوده فرکانسی ۲۰۰ تا ۹،۰۰۰ هرتز استفاده می کند.

– کانال های تلفنی، فرکانس هایی بین ۳۰۰ تا ۳،۴۰۰ هرتز را انتقال می دهند.

– قضیه نایکوئست قادر است فرکانس هایی بین ۳۰۰ تا ۴،۰۰۰ هرتز را باز تولید کند.

حال این سوال برای شما پیش می آید که اگر انسان از فرکانس هایی بین ۲۰۰ تا ۹،۰۰۰ هرتز به هنگام صحبت کردن استفاده می کند و کانال تلفن، تنها محدوده فرکانسی ۳۰۰ تا ۳،۴۰۰ هرتز را منتقل می کند، چگونه شما می توانید مکالمه یک انسان بر روی تلفن را متوجه شوید؟ مطالعات نشان داده است که تجهیزات تلفنی به دقت می توانند بخش قابل تشخیص مکالمات را تنها با ارسال بخش محدود شده ایی از فرکانس ها انتقال دهند. این محدوده فرکانسی باعث ایجاد کیفیت مناسبی در مکالمات می گردد.

کار تبدیل صدای آنالوگ به داده های دیجیتالی ، با نمونه برداری آغاز می شود. برای درک بهتر از نمونه برداری برای مثال ، تصور کنید در حال مشاهده فیلمی بر روی تلویزیون خانه هستید. شما در واقع تصویری ممتد و طبیعی را مشاهده نمی کنید، بلکه در حال مشاهده عکس هایی از آنها هستید، که به سرعت و پشت سر هم نمایش داده می شوند.

به طور کلی ، فیلم ها در هر ثانیه ، ۲۴ فریم ( همان عکس ها ) را نمایش می دهند، و به دلیل اینکه این تصاویر پشت سر هم تکرار می شوند، این حس به شما القا می شود که تصویر زنده ، و در حال حرکت است. دیجیتالی کردن صدا هم از مفهومی مشابه استفاده می کند. ما تصاویر لحظه ای یا نمونه هایی را به سرعت و به طور مداوم از موج صدای آنالوگ میگیریم. بعد از گرفتن نمونه ها، آنها دیجیتالی می شوند. ( یعنی به یک سری ۰ ها و ۱ ها تبدیل می شوند ) در ضمن، در آن سوی یک مکالمه تلفنی ، سیگنال دیجیتالی شده باید قابلیت تبدیل به امواج آنالوگ را داشته باشد تا برای شنونده قابل فهم شود.

با توجه به مطالب ذکر شده ، عدد جادویی نمونه برداری که تجهیزات بتوانند دقیقا همان صدای اصلی را دوباره تولید کنند، بدون اینکه عرض باند بیش از اندازه مصرف نمایند، چیست؟

جواب این سوال را هری نایکوئست در سال ۱۹۳۳ پیدا کرد. تئوری نایکوئست در صنعت تلفن حرفه ای ، محبوبیت زیادی دارد. نایکوئست گفته بود که سرعت نمونه برداری باید حداقل دوبرابر بیشتر از بالاترین فرکانسی باشد که نمونه برداری خواهد شد. به طور کلی برای صدای انسان ، بالاترین نمونه فرکانس صدا ۴ کیلو هرتز است ( یعنی ۴۰۰۰ چرخه در هر ثانیه ) بر اساس این اطلاعات، تئوری نایکوئست به ما می گوید که به ۸۰۰۰ نمونه در ثانیه نیاز داریم، که معنای آن برداشتن یک نمونه در هر ۱۲۵ میلی ثانیه است. با توجه به نظریه نایکوئست و اینکه ( یک ۸ بیت یا یک بایت ) معادل یک نمونه است ، داریم:

۶۴۰۰۰ بیت در هر ثانیه = ۸ بیت برای هر نمونه × ۸۰۰۰ نمونه در ثانیه

این محاسبه نشان می دهد که می توانیم صدای دیجیتالی شده را با ۶۴ kbps انتقال دهیم. پس این اتفاقی نیست که صدای فشرده سازی نشده در کدک G.711 به میزان ۶۴kbps مصرف پهنای باند دارد.

حال می خواهیم کمی بیشتر وارد نحوه نمونه برداری شویم.

همانطور که گفته شد هر نمونه از یک بایت و یا ۸ بیت تشکیل شده است که بر اساس اطلاعات ما می توانند اعداد بین ۰ تا ۲۵۵ را اختیار نمایند، در حالیکه این مقادیر در اینجا محدود شده اند به اعداد بین ۰ تا ۱۲۷ که در بیشترین حالت ۱۲۷+ و در پایین ترین سطح ۱۲۷- می باشد.

عکس 168

 

همانطور که در شکل بالا مشاهده می نمایید ۸۰۰۰ نمونه در یک ثانیه در سطوح مختلف عددی از یک صدای آنالوگ برداشته شده است.

ابزار اندازه گیری، ۸ بیت یک نمونه را که بصورت باینری نمایش داده می شود به دو قسمت تقسیم می کند. بیت اول نمایانگر مثبت و یا منفی بودن عدد است و ۷ بیت باقیمانده مقدار عددی واقعی را مشخص می کنند.

نکته: در صورتی که بیت اول، یک باشد عدد را مثبت و در صورتی که صفر باشد عدد را منفی می خوانیم.

نمونه ای از ۸ بیت

در محاسبه ارزش عددی ۸ بیت نشان داده شده در شکل بالا، به عدد ۵۲+ می رسیم.

نکته: کدک G.711 دارای دو مدل u-law و a-law می باشد. روشی که در پاراگراف های بالا توضیح داده شد همان روش a-law می باشد. ولی روش u-law دقیقاٌ در نقطه مقابل آن قرار دارد، اگر تمامی بیت های صفر را با یک و تمامی بیت های یک را با صفر جایگزین نماییم، نتیجه روش u-law خواهد شد.

آخرین مبحث در فرآیند تبدیل صدای آنالوگ به دیجیتال، اعمال فشرده سازی است. کدک های پیشرفته مانند G.729 به ما امکان فشرده سازی تعداد نمونه های ارسالی را می دهد که نتیجه آن کاهش میزان پهنای باند مصرفی است. نمونه برداری از صدای انسان به تعداد ۸۰۰۰ بار در ثانیه باعث می گردد نمونه هایی بسیار مشابه یا مانند هم بوجود آید. کلمه “گاو” را با صدای بلند برای خود بیان کنید، حدوداٌ گفتن آن یک ثانیه زمان می برد. حال صدایی را که تولید کرده اید، تجزیه و تحلیل نمایید. کلمه با مشخصه “گ” شروع می شود، سپس صدای “آآآ” در وسط کلمه و در نهایت به صدای “و” ختم می شود. بنابراین اگر آنها را به ۸۰۰۰ نمونه مجزا در هر ثانیه تقسیم کنیم، خواهیم دید که بیشتر آنها مانند هم هستند.

فرآیندی که G.729 جهت فشرده سازی از آن بهره می برد به این صورت است که ابتدا یک نمونه صدا را ارسال و به دستگاه مقابل فرمان پخش آن بصورت ادامه دار برای مدت زمان معینی را می دهد. به کارگیری این فرآیند، G.729 را قادر ساخته تا میزان پهنای باند مصرفی برای هر تماس را به ۸ kbps کاهش دهد.

جدول زیر اطلاعات مورد نیاز در مورد کدک های مختلف را ارائه می دهد. هر کدام از این کدک ها برای اهداف خاصی طراحی شده اند. برای مثال برخی از آنها برای مصارف نظامی است که صدا می بایست از طریق ارتباطات ماهواره ای که در آن پهنای باند ارزش بسیاری دارد، ارسال شود. این کدک ها کیفیت صدا را تقلیل می دهند تا ارسال صدا به سادگی انجام شود، حال آنکه سایر کدک ها جهت ایجاد کیفیت طراحی شده اند.

عکس 169

شرکت سیسکو نیز تمامی تلفن های خود را با قابلیت کدگذاری به دو فرمت G.711 و G.729 طراحی نموده است. پشتیبانی از کدک G.711 تقریباً در تمامی تجهیزات VoIP با برندهای مختلف وجود دارد. در نتیجه این کدک می تواند زبان مشترک تمامی تلفن ها با برندهای مختلف باشد تا بتوانند با هم ارتباط برقرار کنند.

نقش Digital Signal Processors

وظیفه اصلی یک روتر مسیریابی در شبکه می باشد که این امر بار زیادی را بر روی پردازنده روتر نمی گذارد. به همین دلیل است که پردازنده و حافظه موجود در روترهای سیسکو بسیار متفاوت از منابعی است که در کامپیوترهای خانگی وجود دارد. برای مثال داشتن حافظه به میزان ۲۵۶ مگابایت برای یک روتر سیسکو مناسب است در حالی که این میزان حافظه برای یک کامپیوتر خانگی بسیار ضعیف است.

حال تصور نمایید که روتر سیسکوی ما علاوه بر وظیفه مسیریابی، می بایست در شبکه VoIP نیز فعال باشد. در نتیجه روتر باید بتواند حجمی از اصوات را به ارقام دیجیتال وسپس به صورت پکت، تبدیل و آنها را منتقل نماید. این مسئله به راحتی باعث می شود که تمامی منابع روتر مشغول شوند. در اینجا DSP ها پا به میدان می گذارند تا ایفای نقش کنند و کار پردازش صدا را انجام دهند. این امر دقیقا مشابه خرید یک کارت گرافیک گران قیمت برای یک کامپیوتر خانگی می باشد تا بار پردازش گرافیک را از روی پردازنده حذف نماید.

بصورت اختصاصی یک DSP تراشه ای است که تمامی عملیات های نمونه برداری، کدگذاری و فشرده سازی را بر روی اصواتی که به روتر وارد می شوند را انجام می دهد. اگر می خواهید روتر خود را به کارت های رابط صوتی که VIC نامیده می شوند، مجهز نمایید تا به خطوط PSTN متصل شوند و روتر را به DSP مجهز ننموده اید، کارت خریداری شده شما بی ارزش خواهد بود زیرا شما می توانید از طریق این رابط با خطوط صوتی ارتباط برقرار کنید اما توانایی لازم برای تبدیل صوت به حالت پکت را نخواهید داشت.

عکس 170

در برخی از روترهای سیسکو DSP بر روی مادربرد جاسازی شده است ولی در بعضی دیگر نیاز به نصب آن بر روی riser می باشد.

نکته: نکته ای که در این میان از اهمیت بسزایی برخوردار است، اضافه کردن تعداد مورد نیاز DSP بر روی روتر با توجه به حجم تماس ها و کدگذاری های انجام شده است. سیسکو یک محاسبه گر DSP ارائه نموده است که تعداد مورد نیاز آنها را محاسبه می کند. این ابزار را می توانید از اینجا بیابید. البته در نظر داشته باشید که برای دسترسی به این محاسبه گر نیاز به یک اکانت در داخل سایت سیسکو دارید.

شما می توانید تراشه های DSP را به صورت مستقیم بر روی مادربرد روتر نصب نمایید البته در صورتی که روتر از این حالت پشتیبانی نماید، و یا اینکه آنرا به ماژول شبکه که آنرا جهت پشتیبانی از voice بر روی روتر گذاشته اید، اضافه نمایید.

شرکت سیسکو این تراشه های DSP را تحت عنوان یک پکیج با نام PVDM که مخفف Packet Voice DSP Modules است، به بازار عرضه می کند. هر PVDM دارای تعدادی تراشه DSP می باشد که شما می توانید با توجه به مدل انتخاب شده، تعداد تراشه های روی آن را تشخیص دهید.

متاسفانه تمامی کدک ها مانند هم ایجاد نشده اند و هر کدام از آنها به یک میزان از منابع DSP برای پردازش مکالمات صوتی مصرف می کند. مقایسه مدل های مختلف PVDM را می توانید در اینجا مشاهده نمایید.

نکته: تراشه های جدید DSP قادرند تعداد تماس های بیشتری را نسبت به مدل های قدیمی تر پردازش نمایند. برای اینکه بدانید هر DSP دقیقاً چه تعداد تماس را پردازش می کند از ابزار محاسبه گر DSP که پیش تر به آن اشاره شد استفاده نمایید.

پروتکل RTP و RTCP

پروتکل RTP و یا همان Real-time Transport Protocol که گاهی اوقات از آن با نام RTTP نیز یاد می کنند، تشکیل شده از مجموعه استانداردهایی که وظیفه تحویل صدا و تصویر را در شبکه های آی پی، برعهده دارد. هر فناوری که بر روی بستر آی پی و در جهت Streaming media فعالیت می نماید، این قابلیت را می تواند داشته باشد که برای انتقال صدا و تصویر از مجموعه استاندارد های RTP استفاده نماید. این تکنولوژی ها شامل نرم افزارهای تلفنی و ویدیو کنفرانس، سرویس های تلویزیونی و نرم افزارهای با قابلیت push-to-talk می باشند.

RTP در سال ۱۹۹۶ توسط دپارتمان مخصوص به خود در IETF تحت استانداردی با نام RFC 1889 عرضه شد و در سال ۲۰۰۳ استاندارد آن با RFC 3550 جایگزین شد.

پروتکل RTP در پیوستگی کامل با RTCP که مخفف RTP Control Protocol می باشد مورد استفاده قرار می گیرد. همانطور که از نام آن پیداست وظیفه RTCP ارسال پیغام های کنترلی در یک تماس می باشد و بدین ترتیب می تواند با استفاده از این پیغام ها، بازخوردهای لازم در وضعیت کیفیت سرویس ایجاد شده توسط RTP را مورد سنجش قرار دهد. آمار و ارقام زیر توسط پروتکل RTCP ارسال می شوند:

– تعداد بسته ها

– تاخیر در ارسال بسته ها

– ایجاد خدشه در بسته ها

– میزان تغییرات در تاخیرات موجود در زمان ارسال بسته ها (Jitter)

با اینکه این اطلاعات بسیار مفید هستند اما به اندازه خود رشته های صوتی RTP حیاتی نمی باشند و این را به هنگام پیکربندی Qos به خاطر داشته باشید.

به هنگام برقراری ارتباط بین دو دستگاه، رشته های RTP از پورت های زوج بین ۱۶،۳۸۴ تا ۳۲،۷۶۷ استفاده می کنند و RTCP جلسات خود را در همان محدوده عددی بر روی پورت های فرد برقرار می کند. در خلال زمان مکالمه، دستگاه ها حداقل هر ۵ ثانیه یکبار بسته های RTCP را ارسال می کنند و روتر سیسکو این اطلاعات را ثبت و گزارش می کند که شما از این طریق قادر خواهید بود به بررسی مشکلات احتمالی ایجاد شده برای صدای منتقل شده بپردازید.

نکته: RTCP از پورت های فرد در امتداد پورت های RTP استفاده می کند. برای مثال اگر یک رشته صوتی RTP از پورت ۱۷،۶۵۴ استفاده کند، RTCP از پورت ۱۷،۶۵۵ استفاده خواهد کرد.

یکی از مباحث مهم برای برنامه هایی که مبتنی بر RTP فعالیت می کنند، تحویل به موقع صدا و تصویر به طرف مقابل می باشد و برای رسیدن به این هدف مطمئنا باید تحمل از بین رفتن میزانی از اطلاعات ارسالی که شامل صدا و تصویر می باشد را داشته باشند. ولی این از دست رفتن اطلاعات باید تا حد امکان به قدری نامحسوس باشد که کیفیت صدای دریافتی به طور کلی از بین نرود. پس با توجه به اینکه اگر از پروتکل TCP برای ارسال استفاده شود بطور کلی اصل تحویل به موقع صدا زیر سوال می رود، عموما برنامه ها از این پروتکل استفاده نمی نمایند و از جایگزین آن یعنی پروتکل UDP برای ارسال اطلاعات استفاده می کنند.

پروتکل RTP برای ارسال اطلاعات از قالب های مختلف رمزنگاری و یا همان Payload format برای صدا و تصویر، استفاده می نماید. اما سوال اینجاست که تعداد بیشمار نرم افزارهای انتقال صدا و تصویر و همچنین تلفن ها با برندهای مختلف، امروزه در حال فعالیتند، هر کدام از آنها دارای نیازمندی های متفاوتی می باشند و از قالب های رمز نگاری متفاوتی پشتیبانی می نمایند. پس چگونه است که ما بدون اینکه بدانیم گیرنده صدا از چه نرم افزار و یا تلفنی استفاده می نماید، به راحتی می توانیم با او صحبت کنیم؟

RTP در انتقال اطلاعات از یک Profile که شامل یک یا چند Payload format می باشد، استفاده می نماید. بدین ترتیب ما می توانیم در یک Profile چندین قالب رمز نگاری را به ترتیبی که می خواهیم قرار دهیم و در سمت گیرنده نیز با توجه به ترتیب اولویت بندی مشخص شده و پشتیبانی که از آن قالب ها می نماید، یکی از آنها را انتخاب می کند.

هر بسته RTP دارای یک هدر می باشد، یکی از اجزای مهم این هدر که شامل ۳۲ بیت می باشد، Timestamp نام دارد که تشکیل شده از یک نمونه فوری از قسمت اول صدا و یا تصویر موجود در آن بسته. لازم به ذکر است که اساس کار سیستم صوتی دیجیتال بر مبنای نمونه برداری در بازه زمان است و به همین دلیل باید یک منبع دقیق و دائمی برای زمان تعیین نماییم تا از این اطلاعات در یکسری محاسبات خاص مانند محاسبه Jitter استفاده شود.

از اطلاعات دیگر هدر RTP می توان از Sequence number نام برد که شامل ۱۶ بیت می باشد و از آن برای بازیابی اطلاعات از دست رفته و ارسال مجدد آن استفاده می گردد. این فیلد یک عدد بصورت تصادفی در ابتدا گرفته و با ارسال هر بسته یک عدد به آن اضافه می گردد بدین ترتیب بسته های دریافت نشده توسط گیرنده به راحتی مشخص می گردند.

 

 


بیشتر بدانید:


نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا