عنوان کامل پایان نامه :تشخیص گوینده در محیط شامل  چند گوینده با بهره گیری از ماشین بردار پشتیبان

تکه هایی از این پایان نامه :

قطعه بند آکوستیکی

در اولین مرحله، بایستی جریان داده های صوتی به قطعات همگن آکوستیکی تقسیم گردد. برای این امر بایستی نقاطی که  تغییر در خواص آکوستیکی داده های صوتی روی میدهد را، بدست آورد. در واقع این نقاط شکست[1] بعنوان ورودی به بلوک کاری بعدی داده می گردد. در بسیاری از کاربردهای چند رسانه ای که داده ها علاوه بر صدا دارای تصویر نیز می باشند، اقدام تشخیص نقاط تغییر، هم از روی صدا و هم از روی تصویر امکان پذیراست.[2] پس کارایی چنین سیستم هایی نسبت به داده هایی که تنها شامل صوت یا تصویر هستند، بالاتر خواهد بود.

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید

امروزه روش های کاربردی تعیین نقاط تغییر آکوستیکی،  همگی بر پایه ی محاسبه فاصله آماری بین دو قطعه مجاور استوار هستند. تفاوت عمده ی میان آنها معیار فاصله ای می باشد که در آنها بکار می رود. از روش های غیر آماری مورد بهره گیری میتوان به شبکه عصبی[2] و ماشین بردار پشتیبان[3]  تصریح نمود، که در بخش های بعدی تبیین داده خواهند گردید.

از دیدگاهی قطعه بندی، یک مساله بهینه سازی[4] می باشد. زیرا هدف نهایی یافتن نقاطی می باشد که در آنها معیار فاصله به ماکزیمم محلی[5] برسد. یکی از پرکاربردترین معیارهایی که امروزه برای تعیین نقاط شکست آکوستیکی بکار می رود، معیار بیزین[6] می باشد.  پیش از این، روش های آماری دیگری از سال 1997 ابداع شده بود، که همگی آنها در مقایسه با معیار بیز جواب مناسبی نمی داده اند.[1] ارایه این روش اعتبار روش های دیگر را تا حدودی کمتر نمود.

 متن فوق بخش هایی از این پایان نامه بود

می توانید به لینک پایین صفحه مراجعه نمایید: