عنوان کامل پایان نامه :تشخیص گوینده در محیط شامل  چند گوینده با بهره گیری از ماشین بردار پشتیبان

تکه هایی از این پایان نامه :

3-1-مقدمه

در یک فایل صوتی که شامل صحبت چندین گوینده می باشد، یکی از مهمترین موضوعات  مشخص کردن بازه زمانی بخش های گفتاری مربوط به هر گوینده می باشد. پس بایستی مشخص نماییم که هر نفر در چه بازه ای صحبت نموده می باشد. در سال های اخیر این مسئله موضوع پژوهش در بسیاری موارد بوده می باشد. مانند کاربردهای این بخش بهره گیری در سیستم های ردیابی گوینده[1] و افزایش دقت سیستم های بازشناسی گفتار و گوینده و فهرست نگاری اصوات ضبط شده و … را میتوان نام برد. هدف یافتن نقاط تغییر گوینده در فایل صوتی می باشد. فایل صوتی به بخش های کوچکتری که در هر بخش(سگمنت) تنها گفتار یک گوینده هست تقسیم می گردد. این مرحله لازمه اصلی در این سیستم ها می باشد. پس بایستی از الگوریتم های مناسبی بهره گیری نماییم تا بهترین نتایج بدست آیند. در سیستم های بخش بندی گفتار تکنیکی که اولین بار مورد بهره گیری قرار گرفت بوسیله  چن و گوپالاکریشنان در سال 1998 بکار گرفته گردید.[1]

از اولین کارها در این زمینه میتوان به تحقیقات و سیستم های پیاده سازی شده که توسط گیش و دیگران[66] انجام شده می باشد، تصریح نمود. در این روش پارامترهای سیگنال های گفتاری در آغاز برحسب بردارهای ویژگی تعیین می شوند و سپس فاصله بین دو سگمنت همسایه بطور پی در پی برای آشکارسازی تغییر گوینده محاسبه می گردد.[15] دو پنجره با طول نسبتا کم مانند شکل(3-1)  در نظر گرفته می شوند و محتویات این دو پنجره بردارهای ویژگی استخراج شده از روی سیگنال صوتی هستند. این دو پنجره در طول سیگنال صوتی حرکت می کنند و شباهت محتویات آنها با هر قسمت از سیگنال با بهره گیری از یک تابع فاصله محاسبه می گردد. مقایسه مقدار بهینه محلی این تابع فاصله، با مقدار آستانه تعیین می کند که آیا مرز این دو پنجره، t نقطه تغییر گوینده هست یا نه؟

[1].Speaker Tracking

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید

 متن فوق بخش هایی از این پایان نامه بود

می توانید به لینک پایین صفحه مراجعه نمایید:

 thesis-power-word