عنوان کامل پایان نامه :تشخیص گوینده در محیط شامل  چند گوینده با بهره گیری از ماشین بردار پشتیبان

تکه هایی از این پایان نامه :

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید

1-2-2-تشخیص گفتار از غیر گفتار(دسته بندی[1] صوتی)

برای پیاده سازی این سیستم ها، قبل از هر کار دیگری بخش های گفتاری صوت ضبط شده را از بخش های غیر گفتاری آن مانند (سکوت، موسیقی، نویز خیابان، صدای سرفه ، صدای ورق زدن و …) جدا می نمایند. با حذف بخش های غیرگفتاری اندازه بار محاسباتی سیستم کاهش پیدا می کند و سرعت سیستم بیشتر می گردد و سپس مراحل بخش بندی و خوشه بندی اجرا می گردد. بعد از یافتن نقاط تغییر آکوستیکی، میتوان جریان داده های صوتی را مانند قطعات همگن در نظر گرفت. به بیانی دیگر یک قطعه نباید هم شامل گفتار، هم موسیقی و سکوت با هم باشد. اگر یک قطعه شامل گفتار دو گوینده باشد، باز هم همگن نخواهد بود. پس این بلوک کاری خروجی قطعه بند صوتی را دریافت کرده و از آن قطعاتی را که حاوی داده های صوتی غیرگفتاری اند را حذف می کند. در یک سیستم تشخیص گفتار، معمولا داده های صوتی به 5 کلاس[2] زیر تقسیم می شوند:

1-موسیقی خالص

2-گفتار خالص

3-گفتار همراه با نویز

4-سکوت

5-سکوت همراه با نویز

 متن فوق بخش هایی از این پایان نامه بود

می توانید به لینک پایین صفحه مراجعه نمایید: