بهسازی سیگنال گفتار در حوزه زمان فرکانس
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 118 صفحه
چکیده
یکی از موضوعات مهم پردازش سیگنال) به عنوان مثال در سیستمهای ارتباطی، كدینگ سیگنالهای صوتی، تشخیص صوت (…، کاهش و حذف نویز ناخواسته از سیگنال اصلی و بهبود آن است. به همین منظور در دهه های گذشته تحقیقات گسترده ای برای بهسازی گفتار انجام شده است. بهسازی گفتار بسته به مساله، هدف آن، ویژگی های نویز و امکانات موجود، قابل بررسی است. از این رو، روش های متفاوتی برای طبقه بندی سیستم های بهسازی گفتار وجود دارد، یکی از طرق تفکیک روش¬ها بر اساس تککاناله و چندکاناله بودن می باشد. روش های یک کاناله که تنها یک میکروفون ورودی در دسترس دارند، متداولترین نوع الگوریتمهای بلادرنگ میباشند چرا که به سادگی قابل پیادهسازی هستند و به طور نسبی هزینه آنها کمتر از سیستمهایی با چند کانال ورودی میباشد. از خانواده ی روش های تک کاناله، میتوان به روش های تفریق طیفی ، فیلتر وینر، بهسازی گفتار با استفاده از مدل های آماری، تبدیل موجک و … اشاره کرد که هر کدام از این روش ها دارای معایب نظیر نویز موزیکال و اعوجاج و پیچیدگی … می باشند یکی از روش هایی که میتوان عیب این روش ها را بهبود بخشید، استفاده از سیستم های ترکیبی است که از ترکیب روش ها حاصل می شود. در اینجا دو روش ترکیبی جدید بر مبنای روش تک کاناله برای بهسازی گفتار پیشنهاد شده است. در ضمن عموما برای اندازه گیری مشخصات نویز از بخش های غیر گفتار (سکوت) که معمولا از پنجره اول سیگنال است، استفاده می شود. ضعف شدید این روش هنگامی آشكار میشود كه فریم اول، یك فریم سكوت نباشد. روش جدیدی نیز برای بر طرف کردن این عیب پیشنهاد شده است که این روش ها به شرح زیر می باشند: الف)روش پیشنهادی تخمین نویز: تخمین نویز با استفاده از آنالیز LPC صورت گرفته است و در هر دو روش پیشنهادی زیر از این روش برای تخمین نویز استفاده شده است. ب) روش پیشنهادی اول: بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک، از ترکیب روش های تفریق طیفی و تبدیل موجک حاصل شده و تخمین نویز آن هم که توسط آنالیز LPC صورت گرفته است با الگوریتم ژنتیک بهبود یافته است. پ) روش پیشنهادی دوم: بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک، از ترکیب دو روش تبدیل موجک و كمینه كردن لگاریتم خطای میانگین مربعات(LOG-MMSE) حاصل شده است. در این روش با استفاده از تبدیل فوریه ضرایب موجک سیگنال گفتار آغشته به نویز و سیگنال نویز، تخمین زننده ی لگاریتمی بر مبنای کمترین خطای میانگین مربعات پیشنهاد شده است. در این رساله معیار ارزیابی ، معیارهای مهم نسبت سیگنال به نویز(SNR) و تست شنوایی(MOS) بوده است. با توجه به نتایج، این روش ها هم از لحاظ کیفی و هم از لحاظ کمی عملکرد بهتری داشته اند و توانسته اند SNR و MOS و اعوجاج و نویز موزیکال را بهبود ببخشند. کلید واژه: بهسازی سیگنال صوتی، ،تفریق طیفی تبدیل موجك، تخمین زننده log MMSE، آنالیز LPC ، الگوریتم ژنتیک
فهرست مطالب
فصل اول: 1
مقـــــدمه 1
۱-۱ پیشگفتار 1
۱-۲ بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم 2
۱-۳ تعریف مسئله و تقسیم بندی روش ها 3
۱-۴ نوآوری تحقیق 4
۱-۵ ساختار 4
فصل دوم 5
پیش زمینه های پردازش سیگنال گفتار 5
۲-۱ نحوه تولید گفتار در انسان 5
۲-۲ معرفی نویز و انواع آن 10
۲-۲-۱ نویز سفید 13
۲-۲-۲ نویز صورتی 13
۲-۲-۳ نویز قهوهای 14
۲-۲-۴ نویز صنعتی 14
۲-۳ تحلیل زمان- فرکانسی سیگنال گفتار 15
۲-۳-۱ تبدیل فوریه 15
۲-۳-۲ تبدیل فوریه زمان-كوتاه 17
۲-۳-۳ آنالیز چند دقت زمان فرکانسی 20
۲-۳-۴ تبدیل موجک یك بعدی 20
۲-۳-۴-۱ تبدیل موجک پیوسته 20
۲-۳-۴-۱-۱ دقت های زمانی و فركانسی 22
۲-۳-۴-۱-۲ روابط ریاضی تبدیل موجک: 22
۲-۳-۴-۱-۳ عكس تبدیل موجک: 24
۲-۳-۴-۲ تبدیل موجک گسسته 24
۲-۴ الگوریتم بهینه سازی ژنتیک 28
۲-۴-۱ درباره علم ژنتیک 28
۲-۴-۲ تاریخچۀ علم ژنتیک 29
۲-۴-۳ تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی 29
۲-۴-۴ الگوریتم ژنتیک 32
۲-۴-۵ مكانیزم الگوریتم ژنتیك 34
۲-۴-۶ عملگرههای الگوریتم ژنتیك 37
۲-۴-۶-۱ کدگذاری 37
۲-۴-۶-۲ ارزیابی 37
۲-۴-۶-۳ ترکیب 37
۲-۴-۶-۴ جهش 37
۲-۴-۶-۵ رمزگشایی 38
۲-۴-۷ چارت الگوریتم به همراه شبه كد آن 38
۲-۴-۷-۱ شبه كد و توضیح آن 38
۲-۴-۷-۲ چارت الگوریتم ژنتیک 40
۲-۴-۸ تابع هدف 41
۲-۴-۹ روشهای کد کردن 41
۲-۴-۹-۱ کدینگ باینری 42
۲-۴-۹-۲ کدینگ جایگشتی 42
۲-۴-۹-۳ کد گذاری مقدار 43
۲-۴-۹-۴ کدینگ درخت 44
۲-۴-۱۰ نمایش رشتهها 45
۲-۴-۱۱ جمعیت 46
۲-۴-۱۱-۱ ایجادجمعیت اولیه 46
۲-۴-۱۱-۲ اندازه جمعیت 46
۲-۴-۱۲ محاسبه برازندگی (تابع ارزش) 47
۲-۴-۱۳ انواع روشهای انتخاب 48
۲-۴-۱۳-۱ انتخاب چرخ رولت 49
۲-۴-۱۳-۲ انتخاب حالت پایدار 51
۲-۴-۱۳-۳ انتخاب نخبه گرایی 51
۲-۴-۱۳-۴ انتخاب رقابتی 51
۲-۴-۱۳-۵ انتخاب قطع سر 52
۲-۴-۱۳-۶ انتخاب قطعی بریندل 52
۲-۴-۱۳-۷ انتخاب جایگزینی نسلی اصلاح شده 53
۲-۴-۱۳-۸ انتخاب مسابقه 53
۲-۴-۱۳-۹ انتخاب مسابقه تصادفی 53
۲-۴-۱۴ انواع روشهای ترکیب 53
۲-۴-۱۴-۱ جابهجایی دودوئی 54
۲-۴-۱۴-۲ جابهجایی حقیقی 56
۲-۴-۱۴-۳ ترکیب تکنقطهای 57
۲-۴-۱۴-۴ ترکیب دو نقطهای 58
۲-۴-۱۴-۵ ترکیب n نقطهای 58
۲-۴-۱۴-۶ ترکیب یکنواخت 58
۲-۴-۱۴-۷ ترکیب حسابی 59
۲-۴-۱۴-۸ ترتیب 59
۲-۴-۱۴-۹ چرخه 60
۲-۴-۱۵ احتمال تركیب 60
۲-۴-۱۶ تحلیل مكانیزم جابجایی 61
۲-۴-۱۷ جهش 61
۲-۴-۱۷-۱ جهش باینری 63
۲-۴-۱۷-۲ جهش حقیقی 64
۲-۴-۱۷-۳ وارونه سازی بیت 64
۲-۴-۱۷-۴ تغییر ترتیب قرارگیری 64
۲-۴-۱۷-۵ وارون سازی 64
۲-۴-۱۷-۶ تغییر مقدار 65
۲-۴-۱۸ محک اختتام اجرای الگوریتم ژنتیک 65
۲-۴-۱۹ نقاط قوّت الگوریتمهای ژنتیک 66
۲-۴-۲۰ محدودیتهای GAها 68
۲-۵ آنالیز ضرایب پیشگویی خطی (LPC) 69
۲-۵-۱ محاسبه ضرایب LPC 70
فصل سوم 73
مروری برروش های عمده بهسازی گفتار 73
۳-۱ مقدمه 73
۳-۲ روش تفریق طیفی 74
۳-۳ روش فیلتر وینر 76
۳-۴ بهسازی گفتار با استفاده از مدل های آماری 78
۳-۴-۱ تخمین زننده لگاریتمی بر مبنای كمینه كردن خطای میانگین مربعات(Log MMSE) 78
۳-۴-۲ استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار 80
۳-۵ روش زیر فضای سیگنال 82
۳-۶ بهسازی گفتار با استفاده از تبدیل موجک 83
۳-۷ مقایسه روش ها و بررسی نقاط قوت و ضعف 85
۳-۷-۱ بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار 86
۲-۳-۲ چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف 87
۳-۸ نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار 89
۳-۸-۱ استفاده از سیستم های ترکیبی 89
۳-۸-۲ استفاده از پردازش های زیر باند و مزایای آن 89
۳-۸-۳ استفاده از میکروفون دوم 90
فصل چهارم : روش های پیشنهادی 92
۴-۱ مقدمه 92
۴-۲ روش های پیشنهادی 93
۴-۲-۱ بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 93
۴-۲-۱-۱ روش تفریق طیفی ضرایب موجک (WSS) 94
۴-۲-۱-۲ اصلاح روش تفریق طیفی ضرایب موجك (IWSS) 95
۴-۲-۱-۳ تخمین نویز 96
۴-۲-۱-۴ الگوریتم ژنتیک 97
۴-۲-۱-۴-۱ عملگر انتخاب 97
۴-۲-۱-۴-۲ عملگر برش 98
۴-۲-۱-۴-۳ عملگر جهش 98
۴-۲-۱-۴-۴ جمعیت اولیه 98
۴-۲-۱-۴-۵ تابع هدف 98
۴-۲-۲ بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 98
۴-۲-۲-۱ تخمین زننده Log MMSE در فضای موجک 99
۴-۲-۲-۲ تخمین نویز 100
فصل پنجم: نتایج و آزمایش ها 101
۵-۱ مقدمه 101
۵-۲ جزئیات پیاده سازی 102
۵-۳ نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 103
۵-۴ نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 106
فصل ششم: نتیجه گیری و پیشنهادها 109
۶-۱ نتیجه گیری 109
۶-۲ پیشنهاد برای کارهای آتی 111
مراجع 112