مهسا روانبخش

مهسا روانبخش

مطالب
ترتیب بر اساس: جدیدترینپربازدیدترین

فیلترهای جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

مقدمه ای بر فرآیند طراحی و تولید پایگاه داده ی گفتار هیجانی فارسی معیار(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازشناسی گفتار هیجانی پایگاه داده ی گفتار هیجانی حالت هیجانی عوامل پیرازبانی گفتار هیجانی

حوزه‌های تخصصی:
تعداد بازدید : ۳ تعداد دانلود : ۱
محرک های محیطی مختلف قادرند تا حالت هیجانی انسان را تحت تأثیر قرار داده و آنرا تغییر دهند. گفتار به دو طریق کلامی بواسطه ی واژگان و نحو و همچنین غیرکلامی بواسطه ی لحن و آهنگ گفتار، تغییرات حالت هیجانی را بیان می کند. لحن و آهنگ گفتار داری نقش پیرازبانی هستند و معنای گفتار را دستخوش تغییر می کنند. پردازش و مطالعه ی کمّی هیجان نخستین بار با مفهوم محاسبات عاطفی در علوم کامپیوتر مطرح شد. ایده ی اصلی این بود که ماشین بتواند حالت هیجانی انسان را بازشناسی و تفسیر کند و مطابق با آن پاسخ یا رفتار مناسب ارائه کند. مطالعه ی کمّی گفتار هیجانی با عنوان بازشناسی گفتار هیجانی شناخته می شود. بازشناسی یا دسته بندی گفتار هیجانی بدین معناست که بتوان حالت هیجانی گوینده را با استفاده از تحلیل انجام شده بر روی سیگنال گفتار مشخص کرد. نخستین گام برای انجام این گونه از مطالعات داشتن مجموعه ی دادگان غنی، استاندارد، با کیفیت و البته به تعداد مناسب برای ارزیابی الگوریتم های بازشناسی هیجان گفتار است. انواع گسترده و استاندارد مجموعه ی دادگان گفتار هیجانی به زبان های مختلف وجود دارند. عدم دسترسی پژوهشگران این حوزه به چنین پایگاه داده ای سبب شده است تا دانش ما پیرامون الگوهای هیجانی و تأثیر آن در زبان فارسی به وضوح آشکار نباشد. این نکته ضرورت وجود تهیه و تولید مجموعه ی دادگان گفتار هیجانی به زبان فارسی را نشان می دهد. در این مقاله قصد داریم فرآیند طراحی، تهیه و تولید مجموعه ی دادگان گفتار هیجانی فارسی معیار مشابه با مجموعه ی دادگان گفتار هیجانی برلین که قابلیت استفاده در مطالعات بازشناسی گفتار هیجانی را داراست تشریح کنیم.
۲.

ارزیابی هیجان ضمن پیام از طریق پردازش گفتار هیجانی مبتنی بر استفاده از ویژگی های MFCC و STFT(مقاله علمی وزارت علوم)

کلیدواژه‌ها: گفتار هیجانی بازشناسی هیجان تبدیل فوریه کوتاه مدت ضرایب کپسترال فرکانس مل پردازش گفتار هیجانی

حوزه‌های تخصصی:
تعداد بازدید : ۶۰۳ تعداد دانلود : ۴۷۰
مقدمه: گفتار مؤثرترین ابزاری است که انسان ها برای انتقال اطلاعات از آن استفاده می کنند. گوینده در خلال گفتار خویش علاوه بر واژگان و دستور زبان اطلاعاتی همچون سن، جنسیت و حالت هیجانی خود را منتقل می کند. پژوهش های فراوانی با رویکردهای گوناگون پیرامون هیجان در گفتار هیجانی انجام شده است. این پژوهش ها نشان می دهند که هیجان ضمن پیام در گفتار هیجانی از طبیعتی پویا برخودار می باشد. این پویایی، مطالعه کمّی هیجان در گفتار هیجانی را با دشواری همراه می سازد. این پژوهش به ارزیابی هیجان ضمن پیام از طریق پردازش گفتار هیجانی با استفاده از ویژگی های ضرایب کپسترال فرکانس مِل ( MFCC ) و تبدیل فوریه زمان کوتاه ( STFT ) پرداخت. روش کار: داده های ورودی، پایگاه داده استاندارد گفتار هیجانی Berlin شامل هفت حالت هیجانی خشم، کسلی، انزجار، ترس، شادی، غم و حالت خنثی می باشد. با استفاده از نرم افزار MATLAB ابتدا فایل های صوتی خوانده شدند. در مرحله بعد نخست ویژگی های MFCC و سپس ویژگی های STFT استخراج شدند. بردار های ویژگی برای هر کدام از ویژگی ها بر اساس هفت مقدار آماری کمینه، بیشینه، میانگین، انحراف معیار، میانه، چولگی و کشیدگی محاسبه شدند و به عنوان ورودی شبکه عصبی مصنوعی مورد استفاده قرار گرفتند. در انتها، بازشناسی حالت های هیجانی با استفاده از توابع آموزشی مبتنی بر الگوریتم های مختلف انجام شد. یافته ها: نتایج بدست آمده نشان داد میانگین و صحت بازشناسی حالت های هیجانی با استفاده از ویژگی های STFT نسبت به ویژگی های MFCC بهتر است. همچنین، حالت های هیجانی خشم و غم از نرخ بازشناسی بهتری برخوردار بودند. نتیجه گیری: ویژگی های STFT نسبت به ویژگی های MFCC هیجان ضمن پیام در گفتار هیجانی را بهتر بازنمایی می کنند.

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان