توضیحات
تشخیص احساسات بر اساس گفتار
هدف از این پروژه تشخیص احساسات (emotion recognition) از گفتار می باشد.
بدین صورت که از 3 الی 4 نفر زن و همچنین 3 الی 4 نفر مرد جمله ای را به عنوان مثال “کتابم را بیاور” با 4 حالت متفاوت (دستوری، خواهشی، عصبانیت و خوشحالی) با پسوند wav ذخیره نموده.
سپس هر سیگنال به فریم هایی که با پنجره گذاری همینگ و با 50% همپوشانی ایجاد شده، تقسیم می گردد.
پس از آن از هر فریم ویژگی هایی مانند: انرژی، تعداد عبور از صفر، میانگین، مینیمم، ماکزیمم، 10 ضریب اول DTFT و فرکانس pitch، 3 فرکانس فرمنت و 10 ضریب فیلتر lpc استخراج می شود.
همچنین برای هر جمله ضرایب jitter و shimmer استخراج می گردد.
پس از استخراج ویژگی با هدف تشخیص احساسات، طبقه بند نزدیکترین همسایه (KNN) به کار گرفته می شود، که 75% فریم ها به عنوان آموزش و 25% ما بقی برای ارزیابی مدل استفاده می گردد.
بر اساس طبقه بند در نظر گرفته شده میزان درستی (accuracy) تشخیص احساسات، با استاندارد 25% فریم ها مشخص می گردد.
همچنین می توان از شبکه عصبی MLP برای طبقه بندی استفاده نموده و میزان درستی (accuracy) تشخیص احساسات را با خروجی حاصل از طبقه بند KNN مقایسه نمود.
شبیه سازی تشخیص احساسات بر اساس گفتار با متلب
توسط کارشناسان سایت متلبی انجام شده است و به تعداد محدودی قابل فروش می باشد.
سفارش انجام پروژه مشابه
درصورتیکه این محصول دقیقا مطابق خواسته شما نمی باشد،. با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.