توضیحات
Anomaly Detection via Online Oversampling Principal Component Analysis
ارائه نسخه مناسب تر و سریع از الگوریتم PCA برای تشخیص و حذف داده های پرتی
هدف کلی:
ارائه نسخه مناسب تر و سریع از الگوریتم PCA برای تشخیص و حذف داده های پرتی
هدف در این مقاله حل مشکل استفاده از روش PCA روی ماتریس های بزرگ است.
به همین منظور نه از طریق محاسبه صرفا بردار ویژه بلکه با محاسبه پی در پی این بردارها مبنتی بر معیار بهینگی که در این جا در فایل Sc_method قرار گرفته است و همچنین فیلتر نمودن اعداد به این هدف می رسد.
این الگوریتم برای مسائلی مانند دسته سوالاتی که در آنالیز داده های اختر شناسی و همچنین داده های متنی بسیار کاربرد خواهد داشت.
در این روش که در مقاله ارائه شده است حدالامکان از تکرار استفاده می شود و هیچ کدام از ماتریس های کوواریانس و همچنین ماتریس داده اصلی ذخیر نمی شوند.
برای تشخیص داده های پرت روش های مختلف دیگری ارائه شده اند که از آن جمله می توان به روش های آمار اشاره کرد که در آن بطور پیش فرض توزیعی در نظر گرفته می شود و اگر داده ها از این توزیع خارج بودند به عنوان داده های پرتی در نظر گرفته می شوند و معمولا این روش قابلیت اتکا ندارد.
در روش های مبتنی بر فاصله یابی نیز فاصله بین هر داده با داده های همسایه محاسبه گردیده و اگر این فاصله از یک حد تعیین شده ای تجاور نماید داده به عنوان پرتی در نظر گرفته می شود.
برای حل مشکلات اشاره شده نیز روشی به نام روش مبتنی بر چگالی ارائه شد که در آن از توزیع و وشباهت های مجموعه داده های شبیه به هم استفاده می شود.
این الگوریتم با توجه به اینکه نیاز به تخمین نوع توزیع دارند بسیار زمان گیر می باشند که بهمین دلیل نیز گسترش های مختلفی از آنها ارائه شده است.
روش پایه مورد استفاده در این مقاله PCA می باشد که در آن باید داده های ماتریس و بردار ویژه آنها و میانگین کل محاسبه گردد.
اما در بسیاری از مسایل اندازه داده های بسیار زیاد است که بهمین امکان دلیل استفاده از PCA امکان پذیر نمی باشد.
در رویکردی که د راین مقاله ارائه شده است مهم ترین فاکتور محاسبه جنس اصلی داده ها بدون نیاز به حل چندباره یافتن مقدار ویژه است.
در حالت اصلی سناریو LOO بایستی برای پیدا کردن نارسایی داده ایی مساله الگوریتم عادی PCA
بارها و بارها و به تعداد داده ها اجرا گردد و برای بروز رسانی ماتریس کواریانس به همان تعداد که گفته شده بروز رسانی نیاز می باشد. برای حل این مشکل نیز الگوریتم PowerMethod ارائه شده است.
در ادامه کدهای برنامه را مرور می کنیم.
خط زیر با افزودن مسیرهای برنامه باعث شناسایی برنامه های نوشته شده ما و قابل اجرا شدن آنها در متلب می گردد.
addpath(genpath(‘.’));
در کد زیر مجموعه داده
Pendigits
به برنامه متلب فراخوانده می شود همانگونه که مقاله مبنا از این داده استفاده کرده است.
data=load(‘pendigits.tes’);
اجرای الگوریتم خواسته شده که همان الگوریتمی است که در مقاله بوده و پیاده سازی شده است.
[r raw_data d]=MainOPCA(data,alpha_var);
…
نتایج بدست آمده از شبیه سازی با متلب:
کلید واژه : بردار ویژه,پروژه متلب,شبیه سازی با متلب,matlab project,پروژه matlab,پروژه های آماده متلب,
Anomaly detection, online updating, least squares, oversampling, principal component analysis
شبیه سازی
Anomaly Detection via Online Oversampling Principal Component Analysis
به تعداد محدودی قابل فروش می باشد.
سفارش انجام پروژه مشابه
درصورتیکه این محصول دقیقا مطابق خواسته شما نمی باشد،. با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.