خوشهبندی مبتنی بر مدل پرکاربردترین روش خوشهبندی آماری است، که در آن دادههای ناهمگن با استفاده از استنباط بر اساس مدلهای آمیخته به گروههایی همگن تقسیم میشوند. وجود خطای اندازهگیری در دادهها میتواند کیفیت خوشهبندی را کاهش و به عنوان مثال، موجب بیشبرازشی و تولید خوشههای جعلی شود. برای رفع این مشکل، خوشهبندی مبتنی بر مدل با فرض توزیع نرمال برای خطای اندازهگیری معرفی شده است. با وجود این، مقدارهای خیلی بزرگ یا خیلی کوچک (دورافتاده) از خطاهای اندازهگیری باعث عملکرد ضعیف روشهای خوشهبندی موجود میشوند. برای رفع این مشکل و ساختن یک مدل استوار نسبت به حضور خطاهای اندازهگیری دورافتاده در دادهها، در این مقاله برای خطای اندازهگیری توزیع آلفا-پایدار متقارن جایگزین توزیع نرمال میشود و با استفاده از الگوریتم EM و روشهای عددی، پارامترهای مدل برآورد میشوند. با استفاده از شبیهسازی و تحلیل داده واقعی به مقایسه مدل جدید ارائه شده با روش خوشهبندی مبتنی بر مدل با روش MCLUST، در حالتهای با و بدون خطای اندازهگیری پرداخته و کارایی مدل پیشنهادی برای خوشهبندی دادهها در حضور انواع خطاهای اندازهگیری دورافتاده، نشان داده میشود.
Moradi M, Zarei S. Robust Model-Based Clustering Using the Symmetric alpha-Stable Distribution for Measurement Error. JSS 2024; 18 (1) URL: http://jss.irstat.ir/article-1-888-fa.html
مرادی مژگان، زارعی شاهو. خوشهبندی استوار مبتنی بر مدل با استفاده از توزیع -αپایدار متقارن برای خطای اندازهگیری. مجله علوم آماری. 1403; 18 (1)