هدف از توسعه این ابزارک (Toolbox) جمعآوری یک ابزار استاندارد و قابل گسترش مداوم است که برای هر کاربر MATLAB قابل استفاده باشد. در فصل 1 از مستندات قابل دانلود مرتبط با این ابزارک، یک معرفی نظری ارائه شده است که شامل توضیحاتی در مورد نظریه الگوریتمها، تعریف معیارهای اعتبارسنجی و ابزارهای تجسم دادهها است که کمک میکنند تا کاربر به راحتی فایلهای برنامهنویسی شده MATLAB را درک کند.
در فصل 2، فایلها و توضیحاتی در مورد الگوریتمهای خاص آورده شده است و با مثالهای ساده توضیح داده شدهاند. در فصل 3، این ابزارک بر روی دادههای واقعی آزمایش شده است و در حل سه مشکل خوشهبندی (Clustering) مورد استفاده قرار گرفته است: مقایسه و انتخاب الگوریتمها، برآورد تعداد خوشههای بهینه، و بررسی مجموعه دادههای چندبعدی.
درباره ابزارک (Toolbox)
ابزارک خوشهبندی فازی و تحلیل دادهها مجموعهای از توابع MATLAB است. این ابزارک پنج دسته اصلی از توابع را فراهم میآورد:
-
الگوریتمهای خوشهبندی (Clustering Algorithms): این توابع دادههای ورودی را با استفاده از رویکردهای مختلف به خوشهها تقسیم میکنند. دو روش خوشهبندی سخت شامل توابع Kmeans و Kmedoid است که به ترتیب روشهای تقسیمبندی سخت هستند. همچنین، توابع FCMclust، GKclust، و GGclust روشهای تقسیمبندی فازی هستند که از نُرمهای فاصله مختلف استفاده میکنند.
-
ارزیابی با استفاده از پروتوتایپهای خوشه (Evaluation with Cluster Prototypes): پس از اجرای خوشهبندی بر روی دادهها، این توابع به شما امکان میدهند که عضویت دادههای جدیدی که قبلاً مشاهده نشدهاند را محاسبه کنید. در حالت دو بعدی، این توابع نقشههای کانتور در فضای دادهها رسم میکنند تا نتایج خوشهبندی را به صورت بصری نمایش دهند.
-
اعتبارسنجی (Validation): تابع اعتبارسنجی ابزارک، معیارهای اعتبار خوشهبندی را برای هر تقسیمبندی فراهم میآورد. این ابزار برای مواقعی مفید است که تعداد خوشهها به صورت پیشفرض مشخص نباشد. بهترین تقسیمبندی میتواند با استفاده از نقاط حدی (Extrema) شاخصهای اعتبار در وابستگی به تعداد خوشهها تعیین شود. شاخصهای محاسبه شده شامل: Partition Coefficient (PC)، Classification Entropy (CE)، Partition Index (SC)، Separation Index (S)، Xie and Beni’s Index (XB)، Dunn’s Index (DI) و Alternative Dunn Index (DII) میباشد.
-
تجسم دادهها (Visualization): بخش تجسم این ابزارک شامل نقشهبرداری سمون (Sammon mapping) از دادهها است. این روش نقشهبرداری یک روش مقیاسگذاری چندبعدی است که توسط Sammon توضیح داده شده است و برای نمایش دادهها در فضای کمبعدی استفاده میشود.
-
مثالها (Examples): یک مثال مبتنی بر مجموعه دادههای صنعتی برای نمایش کارآمدی این ابزارک و الگوریتمهای آن در اختیار کاربران قرار داده شده است. این مثال به کاربران کمک میکند تا بتوانند استفاده عملی از این ابزارک را در شرایط واقعی مشاهده کنند.
کاربردها و ویژگیها:
این ابزارک بهویژه برای تحلیل و خوشهبندی دادههای پیچیده چندبعدی بسیار مفید است. از آنجا که بسیاری از دادهها ممکن است ابعاد زیادی داشته باشند، این ابزارک به تحلیلگران و پژوهشگران کمک میکند تا با استفاده از الگوریتمهای مختلف، دادهها را به خوشههای معنیدار تقسیمبندی کنند. علاوه بر این، با استفاده از ابزارهای اعتبارسنجی مختلف، میتوان بهترین تعداد خوشهها را شناسایی کرده و به بهینهسازی فرآیند خوشهبندی کمک کرد.
همچنین، این ابزارک از لحاظ تجسم نتایج بسیار مفید است و با استفاده از نقشهبرداری سمون میتوان دادهها را در یک فضای کمبعدی نمایش داد که تحلیل و بررسی دادهها را راحتتر میکند.
