خوشهبندی شاید یکی از مواردی باشد که به طور گسترده در زمینه داده کاوی و یادگیری ماشین مورد مطالعه قرارگرفته است. خوشه بندی شامل طیف گستردهای از حوزه های مانند متن، بازاریابی، شبکههای اجتماعی و دادههای بیولوژیکی است. علاوه بر این، الگوریتمهای خوشه بندی بستگی زیادی به دامنه داده ها و سناریوی مسئله دارند.
بنابراین، این کتاب به سه جنبه اصلی خوشه بندی داده ها میپردازد: اولین مجموعه از فصلها روی روشهای پایه و کلاسیک برای طبقه بندی داده ها متمرکز خواهند شد. اینها شامل روشهایی مانند خوشه بندی سلسله مراتبی، خوشهبندی افرازی است. فصلهای بعدی به حوزه ها و سناریوهای جدید خوشه بندی مانند روشهای مبتنی بر هندسه، روشهای مبتنی بر گراف، روشهای مبتنی بر مشبک و روشهای مبتنی بر چگالی متمرکز میشوند. مجموعه فصلها به دلیل ایجاد ذهنیت از فرآیند خوشه بندی و روشهای مختلفی که میتوانند دانشی یکسان از مجموعه داده های یکسان را ارائه دهند، به بینشهای تفصیلی مختلفی از فرآیند خوشه بندی تمرکز خواهند کرد. پاسخ به اینکه چگونه میدانیم یک خوشه بندی خاص خوب است یا نیازهای آن کاربرد خاص را برطرف میکند؟ روشهای بیشماری وجود دارد که میتوان این موضوعات را بررسی کرد.
کتاب خوشه بندی در یادگیری ماشین