1-1. خوشه‌بندی

در روش بانظارت ما ورودی (داده یادگیری[6]) و خروجی (كلاس[7] داده) یک مجموعه داده را به الگوریتم هوشمند می‌دهیم تا آن الگوی[8] بین ورودی و خروجی را تشخیص دهد در این روش خروجی كار ما مدلی[9] است كه می‌تواند برای ورودی‌های جدید خروجی درست را پیش‌بینی[10] كند. روش‌های طبقه‌بندی[11] و قوانین انجمنی[12] از این جمله تكنیك‌ها می‌باشد. روش‌های با نظارت كاربرد فراوانی دارند اما مشكل عمده این روش‌ها این است كه همواره باید داده‌ای برای یادگیری وجود داشته باشد كه در آن به ازای ورودی مشخص خروجی درست آن مشخص شده باشد. حال آنكه اگر در زمینه‌ای خاص داده‌ای با این فرمت وجود نداشته باشد این روش‌ها قادر به حل این‌گونه مسائل نخواهند بود [29, 68]. در روش بدون نظارت برخلاف یادگیری بانظارت هدف ارتباط ورودی و خروجی نیست، بلکه تنها دسته‌بندی

خرید اینترنتی فایل متن کامل :

 

 مقالات و پایان نامه ارشد

 ورودی‌ها است. این نوع یادگیری بسیار مهم است چون  خیلی از مسائل (همانند دنیای ربات‌ها) پر از ورودی‌هایی است که هیچ برچسبی[13] (كلاس) به آن‌ ها اختصاص داده نشده است اما به وضوح جزئی از یک دسته هستند [46, 68]. خوشه‌بندی[14] شاخص‌ترین روش در داده‌كاوی جهت حل مسائل به صورت بدون ناظر است. ایده اصلی خوشه‌بندی  اطلاعات، جدا کردن نمونه‌ها از یكدیگر و قرار دادن آن‌ ها در گروه‌های شبیه به هم می‌باشد. به این معنی كه نمونه‌های شبیه به هم باید در یک گروه قرار بگیرند و با نمونه‌های گروه‌های دیگر حداكثر متفاوت را دارا باشند [20, 26]. دلایل اصلی برای اهمیت خوشه‌بندی عبارت‌اند از:

اول، جمع‌ آوری و برچسب‌گذاری یک مجموعه بزرگ از الگوهای نمونه می‌تواند بسیار پركاربرد و باارزش باشد.

دوم، می‌توانیم از روش‌های خوشه‌بندی برای پیدا کردن و استخراج ویژگی‌ها[15] و الگوهای جدید استفاده كنیم. این كار می‌تواند كمك به سزایی در كشف دانش ضمنی[16] داده‌ها انجام دهد.

سوم، با خوشه‌بندی می‌توانیم یک دید و بینشی از طبیعت و ساختار داده به دست آوریم كه این می‌تواند برای ما باارزش باشد.

چهارم، خوشه‌بندی می‌تواند منجر به كشف زیر رده‌های[17] مجزا یا شباهت‌های بین الگوها ممكن شود كه به طور چشمگیری در روش طراحی طبقه‌بندی قابل استفاده باشد.

 

 

 


 
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...