Иерархиялык жана бөлүүчү кластерлөөнүн ортосундагы айырма

Иерархиялык жана бөлүүчү кластерлөөнүн ортосундагы айырма
Иерархиялык жана бөлүүчү кластерлөөнүн ортосундагы айырма

Video: Иерархиялык жана бөлүүчү кластерлөөнүн ортосундагы айырма

Video: Иерархиялык жана бөлүүчү кластерлөөнүн ортосундагы айырма
Video: Ата-эне тегибиздин иерархиясы деген эмне? 2024, Ноябрь
Anonim

Иерархиялык жана Бөлүктүү кластерлөө

Кластерлөө – бул маалыматтарды анализдөө жана окшош маалыматтардын топторуна бөлүү үчүн машина үйрөнүү ыкмасы. Бул топтор же окшош маалыматтардын топтому кластерлер деп аталат. Кластердик анализ кластерлерди автоматтык түрдө аныктай ала турган кластерлөө алгоритмдерин карайт. Иерархиялык жана Бөлүктүү кластердик алгоритмдердин ушундай эки классы. Иерархиялык кластерлөө алгоритмдери маалыматтарды кластерлердин иерархиясына бөлөт. Парициондук алгоритмдер берилиштер топтомун бири-биринен ажыраган бөлүмдөргө бөлөт.

Иерархиялык кластерлөө деген эмне?

Иерархиялык кластерлөө алгоритмдери же кичине кластерлерди чоңураактарына бириктирүү же чоңураак кластерлерди кичинелерине бөлүү циклин кайталайт. Кандай болбосун, ал дендограмма деп аталган кластерлердин иерархиясын түзөт. Агломеративдик кластердик стратегия кластерлерди чоңураактарына бириктирүүнүн ылдыйдан өйдө карай ыкмасын колдонот, ал эми бөлүүчү кластердик стратегия кичинесинен жогорудан ылдыйга бөлүнүүнү колдонот. Эреже катары, ач көз мамиле ири/кичинекей кластерлерди бириктирүү/бөлүү үчүн колдонуларын чечүүдө колдонулат. Евклиддик аралык, Манхэттен аралыктары жана косинус окшоштуктары сандык маалыматтар үчүн окшоштуктун эң көп колдонулган көрсөткүчтөрүнүн бири. Сандык эмес маалыматтар үчүн Хэмминг аралыкы сыяктуу көрсөткүчтөр колдонулат. Иерархиялык кластерлөө үчүн иш жүзүндөгү байкоолор (инстанциялар) керек эмес экенин белгилей кетүү маанилүү, анткени аралыктардын матрицасы гана жетиштүү. Дендограмма - бул иерархияны абдан так көрсөткөн кластерлердин визуалдык көрүнүшү. Колдонуучу дендограмманын кесилген деңгээлине жараша ар кандай кластерлерди ала алат.

Бөлүктүү кластерлөө деген эмне?

Бөлүнүүчү кластерлөө алгоритмдери ар кандай бөлүмдөрдү жаратып, анан аларды кандайдыр бир критерийлер боюнча баалайт. Алар ошондой эле иерархиялык эмес деп аталат, анткени ар бир инстанция бири-бирин жокко чыгарган к кластердин бирине жайгаштырылган. Кластерлердин бир гана топтому типтүү бөлүү кластерлөө алгоритминин натыйжасы болгондуктан, колдонуучу кластерлердин керектүү санын (адатта k деп аталат) киргизүүнү талап кылат. Кеңири колдонулуучу бөлүү кластерлөө алгоритмдеринин бири к-медициналык кластерлөө алгоритми болуп саналат. Колдонуучу баштоодон мурун кластерлердин санын (k) бериши керек жана алгоритм адегенде k бөлүктөрүнүн борборлорун (же центроиддерин) баштайт. Кыскача айтканда, k-кластерлөө алгоритми андан кийин учурдагы борборлордун негизинде мүчөлөрдү дайындайт жана учурдагы мүчөлөрдүн негизинде борборлорду кайра баалайт. Бул эки кадам белгилүү бир кластер ичиндеги окшоштук максат функциясы жана кластер аралык айырмачылык максат функциясы оптималдаштырылганга чейин кайталанат. Ошондуктан, борборлорду акылга сыярлык инициализациялоо бөлүү кластерлөө алгоритмдеринен сапаттуу жыйынтыктарды алууда абдан маанилүү фактор болуп саналат.

Иерархиялык жана Бөлүктүү кластерлөөнүн ортосунда кандай айырма бар?

Иерархиялык жана Бөлүктүү кластерлөө иштөө убактысында, божомолдордо, киргизүү параметрлеринде жана натыйжадагы кластерлерде негизги айырмачылыктарга ээ. Адатта, бөлүү кластерлөө иерархиялык кластерге караганда ылдамыраак. Иерархиялык кластерлөө окшоштук көрсөткүчүн гана талап кылат, ал эми бөлүү кластерлөө кластерлердин саны жана баштапкы борборлор сыяктуу күчтүүрөөк божомолдорду талап кылат. Иерархиялык кластерлөө эч кандай киргизүү параметрлерин талап кылбайт, ал эми бөлүү кластерлөө алгоритмдери иштей баштоо үчүн кластерлердин санын талап кылат. Иерархиялык кластерлөө кластерлердин кыйла маңыздуу жана субъективдүү бөлүнүшүн кайтарат, бирок бөлүү кластерлери так k кластерлерди пайда кылат. Иерархиялык кластердик алгоритмдер категориялык маалыматтарга ылайыктуураак, эгерде окшоштук өлчөсү ошого жараша аныкталса.

Сунушталууда: