Data mining vs Data Warehouse
Маалыматтарды казып алуу жана маалымат кампасы - бул маалыматтарды талдоо үчүн абдан күчтүү жана популярдуу ыкмалар. Статистикага ыктаган колдонуучулар Data Mining колдонушат. Алар маалыматтарда жашырылган үлгүлөрдү издөө үчүн статистикалык моделдерди колдонушат. Маалымат кенчилери ар кандай маалымат элементтеринин ортосундагы пайдалуу мамилелерди табууга кызыкдар, бул акырында бизнес үчүн пайдалуу. Бирок, экинчи жагынан, бизнестин өлчөмдөрүн түздөн-түз талдай алган маалымат эксперттери Маалымат кампаларын колдонушат.
Маалыматтарды казып алуу маалыматтарда билимди ачуу (KDD) катары да белгилүү. Жогоруда айтылгандай, бул чийки маалыматтардан мурда белгисиз жана кызыктуу маалыматтарды алуу менен алектенген информатика тармагы. Маалыматтардын экспоненциалдуу өсүшүнөн улам, айрыкча бизнес сыяктуу тармактарда, маалыматтарды казып алуу бул чоң маалыматтарды бизнес-интеллектке айландыруу үчүн абдан маанилүү инструмент болуп калды, анткени акыркы бир нече он жылдыкта үлгүлөрдү кол менен алуу мүмкүн эместей көрүндү. Мисалы, азыркы учурда социалдык тармактарды талдоо, алдамчылыкты аныктоо жана маркетинг сыяктуу ар кандай колдонмолор үчүн колдонулат. Маалыматтарды казып алуу, адатта, төмөнкү төрт тапшырма менен алектенет: кластерлөө, классификация, регрессия жана ассоциация. Кластерлөө структураланбаган маалыматтардан окшош топторду аныктоо болуп саналат. Классификация жаңы маалыматтарга колдонула турган үйрөнүү эрежелери болуп саналат жана адатта төмөнкү кадамдарды камтыйт: маалыматтарды алдын ала иштетүү, моделдештирүү, үйрөнүү/функцияларды тандоо жана баалоо/текшерүү. Регрессия – бул маалыматтарды моделдөө үчүн минималдуу ката менен функцияларды табуу. Ал эми ассоциация өзгөрмөлөр ортосундагы мамилелерди издеп жатат. Дайындарды иштетүү адатта Wal-Martта келерки жылы жогорку киреше алууга жардам бере турган негизги өнүмдөр кайсылар деген суроолорго жооп берүү үчүн колдонулат?
Жогоруда айтылгандай, маалымат кампасы маалыматтарды талдоо үчүн да колдонулат, бирок колдонуучулардын ар кандай топтому жана бир аз башкача максатты көздөйт. Мисалы, чекене секторго келгенде, Маалымат кампасынын колдонуучулары кардарлардын арасында кандай сатып алуулар популярдуу экенине көбүрөөк кызыкдар, андыктан талдоо натыйжалары кардар тажрыйбасын жакшыртуу аркылуу кардарга жардам берет. Бирок маалымат кенчилери адегенде гипотезаны болжолдойт, мисалы, кайсы кардарлар продуктунун белгилүү бир түрүн сатып алышат жана гипотезаны текшерүү үчүн маалыматтарды талдап чыгышат. Маалыматтарды сактоону алгач дүкөндөрүн бирдей өлчөмдөгү өнүмдөр менен сактаган ири сатуучу жүргүзүшү мүмкүн, кийинчерээк Нью-Йорктогу дүкөндөр Чикагодогу дүкөндөргө караганда кичине өлчөмдөгү инвентарларды тезирээк сатаарын билишет. Ошентип, бул жыйынтыкка карап, сатуучу Нью-Йорк дүкөнүн Чикагодогу дүкөндөргө салыштырмалуу кичине өлчөмдөгү менен камдай алат.
Ошондуктан, сиз даана көрүп тургандай, анализдин бул эки түрү жөн эле көзгө бир мүнөздүү көрүнөт. Экөө тең тарыхый маалыматтардын негизинде кирешени көбөйтүүгө кам көрүшөт. Бирок, албетте, негизги айырмачылыктар бар. Жөнөкөй сөз менен айтканда, Data Mining жана Data Warehouseing аналитиканын ар кандай түрлөрүн берүүгө арналган, бирок, албетте, колдонуучулардын ар кандай түрлөрү үчүн. Башка сөз менен айтканда, Data Mining статистикалык гипотезаны колдоо үчүн корреляцияларды, үлгүлөрдү издейт. Бирок, Маалымат кампасы салыштырмалуу кененирээк суроого жооп берет жана келечектеги жакшыртуу жолдорун таануу үчүн ал жерден алынган маалыматтарды кесип жана майдалайт.