Data Mining vs OLAP
Маалыматтарды иштетүү жана OLAP экөө тең жалпы Business Intelligence (BI) технологияларынын экөөсү болуп саналат. Бизнес чалгындоо бизнес маалыматтарынан пайдалуу маалыматты аныктоо жана алуу үчүн компьютердик ыкмаларды билдирет. Маалыматтарды казып алуу - бул маалыматтын чоң топтомдорунан кызыктуу үлгүлөрдү алуу менен алектенген информатика тармагы. Ал жасалма интеллект, статистика жана маалымат базасын башкаруунун көптөгөн ыкмаларын бириктирет. OLAP (онлайн аналитикалык иштетүү) аты айтып тургандай, көп өлчөмдүү маалымат базаларын суроо жолдорунун жыйындысы.
Маалыматтарды казып алуу маалыматтарда билимди ачуу (KDD) катары да белгилүү. Жогоруда айтылгандай, бул чийки маалыматтардан мурда белгисиз жана кызыктуу маалыматтарды алуу менен алектенген информатика тармагы. Маалыматтардын экспоненциалдуу өсүшүнөн улам, айрыкча бизнес сыяктуу тармактарда, маалыматтарды казып алуу бул чоң маалыматтарды бизнес-интеллектке айландыруу үчүн абдан маанилүү инструмент болуп калды, анткени акыркы бир нече он жылдыкта үлгүлөрдү кол менен алуу мүмкүн эместей көрүндү. Мисалы, азыркы учурда социалдык тармактарды талдоо, алдамчылыкты аныктоо жана маркетинг сыяктуу ар кандай колдонмолор үчүн колдонулат. Маалыматтарды казып алуу, адатта, төмөнкү төрт тапшырма менен алектенет: кластерлөө, классификация, регрессия жана ассоциация. Кластерлөө структураланбаган маалыматтардан окшош топторду аныктоо болуп саналат. Классификация - бул жаңы маалыматтарга колдонула турган үйрөнүү эрежелери жана адатта төмөнкү кадамдарды камтыйт: маалыматтарды алдын ала иштетүү, моделдештирүү, үйрөнүү/функцияларды тандоо жана баалоо/текшерүү. Регрессия – бул маалыматтарды моделдөө үчүн минималдуу ката менен функцияларды табуу. Ал эми ассоциация өзгөрмөлөр ортосундагы мамилелерди издеп жатат. Дайындарды иштетүү адатта Wal-Martта келерки жылы жогорку киреше алууга жардам бере турган негизги өнүмдөр кандай деген суроолорго жооп берүү үчүн колдонулат.
OLAP – көп өлчөмдүү суроолорго жооп берген системалардын классы. Адатта OLAP маркетинг, бюджет түзүү, болжолдоо жана ушул сыяктуу колдонмолор үчүн колдонулат. OLAP үчүн колдонулган маалымат базалары тез иштөөнү эске алуу менен татаал жана убактылуу сурамдар үчүн конфигурацияланганы айтпаса да түшүнүктүү. Адатта матрица OLAPтын чыгышын көрсөтүү үчүн колдонулат. Саптар жана мамычалар суроонун өлчөмдөрү боюнча түзүлөт. Алар көбүнчө жыйынтыктарды алуу үчүн бир нече таблицаларда топтоо ыкмаларын колдонушат. Мисалы, былтыркыга салыштырмалуу Wal-Martта ушул жылдын сатуулары жөнүндө билүүгө болот? Кийинки чейректеги сатуунун болжолу кандай? Проценттин өзгөрүшүнө карап, тренд жөнүндө эмне айтууга болот?
Data mining жана OLAP окшош экени анык болсо да, алар интеллект алуу үчүн маалыматтар менен иштешет, бирок негизги айырма алардын маалыматтар менен иштөөсүнөн келип чыгат. OLAP инструменттери көп өлчөмдүү маалыматтарды талдоону камсыз кылат жана алар маалыматтардын кыскача резюмесин камсыз кылат, бирок карама-каршы, маалыматтарды казып алуу маалыматтар топтомундагы катыштарга, калыптарга жана таасирлерге багытталган. Бул топтоо менен OLAP келишими, ал "кошумча" аркылуу маалыматтарды иштетүүгө чейин жетет, бирок маалыматтарды казып алуу "бөлүнүүгө" туура келет. Дагы бир көрүнүктүү айырмасы, маалыматтарды казып алуу куралдары маалыматтарды моделдөө жана иш-аракет кылууга мүмкүн болгон эрежелерди кайтаруу менен бирге, OLAP реалдуу убакытта бизнес өлчөмү боюнча салыштыруу жана контраст ыкмаларын жүргүзөт.