DBMS vs Data Mining
DBMS (Database Management System) – бул санариптик маалымат базаларын башкаруу үчүн колдонулган толук система, ал маалымат базасынын мазмунун сактоого, маалыматтарды түзүүгө/текшерүүгө, издөөгө жана башка функцияларга мүмкүндүк берет. Башка жагынан алганда, Data Mining - бул чийки маалыматтардан мурда белгисиз жана кызыктуу маалыматтарды алуу менен алектенген информатика тармагындагы. Адатта, маалымат казып алуу процессине киргизүү катары колдонулган маалыматтар маалымат базаларында сакталат. Статистикага ыктаган колдонуучулар Data Mining колдонушат. Алар маалыматтарда жашырылган үлгүлөрдү издөө үчүн статистикалык моделдерди колдонушат. Маалымат кенчилери ар кандай маалымат элементтеринин ортосундагы пайдалуу мамилелерди табууга кызыкдар, бул акырында бизнес үчүн пайдалуу.
DBMS
DBMS, кээде жөн эле маалымат базасынын менеджери деп аталат, бул системада орнотулган бардык маалымат базаларын башкаруу (б.а. уюштуруу, сактоо жана издөө) үчүн арналган компьютердик программалардын жыйындысы (мисалы, катуу диск же тармак). Дүйнөдө маалыматтар базасын башкаруу системаларынын ар кандай түрлөрү бар жана алардын айрымдары белгилүү бир максаттар үчүн конфигурацияланган маалымат базаларын туура башкаруу үчүн иштелип чыккан. Эң популярдуу коммерциялык маалыматтар базасын башкаруу системалары Oracle, DB2 жана Microsoft Access болуп саналат. Бул өнүмдөрдүн бардыгы ар кандай колдонуучулар үчүн ар кандай деңгээлдеги артыкчылыктарды бөлүштүрүү каражаттарын камсыздайт, бул МББны бир администратор тарабынан борборлоштурулган башкарууга же бир нече ар кандай адамдарга бөлүштүрүүгө мүмкүндүк берет. Ар кандай маалымат базасын башкаруу системасында төрт маанилүү элемент бар. Алар моделдөө тили, маалымат структуралары, суроо тили жана транзакциялардын механизми. Моделдөө тили МБЖда жайгашкан ар бир маалымат базасынын тилин аныктайт. Азыркы учурда иерархиялык, тармактык, реляциялык жана объекти сыяктуу бир нече популярдуу ыкмалар практикада. Маалымат структуралары жеке жазуулар, файлдар, талаалар жана алардын аныктамалары жана визуалдык медиа сыяктуу объектилер сыяктуу маалыматтарды уюштурууга жардам берет. Берилиштерди суроо тили логин маалыматтарын, ар кандай колдонуучуларга кирүү укуктарын жана системага маалыматтарды кошуу үчүн протоколдорду көзөмөлдөө аркылуу маалымат базасынын коопсуздугун камсыздайт. SQL реляциялык маалыматтар базасын башкаруу системаларында колдонулган популярдуу суроо тили. Акыр-аягы, транзакцияларды жүргүзүүгө мүмкүндүк берүүчү механизм параллелдүүлүккө жана көптүктү сактоого жардам берет. Бул механизм бир эле жазуу бир эле учурда бир нече колдонуучу тарабынан өзгөртүлбөй тургандыгына ынанып, маалыматтардын бүтүндүгүн тактыкта сактайт. Кошумча, DBMS камдык көчүрмөнү жана башка мүмкүнчүлүктөрдү берет.
Data Mining
Маалыматтарды казып алуу маалыматтарда билимди ачуу (KDD) катары да белгилүү. Жогоруда айтылгандай, бул чийки маалыматтардан мурда белгисиз жана кызыктуу маалыматтарды алуу менен алектенген информатиканын фелиди. Маалыматтардын экспоненциалдуу өсүшүнөн улам, айрыкча бизнес сыяктуу тармактарда, маалыматтарды казып алуу бул чоң маалыматтарды бизнес-интеллектке айландыруу үчүн абдан маанилүү инструмент болуп калды, анткени акыркы бир нече он жылдыкта үлгүлөрдү кол менен алуу мүмкүн эместей көрүндү. Мисалы, азыркы учурда социалдык тармактарды талдоо, алдамчылыкты аныктоо жана маркетинг сыяктуу ар кандай колдонмолор үчүн колдонулат. Маалыматтарды казып алуу, адатта, төмөнкү төрт тапшырма менен алектенет: кластерлөө, классификация, регрессия жана ассоциация. Кластерлөө структураланбаган маалыматтардан окшош топторду аныктоо болуп саналат. Классификация жаңы маалыматтарга колдонула турган үйрөнүү эрежелери болуп саналат жана адатта төмөнкү кадамдарды камтыйт: маалыматтарды алдын ала иштетүү, моделдештирүү, үйрөнүү/функцияларды тандоо жана баалоо/текшерүү. Регрессия – бул маалыматтарды моделдөө үчүн минималдуу ката менен функцияларды табуу. Ал эми ассоциация өзгөрмөлөр ортосундагы мамилелерди издеп жатат. Дайындарды иштетүү адатта Wal-Martта келерки жылы жогорку киреше алууга жардам бере турган негизги өнүмдөр кайсылар деген суроолорго жооп берүү үчүн колдонулат?
ДББС менен Маалыматтарды иштетүүнүн ортосунда кандай айырма бар?
ДББС – бул санариптик маалымат базаларынын топтомун башкаруу жана башкаруу үчүн толук кандуу система. Бирок Data Mining - бул чийки маалыматтардан пайдалуу жана мурда белгисиз маалыматтарды алуу менен алектенген информатикадагы техника же түшүнүк. Көпчүлүк учурда, бул чийки маалыматтар абдан чоң маалымат базаларында сакталат. Ошентип, маалымат кенчилери ДБМдин учурдагы функцияларын Деректерди казып алуу процессине чейин жана анын жүрүшүндө чийки маалыматтарды иштетүү, башкаруу жана ал тургай алдын ала иштетүү үчүн колдонушат. Бирок, бир гана DBMS системасы маалыматтарды талдоо үчүн колдонулушу мүмкүн эмес. Бирок, учурда кээ бир СББларда маалыматтарды талдоо куралдары же мүмкүнчүлүктөрү камтылган.