DATA MINING METHODS FOR ECONOMICS - SAS ENTERPRISE MINER 2400-ZEWW236
During seminars the following essential problems for Data Mining analysis will be considered:
1. Initial data analysis: qualitative data analysis methods, quantitative data analysis methods.
Fuzzy sets and rough sets.
2. Discriminant analysis. Logistic regression. Factor analysis and principal component analysis.
3. Classification and regression trees. Generating fuzzy rules.
4. Cluster analysis. Fuzzy method of cluster analysis. Muti-layer undirectional neural networks. Kohonen neural networks.
5. Genetic algorithms. Chaos theory. Correspondence analysis.
6. Methodology of the SEMMA data mining process. Data mining tools that support the analysis at respective SEMMA stages. Stages in the SEMMA methodology and the structure of data analysis diagrams. General rules for creating a diagram.
7. Preparing data for data mining. Initial analysis of input data. Conducting variable transformations. Solutions for the problem of missing values. Variable selection. Using the Tree Node to determine variables. Selecting variables for the Regression Node.
8. Forecasting methods. Logistic regression, decision trees and neural networks - modelling standards and the analysis of outcomes (default settings of the application). The assessment of forecast accuracy. Generating project reports. Setting parameters and adjusting models for a forecast: logistic regression, decision trees, gradient boosting, random forests and neural networks.
9. Association analysis.
The course is a part of the Data Mining Certificate Program run jointly with SAS Institute Polska.
Type of course
Prerequisites (description)
Course coordinators
Learning outcomes
After completion of the course students should possess competence in Data Mining analysis using Data Mining models and methods and have the knowledge how to use SAS Viya software
Tuition outcomes:
1) Knowledge
Student has understanding of available Data Mining methods and techniques and knows how to use them for purpose of economic researches.
2) Skills
Student can choose and put to use appropriate methods and techniques for specific applications, if necessary, is able to modify (adapt) the methods and techniques to make them the most efficient and effective when carrying out given case studies.
3) Social competences
Student is aware of the possibilities and advantages of data mining methods and techniques in economic research and the benefits that can be obtained through their use, but also aware of the defects and the limited usefulness of these methods and techniques.
KW01, KW02, KW03, KU01, KU02, KU03, KK01, KK02, KK03
Assessment criteria
Presence during classes is required. The condition to obtain a credit is to prepare and present a review of scientific article using one of methods discussed during the classes (50% of the grade) and complete homeworks (50% of the grade).
Bibliography
[1] Applied Analytics Using SAS Enterprise Miner 5.3. Course Notes, część I i część II, SAS Institute Inc. Cary, NC, USA, ISBN 978-1-59994-818-8, 2008.
[2] Cabena P. I in., Discovering Data Mining: From Concept to Implementation, Prentice Hall, Upper Saddle River, NJ, 1998.
[3] Chakrabarti S., Cox E., Frank E. i in., Data Mining. Know it all, Elsevier Inc. 2009.
[4] Everitt B.S., The Cambridge Dictionary of Statistics, Cambridge University Press, 1998.
[5] Han J., Kamber M., Pei J., Data Mining. Concepts and Techniques, Morgan Kaufmann - Elsevier, 2012.
[6] Hand D. I in., Principles of Data Mining, MIT Press, Cambridge University Press, 2001.
[7] Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.
[8] Larose D.T., Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych, Wydawnictwo Naukowe PWN, ISBN-13: 978-83-01-14836-2; ISBN-10: 83-01-14836-5, Warszawa 2006.
[9] Lasek M., Metody Data Mining w analizowaniu i prognozowaniu kondycji ekonomicznej przedsiębiorstw. Zastosowania SAS Enterprise Miner, Difin, ISBN 978-83-7251-695-4, Warszawa 2007.
[10] Lasek M., Nowak E., Pęczkowski M., Association and Sequence Rules of Events in an Investment Analysis of Agrotourism Farms/ Zastosowanie reguł asocjacji i sekwencji zdarzeń do analizy działalności inwestycyjnej gospodarstw agroturystycznych (artykuły w dwóch wersjach językowych: angielskim i polskim), Turyzm, 18/2, 2008, s. 57-73.
[11] Lasek M., Od danych do wiedzy. Metody i techniki „Data Mining”, Optimum, nr 2 (22), s. 17-37, ISSN 1506-7637, 2004.
[12] Lasek M., Pęczkowski M., Analiza zróżnicowania pięciuset największych firm Rzeczpospolitej, Ekonomiczno-Informatyczny Kwartalnik Teoretyczny Wyższej Szkoły Ekonomiczno-Informatycznej w Warszawie, nr 18, październik-grudzień 2008, ISSN 1733-3156, 2008, s. 64-72.
[13] Lasek M., Pęczkowski M., Wierzba D., Zastosowanie analiz Data Mining w przewidywaniu groźby upadłości lub konieczności prowadzenia postępowania układowego przedsiębiorstwa – budowa modeli predykcyjnych, ocena ich jakości i wybór modelu, Studia i materiały Polskiego Stowarzyszenia Zarządzania Wiedzą, nr 22, 2009, ISSN 1732-324X, s. 81-95.
[14] Lasek M., Pęczkowski M., Wykresy lift charts jako narzędzia wyboru modeli eksploracji danych Data Mining, w: J. Nazarko, L. Kiełtyka, (redakcja naukowa), Narzędzia informatyczne w zarządzaniu i inżynierii produkcji, Centrum Doradztwa i Informacji Difin, s. 228-243, ISBN 978-83-7251-920-7, Warszawa 2008.
[15] Lasek M., Pęczkowski M., SAS Enterprise Miner jako przykład programu wspomagania analiz Data Mining, [w:] R, Mosdorf, N.Siemieniuk (red.) Zastosowanie technologii informacyjnych w zarządzaniu wiedzą i procesami gospodarczymi, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok 2011, s. 131-145.
[16] Lasek M., Pęczkowski M., Grupowanie zmiennych w procesach eksploracji danych, Ekonomia i Zarządzanie, t. 2, nr 1, Politechnika Białostocka 2010, s. 83-94.
[17] LasekM., Peczkowski M., Metodyka procesu eksploracji danych SEMMA, Prace i Materiały Wydziału Zarządzania Uniwersytetu Gdańskiego, zeszyt: Finanse w warunkach kryzysu. Wybrane zagadnienia, nr 3, Gdańsk 2010, s 117-133.
[18] Lasek M., Peczkowski M., Graficzna ocena jakości predykcyjnych Data Mining, [w:] R. Kucęba, J.Nazarko (red), Logistyczne uwarunkowania zarządzania przedsiębiorstwem, Wydawnictwo Politechniki Cżestochowskiej, seria minografie 178, Częstochowa 2009, 184-191.
[19] Maimon O., Rokach L.(eds.), Data Mining and Knowledge Discovery Handbook, Springer Science+Business Media Inc., New York 2005.
[20] Markov Z., Larose D.T., Eksploracja zasobów internetowych. Analiza struktury, zawartości i użytkowania sieci WWW, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15868-2, Warszawa 2009.
[21] Matignon R., Data Mining using SAS Enterprise Miner, John Wiley & Sons, Inc., ISBN 978-0-470-14901-0, New Jersey 2007.
[22] Pęczkowski M., Wprowadzenie do Data Mining, Studia Podyplomowe: Metody statystyczne w biznesie, WNE UW, Warszawa 2011 [materiały kursowe].
[23] Reference Help – Enterprise Miner 6.2, SAS Institute Inc., Cary, NC, USA 2009.
[24] Taniar D. (ed.), Data Mining and Knowledge Discovery Technologies, IGI Global 2008.
[25] Witten I.H., Frank E., Hall M.A., Data Mining. Practical Machine Learning. Tools and Techniques, Morgan Kaufmann - Elsevier, 2011.
[26] Ye N. (ed.), The Handbook of Data Mining, Lawrence Erlbaum AssociatesInc. Publishers, ISBN 0-8058-4081-8, New Jersey 2003.
Additional information
Additional information (registration calendar, class conductors, localization and schedules of classes), might be available in the USOSweb system: