Unusual data exploration – new approach

Agnieszka Nowak-Brzezińska, Artur Turos

Abstract


The goal of the article is to present the idea of discovering unusual data in large datasets in which the many clusters were created. Authors presents the methods which is modification of classical version of k-means algorithm. The modification introduces the concept of an influential and outlier cluster. The paper consists also of the results of the experiments with the analysis of it.

Keywords


outliers in data; unusual data; cluster analysis; outlier cluster; influential cluster

Full Text:

PDF (Polski)

References


Larose D.: Odkrywanie wiedzy z danych, wprowadzenie do eksploracji danych. Wydawnictwo PWN, Warszawa 2006.

Han J., Kamber M., Pei J.: Data Mining: Concepts and Techniques. Elsevier, San Francisco 2012.

Nowak-Brzezińska A.: Eksploracja odchyleń w regułowych bazach wiedzy. Studia Informatica, ZN Pol. Śl., Vol. 33, No. 2A (105), Gliwice 2012.

Hawkins D.: Identification of Outliers. Chapman and Hall, London 1980.

Tomkowicz M.: Wpływ odchyleń na jakość grupowania danych wielowymiarowych. Praca magisterska, Uniwersytet Śląski, Katowice 2013.

Nowak-Brzezińska A.: Wykrywanie reguł nietypowych – metody oparte na analizie skupień. Studia Informatica, ZN Pol. Śl., Vol. 34, No. 2A (111), Gliwice 2013.

Turos A.: Analiza metod wykrywania odchyleń w danych wielowymiarowych. Praca magisterska, Uniwersytet Śląski, Katowice 2013.

MacQueen J.: Some Methods for classification and Analysis of Multivariate Observations. University of California, 1967.

Tryon R.: Cluster Analysis. McGraw Hill, New York 1939.

Xu R., Wunsch D.: Clustering. Wiley, New York 2008.

Myatt G., Johnson W.: Making sense of data. Wiley, New York 2009




DOI: http://dx.doi.org/10.21936/si2014_v35.n2.679