Choosing the clustering algorithm and searching clusters of documents efficiency

Agnieszka Nowak-Brzezińska, Tomasz Jach, Tomasz Xięski

Abstract


The article presents the results of efficiency of searching relevant documents In the document clusters structure. The structure depends on the choosed clustering algorithm. In the experiments we used nonhierarchical, hierarchical and den sity based clustering algortihms.

Keywords


documents clustering; recall; precision; density based algorithm

Full Text:

PDF (Polski)

References


Ester M., Kriegel H.P., Sander J., Xu X.: A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. Institute for Computer Science, University of Munich. Proceedings of 2nd International Conference on Knowledge Discovery and Data Mining (KDD-96), 1996.

Honkela T., Kaski S., Lagus K., and Kohonen, T.: Self-organizing maps of document collections. ALMA, 1(2). Electronic Journal, http://www.diemme.it/luigi/alma.html, 1991

Jach T.: Grupowanie jako metoda eksploracji wiedzy w systemach wspomagania decyzji. Analiza algorytmów hierarchicznych. Sosnowiec, 2008.

Nowak A., Xięski T., Jach T.: Analiza hierarchicznych i niehierarchicznych algorytmów grupowania dla dokumentów tekstowych, STUDIA INFORMATICA, Zeszyty Naukowe Politechniki Śląskiej, Volume 30, No. 2A(83), s. 245-258.

Nowak A., Wakulicz-Deja A., Bachliński S.: Optimization of Speech Recognition l| Clustering of Phones. Fundamenta Informaticae, Vol. 72, 2006, s. 283-293.

Rijsbergen C.J.: Information retrieval. online book http://www.dcs.gla.ac.uk/Keith/Preface.html, 1979

Salton G.: Automatic Information Organization and Retreival. McGraw-Hill, New York USA, 1975.

Sander J., Ester M., Kriegel H.P., Xu X.: Density-Based Clustering in Spatial Database; The Algorithm GDBSCAN and its Applications, 1998.

Xięski T.: Grupowanie jako metoda eksploracji wiedzy w systemach wspomagania decyzji. Analiza algorytmów niehierarchicznych (k-optymalizacyjnych). Sosnowiec, 2008.

Wakulicz-Deja A.: Podstawy systemów wyszukiwania informacji. Analiza metod. Akademicka Oficyna Wydawnicza PLJ, Warszawa, 1995.




DOI: http://dx.doi.org/10.21936/si2010_v31.n2A.360