Methods and tools for data mining of intensity variability inlet to municipal wastewater treatment plant

Monika Chuchro, Adam Piórkowski

Abstract


Data mining is currently the fastest growing problem of processing data. The purpose of exploration (data mining, drilling of the data) is useful to obtain new knowledge from large data packets using specialized statistical tools. This article makes a comparison of methods for exploration in environments Weka, R, Statistica and Microsoft SQL Server database to an existing quantity of water inflow to the treatment plant. Inputs such application is a time series with daily resolution of the long periods of observation (even several years).

Keywords


data mining; time series analysis; sewage treatment; wastewater treatment

Full Text:

PDF (Polski)

References


Morzy M.: Eksploracja danych - przegląd dostępnych metod i dziedzin zastosowań. VI edycja Hurtownie Danych i Business Intelligence, Centrum Promocji Informatyki, Warszawa, 11 kwietnia 2006.

Jagielski J., Skorupska I.: Metody pozyskiwania wiedzy z danych historycznych. Bazy danych: modele, technologie, narzędzia, pod red. S. Kozielskiego, B. Małysiak, P. Kasprowskiego i D. Mrożka, Wydawnictwa Komunikacji i Łączności, Warszawa 2005.

Rojek I.: Bazy danych i bazy wiedzy dla miejskiego systemu wodno-ściekowego. Bazy danych: nowe technologie, pod red. S. Kozielskiego, B. Małysiak, P. Kasprowskiego i D. Mrozka, Wydawnictwa Komunikacji i Łączności, Warszawa 2007.

Gorawski M., Kowalski D.: Klasteryzacja szeregów czasowych na przykładzie pomiarów zużycia mediów. Bazy danych: struktury, algorytmy, metody, pod red. S. Kozielskiego, B. Małysiak, P. Kasprowskiego i D. Mrożka, Wydawnictwa Komunikacji i Łączności, Warszawa 2006.

Box G., Jenkins J.: Analiza szeregów czasowych. Prognozowanie i sterowanie. Państwowe Wydawnictwo Naukowe, Warszawa 1983.

Larose D.T.: Metody i modele eksploracji danych. Wydawnictwo Naukowe PWN, Warszawa 2008.

Weka 3 Documentation, http://www.cs.waikato.ac.nz/ ~ml/weka/index_documentation. html.

Internetowy Podręcznik Statystyki, http://www.statsoft.pl/textbook/stathome.html

Komsta Ł.: Wprowadzenie do środowiska R. http://cran.r-project.org/doc/contrib/Komsta- Wprowadzenie.pdf

The R Project for Statistical Computing, http://www.r-project.org/.

Khabaza T., Shearer C: Data Mining with Clementine. Integral Solution Limited, 20th Jan 1995.

Rattle: Gnome Cross Platform GUI for Data Mining using R, http://rattle.toga-ware.com/

Data Mining Desktop Survival Guide, http://datamining.togaware.com/survivor/Data_Mining.html.

Rapid Miner, http://rapid-i.com/conten1/view/26/82/.

Chatfield C: The Analysis of Time Series. An Introduction. Chapman &Hall/Crc, 2004

Last M., Kandel A., Bunke H. (edts), Data Mining in Time Series Database, Series in M-. chine Perception Artificial Intelligence, Vol. 57, s. 67+101.

Hand D., Mannila H., Smyth P.: Eksploracja danych. Wydawnictwa Naukowo-Techniczne, Warszawa 2005.

Witten I.H., Frank E.: Data Mining: Practical Machine Learning Tools and Technique Elsevier, Sydney 2005.

Gworek S., Utrata A.: Wykorzystanie predyktorów typu neural network do prognozowania szeregów czasowych. Górnictwo i Geoinżynieria 2005, nr 29, z. 4, s. 53-62.




DOI: http://dx.doi.org/10.21936/si2010_v31.n2B.417