ALTERNATYWNY KRYTERIUM ZATRZYMANIA DLA K-OKREŚLONYCH TWARDYCH ALGORYTMÓW KLASTERYZACJI DANYCH

Volodymyr Mosorov

w.mosorow@kis.p.lodz.pl
Lodz University of Technology, Institute of Applied Computer Science (Polska)

Taras Panskyi


Lodz University of Technology, Institute of Applied Computer Science (Polska)

Sebastian Biedron


Lodz University of Technology, Institute of Applied Computer Science (Polska)

Abstrakt

W przedstawionym artykule została pokazana analiza wstępnej klasteryzacji danych w oparciu o partycjonowanie (algorytm k-średnich) w połączeniu z logiką dwuwartościową. Dodatkowo, zostało przedstawione kryterium zatrzymania klasteryzacji, które umożliwia analizowanie danych z dowolną liczbą klastrów. Otrzymane wyniki badań zostały przeanalizowane przy użyciu wewnętrznych indeksów walidacji. Wprowadzone kryterium w przeciwieństwie do znanych indeksów walidacji umożliwia analizę danych, które tworzą jeden klaster.


Słowa kluczowe:

algorytm wstępnej klasteryzacji, wewnętrzny indeksy walidacji

Charrad M., Ghazzali N., Boiteau V., Niknafs A.: NbClust: An R Package for Determining the Relevant Number of Clusters in a Data Set. Journal of Statistic Software, 61(6), 2014, 1–36.
  Google Scholar

Davies D.L., Bouldin D.W.: A cluster separation measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1, no. 2, 1979, 224–227.
  Google Scholar

Desgraupes B.: Clustering indices. University Paris Ouest, Lab Modal’X, 2013.
  Google Scholar

Dunn J.: Well separated clusters and optimal fuzzy partitions. Journal of Cybernetics 4, 1974, 95–104.
  Google Scholar

Fraley C., Raftery A.E.: How Many Clusters? Which Clustering Method? Answers Via Model-Based Cluster Analysis. The Computer Journal, 41(8), 1998, 578–588.
  Google Scholar

Gini, C.: Variabilitа e mutabilitа Reprinted in Memorie di metodologica statistica (Ed. Pizetti E, Salvemini, T). Rome: Libreria Eredi Virgilio Veschi, 1912, Bologna: Tipogr. Di P. Cuppini.
  Google Scholar

Halkidi M., Batistakis Y., Vazirgiannis M.: On clustering validation techniques. J. Intell. Inf. Syst., 17(2-3), 2001, 107–145.
  Google Scholar

Jung Y., Park H., Du D-Z., Drake B.L.: A Decision Criterion for the Optimal Number of Clusters in Hierarchical Clustering. Journal of Global Optimization, 25(1), 2003, 91–111
  Google Scholar

Ketchen Jr. Dj, Shook Cl.: The Application Of Cluster Analysis In Strategic Management Research: An Analysis And Critique, Strategic Management Journal, 17(6), 1996, 441–458.
  Google Scholar

McCallum A., Nigam K., Ungar L.H.: Efficient Clustering of High Dimensional Data Sets with Application to Reference Matching, Sixth ACM SIGKDD international conference on Knowledge discovery and data mining, 2000.
  Google Scholar

Mosorov V., Panskyi T., Biedron S.: Development of a stopping rule of clustering performance by using the connected acyclic graph. Eastern-European Journal of Enterprise Technologies, 5, 9(77), 2015, 24–30.
  Google Scholar

Mosorov V., Tomczak L.: Image Texture Defect Detection Method UsingFuzzy C-Means Clustering for Visual Inspection Systems. Arabian Journal for Science and Engineering, 39(4), 2014, 3013–3022.
  Google Scholar

RapidMiner GmbH: Cluster distance performance – RapidMiner documentation. http://docs.rapidminer.com/studio/operators/validation/performance/segmentation/cluster_distance_performance.html
  Google Scholar

Rousseeuw P.J.: Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics 20, 1987, 53–65.
  Google Scholar

Sheikholeslami C., Chatterjee S., Zhang A.: WaveCluster: A Multi-Resolution Clustering Approach for Very Large Spatial Database. The International Journal on Very Large Data Bases, 8(3-4), 2000, 289–304.
  Google Scholar

Theodoridis S., Koutroubas K.: Pattern Recognition 4th Edition, Academic Press, 2008.
  Google Scholar


Opublikowane
2017-09-30

Cited By / Share

Mosorov, V. ., Panskyi, T. ., & Biedron, S. . (2017). ALTERNATYWNY KRYTERIUM ZATRZYMANIA DLA K-OKREŚLONYCH TWARDYCH ALGORYTMÓW KLASTERYZACJI DANYCH. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 7(3), 56–59. https://doi.org/10.5604/01.3001.0010.5216

Autorzy

Volodymyr Mosorov 
w.mosorow@kis.p.lodz.pl
Lodz University of Technology, Institute of Applied Computer Science Polska

Autorzy

Taras Panskyi 

Lodz University of Technology, Institute of Applied Computer Science Polska

Autorzy

Sebastian Biedron 

Lodz University of Technology, Institute of Applied Computer Science Polska

Statystyki

Abstract views: 203
PDF downloads: 52