Abstract

Akan veri kümeleme, teknolojik gelişmelere paralel olarak veri miktarının inanılmaz boyutlara ulaştığı gümünüzün popüler konularından biridir. Akan veri kümeleme yaklaşımlarında karşılaşılan en önemli problemler çoğu yaklaşımın çevrimiçi ve çevrimdışı evreden oluşması, küme sayısını tanımlama veya bu sayıya bir sınır koyma zorunluluğu, en doğru yarıçap değerini belirlemede yaşanan problemler ve önerilen modellerin kendisini gelen yeni verilere adapte etmesinde (concept evolution) yaşanan problemlerdir. Bu problemlerin yanında, neredeyse bu alandaki bütün çalışmaların sayısal miktar tabanlı bir özetleme yapması da bazı uygulamalar için ihtiyacı karşılamamaktadır. Oysa son 1 saniyede veya son 1 saatte gelen veriler şeklinde çalışan zaman tabanlı bir özetleme yaklaşımına da ihtiyaç vardır. Bu çalışmada, K-boyutlu ağaç, uyarlanabilir yarıçap tabanlı (KD-AR Stream) ve kümeleme adaptasyonu özelliğine sahip gerçek zamanlı akan verileri kümeleyen bir yaklaşım önerilmektedir. Önerdiğimiz yöntem SE-Stream, DPStream ve CEDAS algoritmaları ile hem kümeleme başarısı hem de işlem performansı açısından karşılaştırılmıştır. Elde edilen sonuçlar KD-AR Stream algoritmasının diğer algoritmalara göre yüksek bir kümeleme başarısını makul bir sürede gerçekleştirdiğini göstermektedir.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call