Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/8442
Title: Çok amaçlı genetik algoritma ile kategorik verilerin sınıflandırılması
Other Titles: Clustering categorical datasets using multi objective genetic algorithm
Authors: Özyer, Tansel
Dursun, Kayhan
Keywords: Genetic algorithms
Classification
Computational methods
Genetik algoritmalar
Sınıflandırma
Öbekleme teknikleri
Issue Date: 2012
Publisher: TOBB Ekonomi ve Teknoloji Üniversitesi Fen Bilimleri Enstitüsü
Abstract: The process of classifying data in computer science has been the interest of lots of practices in recent years and lots of techniques have been suggested about this topic. This topic concentrates on how to classify these data appropriately using their attribute values. As a result of this, data which are similar can be put in same or near clusters and there can be made some inferences from these clustering results. These area can deepen with the status of data sets. For example classification of large and small scale data specialize very differently.Multi objective clustering as a kind of clustering is a trending topic in recent years. This type of clustering takes into account more than one objective and gives clustering results of data as an output.In this thesis, it has been studied on basically how to classify categorical data sets with a multi objective structure. Obtained results have been compared with the results of k-mod algorithm which do the clustering process with one objective. Using the purity measure, it has been shown that in every condition, the proposed procedure gives better clustering results.In further steps of the work, the problems occurring with the clustering of large scale data investigated and some solutions have been proposed for them. For these conditions, the procedure that has been proposed is to generate frequent item sets from the data and classifying these frequent item sets efficiently. In the end, outputs that have been gathered illustrate the efficiency and consistency of this procedure.
Bilgisayar bilimlerinde verilerin sınıflandırılması işlemi yıllardır üzerine yoğunlaşılıp, pek çok yöntemin öne sürüldüğü bir konudur. Bu konu, verilerin belirli öznitelikleri kullanılarak en uygun şekilde kümelenmeleri işlemi üzerine yoğunlaşmaktadır. Bu sayede birbirine benzeyen verileri birbirleri ile aynı öbeğe koyulabilmekte ve bu sonuçlar üzerinden belli çıkarımlar yapılabilmektedir. Bu alan, ele alınan veri kümelerinin durumlarına göre derinleşebilmektedir. Örneğin büyük boyutlu ve küçük boyutlu verilerin öbeklendirilmeleri birbirinden çok farklı şekilde özelleşebilmektedir. Öbeklendirmenin türüne göre ise, çok amaçlı öbeklendirme son yıllarda çok revaçta olan bir problemdir. Çok amaçlı öbeklendirme, birbirinden farklı amaçları aynı anda ele alarak verilerin kümeleme sonuçlarını çıktı olarak sunar.Bu tezde ise temel olarak çok amaçlı bir yapı ile kategorik veri kümelerinin öbeklendirilmesi üzerinde çalışılmıştır. Elde edilen sonuçlar tek amaçlı bir şekilde öbekleme yapan k-mod öbeklemesinin sonuçları ile karşılaştırılmıştır. Önerilen yöntemin her durumda daha doğal ve başarılı öbekleme sonuçlarına ulaştığı saflık ölçüm metriği ele alınarak ortaya konulmuştur.Çalışmanın ileriki aşamalarında ise büyük boyutlu veri kümeleri işin içine girince çıkan problemler ele alınıp, bu durumlara çözümler getirilmiştir. Bu koşullar için ise geliştirilen yöntem, veriler üzerinden sıklık eleman kümelerinin elde edilip, bu kümeler üzerinden verimli şekilde öbekleme yapılması işlemidir. Sonuçta elde edilen çıktılar ise önerilen yöntemin verimliliğini ve tutarlılığını ortaya koymaktadır.
URI: https://hdl.handle.net/20.500.11851/8442
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Show full item record

CORE Recommender

Page view(s)

94
checked on Dec 26, 2022

Google ScholarTM

Check


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.