Fp-Growth Algoritmasi- Weka Uygulaması

Author :  

Year-Number: 2018-14
Language : null
Konu :
Number of pages: 1186-1190
Mendeley EndNote Alıntı Yap

Abstract

Veri madenciliği, farklı formatlarda saklanan büyük hacimli verilerdeki bilgi keşfine ilişkin çeşitli yaklaşımları nedeniyle araştırmacılar için geniş bir alandır. Veri madenciliği tekniklerini uygulanarak, bilinmeyen örüntülerin keşfi ve veriler arasındaki ilişkiler keşfedilir. Veri madenciliğinin farklı işlevleri temel alarak sınıflandırma, kümeleme, özellik seçimi ve birliktelik kuralı madenciliği olarak sınıflandırılmıştır. Birbirleriyle ilişkili verilerden özelliklerin çıkarılması ve aralarındaki ilişkilerin büyüklüğünün tespit edilmesine yönelik çalışmalar birliktelik kuralları olarak tanımlanır. En fazla kullanılan birliktelik kuralı algoritmaları Apriori ve FP-Growth algoritmalarıdır. Bu çalışmada amaç genel olarak sepet market analizlerinde kullanılan bu kural çıkarımı yöntemlerinin farklı çalışmalarda da kullanımını göstermektir. Bu amaçla yüksekokul öğrencilerinin sosyal medya kullanım eğilimleri araştırması için yapılan çalışma Fp-Growth algoritması ile modellenmiştir. Model sonucunda öğrencilerin mahremiyet sorunları olmasına rağmen, sosyal medya araçlarında paylaşım yapmaktan kaçınmadıkları görülmektedir. Öğrenciler üzerinde aile ve toplum baskısının hissedilir bir etkisi olduğu gözlenmiştir.

Keywords

Abstract

Data mining is a wide field for researchers because of their various approaches to information discovery in large volumes of data stored in different formats. By applying data mining techniques, the discovery of unknown patterns and the relationships between the data are discovered. It is classified as classification, clustering, feature selection and association rule mining based on different functions of data mining. The rules of association are aimed at identifying the characteristics of interrelated data and determining the magnitude of the relationships between them. The most commonly used association rule algorithms are Apriori and FP-Growth algorithms. The aim of this study is to show the usage of these rule extraction methods used in basket market analysis in different studies. For this purpose, the study of social media usage trends of high school students was modeled with Fp-Growth algorithm. As a result of the model, it is seen that although students have privacy problems, they do not refrain from sharing in social media tools. It was observed that family and community pressures had a significant effect on students.

Keywords


  • Agrawal, R., Imielinski, T., Swami, A., (1993), “Mining association rules between sets of items in

  • Agrawal, R., Imielinski, T., Swami, A., (1993), “Mining association rules between sets of items in large databases”, ACM SIGMOD Conference on Management of Data, Washington.

  • Anonim, http://www.cs.waikato.ac.nz/ml/weka/ (Erişim tarihi: 21th of April, 2018).

  • Han J., Kamber M., (2001), Data Mining: Concepts and Techniques. Morgan Kaufmann.

  • Iko Pramudiono and Masaru Kitsuregawa (2003). Parallel FP-Growth on PC Cluster, In PAKDD.

  • Li Liu, Eric Li, Yimin Zhang, and Zhizhong Tang (2007). Optimization of frequent itemset mining on multiple-core processor.

  • Osmar R. Zaïane, Mahammad El-Hajj, and Paul Lu.(2001). Fast Parallel Association Rule Mining without Candidacy Generation.

  • Silahtaroğlu G. (2008), Kavram ve Algoritmalarıyla Temel Veri Madenciliği, 1. Baskı, Papatya Yayıncılık.

                                                                                                                                                                                                        
  • Article Statistics