Iris Veri Setinde Özellik Seçimi ve Sınıflandırma için Hibrit IPA-ANN Modeli (A Hybrid IPA-ANN Model for Feature Selection and Classification on the Iris Dataset)


Creative Commons License

Hasanlı S., Yıldız D., Demirci S.

International Congress on Human-Computer Interaction, Optimization and Robotic Applications (ICHORA2025), Ankara, Türkiye, 23 - 24 Mayıs 2025, ss.1-8, (Tam Metin Bildiri)

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Doi Numarası: 10.1109/ichora65333.2025.11017170
  • Basıldığı Şehir: Ankara
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1-8
  • Ondokuz Mayıs Üniversitesi Adresli: Evet

Özet

Son zamanlarda, makine öğrenimi (Machine Learning, ML) alanında karmaşık veri setleri üzerinde yürütülen çalışmalar yaygınlaşmıştır. Bu veri setlerinde bulunan gereksiz özellikler, modellerin doğruluğunu düşürebilmekte ve hesaplama maliyetlerini önemli derecede yükseltebilmektedir. Bu nedenle, tasarlanacak modele göre en uygun ve etkili özelliklerin belirlenmesinde özellik seçimi (Feature Selection, FS) yöntemi kritik rol oynar. Meta-sezgisel algoritmalar, FS problemlerine etkili çözüm sunmaları ve sınıflandırma performansını iyileştirmeleri nedeniyle bu alanda sıklıkla kullanılmaktadır. FS yöntemlerinin yetersiz kaldığı anlarda meta-sezgisel algoritmalar, veri setleri için etkili çözümler sunmaktadır. Bu çalışmada, iris veri seti üzerinde FS ve sınıflandırma için kullanılan yeni bir hibrit yaklaşım geliştirilmiştir. Maksimum ayırma tekniği ile FS yapılmıştır ve sonrasında iki boyutlu uzaya indirgemek için çekirdek temel bileşen analizi (Kernel Principal Component Analaysis, KPCA) kullanılmıştır. Sınıflandırma problemi için yapay sinir ağı (Artificial Neural Network, ANN) modeli kullanılmıştır. Modelin mimarisi, iki özellikli bir giriş katmanı, sırasıyla 64 ve 32 birimden oluşan iki gizli katman ve üç sınıf bulunan bir çıkış katmanından oluşmaktadır. Hiperparametre optimizasyonu için İmmün Plazma Algoritması  (Immune Plasma Algorithm, IPA) kullanılmıştır. Son olarak geliştirilen IPA-ANN algoritmasının sınıflandırma işlemindeki performansını değerlendirmek için doğruluk, çapraz entropi (Cross Entropy, CE), F1-Score ve Cohen’s Kappa metrikleri tek kat, beş kat ve on kat olacak şekilde ölçülmüştür. Alınan değerler doğrultusunda en iyi değerler eğitim kısmında doğruluk için 1.0000, CE için 0.0022; test kısmında ise doğruluk için 1.0000, CE için 0.0003, F1-Score için 1.0000, Cohen’s Kappa için 1.0000 olarak elde edilmiştir.

Recently, studies on complex datasets in the field of machine learning (ML) have become widespread. Unnecessary features in these datasets can reduce the accuracy of models and significantly increase computational costs. Therefore, the feature selection (FS) method plays a critical role in determining the most appropriate and effective features according to the model to be designed. Meta-heuristic algorithms are frequently used in this field because they provide effective solutions to FS problems and improve classification performance. Meta-heuristic algorithms provide effective solutions for datasets when FS methods are inadequate. In this study, a new hybrid approach was developed for feature selection and classification on the iris dataset. Feature selection was performed with the maximum separation technique, and then Kernel Principal Component Analysis (KPCA) was used to reduce it to two-dimensional space. The Artificial Neural Network (ANN) model was used for the classification problem. The architecture of the model consists of an input layer with two features, two hidden layers consisting of 64 and 32 units, respectively, and an output layer with three classes. Immune Plasma Algorithm (IPA) was used for hyperparameter optimization. Finally, in order to evaluate the performance of the developed IPA-ANN algorithm in the classification process, accuracy, cross-entropy (CE), F1-Score, and Cohen’s Kappa metrics were measured as one-fold, five-fold, and ten-fold. In line with the obtained values, the best values ​​were obtained as 1.0000 for accuracy and 0.0022 for CE in the training part; 1.0000 for accuracy, 0.0003 for CE, 1.0000 for F1-Score, 1.0000 for Cohen’s Kappa in the testing part.