MAKNE RENMES LE RN SINIFLANDIRMA NCELEMES Can RAZBONYALI
MAKİNE ÖĞRENMESİ İLE ÜRÜN SINIFLANDIRMA İNCELEMESİ Can RAZBONYALI Yrd. Doç. Aslı UYAR Okan Üniversitesi Bilgisayar Mühendisliği Doktora Öğrencisi HUAWEI Teknoloji CRM & SI Takımı Yazılım Mühendisi
Sunum Kapsamı • • • İnternet kullanımı hakkında bilgiler. Çalışmanın İçeriği. Ön Hazırlık. Kullanılan Yöntemler. Deneysel Sonuçlar. Sonuç ve Öneriler.
İnternet Kullanımı Hakkında Bilgiler • İnternette 2005 yılında 11, 5 milyar adet indekslenebilir web sayfasının olduğu ortaya konmuştur. o Her gün 11 milyar adet yeni web sayfası eklenmektedir. • Günümüzde dakikada; o 277. 000 tweet atılmakta, o Google ile yaklaşık iki milyon arama yapılmakta, o You. Tube ey 72 saatlik video yüklenmekte, o 571 yeni web sayfası eklenmekte olduğu ortaya konmuştur.
Çalışmanın İçeriği • Tekno. SA firmasının ürün kataloğundan faydalanılmıştır. o Katalogda bulunan akıllı telefonlar, cep telefonları ve tablet bilgisayarların özelliklerinden eğitim seti oluşturulmuştur. • Bu eğitim seti daha sonra veri seti olarak kullanılıp çeşitli sınıflandırma algoritmaları ile sınıflandırılmıştır. • Sınıflandırma sonrası Google ürün sınıflandırma ağacına göre sınıflandırılan bu üç ürünün doğrulukları karşılaştırılıp elektronik ticaret sitelerine öneride bulunulmuştur.
Ön Hazırlık • Tekno. SA firmasının internet sayfasındaki ürün kataloğundan; o 9 adet Nokia ve Samsung marka cep telefonu, o 12 adet Samsung, 7 adet HTC ve LG, 6 adet Blackberry ve 1 adet Alcatel marka akıllı telefon, o 1 adet Dell, Polypad ve Sony, üç adet Probook ve iki adet Samsung marka bilgisayar
Kullanılan Yöntemler • Naive Bayes Algoritması • Karar Ağacı Algoritması • En Yakın k Komşu Algoritması
Deneysel Sonuçlar a b c <- TAHMİN(Naive Bayes) 31 1 1 a akilli_telefon 0 11 0 b tablet_pc 1 0 17 c cep_telefonu a b c <- TAHMİN(En yakın k komşu) 31 1 1 a akilli_telefon 0 11 0 b tablet_pc 1 1 16 c cep_telefonu a b c <- TAHMİN(Karar Ağacı) 32 1 0 a akilli_telefon 0 11 0 b tablet_pc 0 3 15 c cep_telefonu • Sonuçlar WEKA kullanılarak elde edilmiştir. • Bu bölümde sınıflandırmanın doğruluk oranı ve verilerin ne kadar öğrenilebilir olduğu ortaya konmuştur.
Sonuç ve Öneriler • Bir ürünü geniş ana başlıkta kategorize etmek, spesifik alt başlığa kategorize etmekten daha kolaydır. • Sınıflandırma yapılacak diğer sistemlerin seçilecek öz niteliklerin ve sınıflandırma algoritmasının önemi. o Farklı sistemlere adapte edilebilirlik. o Farklı ürün ve öz nitelikler ile de etkin sonuç.
TEŞEKKÜRLER
- Slides: 9