Restaurant İncelemeleri Duyarlılık Analizi Raporu
## 1. Giriş
Bu rapor, restoran incelemeleri üzerinde duyarlılık analizi yapmak için gerçekleştirilen veri bilimi projesini sunmaktadır. Projemizin amacı, kullanıcıların restoran incelemelerini pozitif veya negatif olarak sınıflandırmak ve modelin performansını değerlendirmektir.
## 2. Veri Seti
Bu proje için kullanılan veri seti, [Restaurant_Reviews_Preprocessed.csv](datasets/Restaurant_Reviews_Preprocessed.csv) adıyla kaydedilmiştir. Veri seti, restoran incelemeleri ve bu incelemelerin pozitif veya negatif olarak etiketlenmiş sınıflarını içermektedir.
- Toplam Gözlem Sayısı: 988
- Özellik Sayısı: 2 (Review, Label)
## 3. Veri Keşfi
Veri keşfi aşamasında, veri setini yükledik ve ilk birkaç satırını inceledik. Ayrıca, eksik verileri kontrol ettik ve eksik veri bulunmadığını gözlemledik.
## 4. Veri Ön İşleme
Metin verilerini işlemek için aşağıdaki adımları uyguladık:
- Büyük-küçük harf dönüşümü.
- Özel karakterlerin kaldırılması.
- Kelimelerin kök çıkarılması.
- Verinin eğitim ve test kümelerine ayrılması (%80 eğitim, %20 test).
## 5. Metin Madenciliği
Kelimelerin sayma vektörleri, `CountVectorizer` kullanılarak oluşturuldu. Bu sayma vektörleri, metin verilerini sayısal verilere dönüştürdü.
## 6. Model Oluşturma ve Eğitim
Projemizde Gaussian Naive Bayes sınıflandırma algoritması kullanıldı. Model, eğitim verileri üzerinde eğitildi ve aşağıdaki sonuçları verdi:
- Hassasiyet (Precision): 0.84
- Gerçek Pozitif Oranı (Recall): 0.83
- F1-Skoru: 0.84
- Doğruluk (Accuracy): 0.84
## 7. Sonuçlar ve Analiz
Karmaşıklık matrisi aşağıdaki sonuçları verdi:
```
[[88 15]
[15 85]]
```
Karmaşıklık matrisi yorumu:
- Toplam 88 pozitif inceleme doğru bir şekilde tahmin edildi (TP).
- Toplam 85 negatif inceleme doğru bir şekilde tahmin edildi (TN).
- 15 pozitif inceleme yanlış bir şekilde negatif olarak tahmin edildi (FN).
- 15 negatif inceleme yanlış bir şekilde pozitif olarak tahmin edildi (FP).
Modelin performansı oldukça iyi görünüyor, çünkü hassasiyet, gerçek pozitif oranı ve doğruluk yüksek seviyededir. Model, pozitif ve negatif incelemeleri başarıyla sınıflandırabilmektedir.
## 8. İleri Adımlar ve İyileştirmeler
- Veri setini daha büyük bir veri seti ile güncelleyerek modelin performansını artırabiliriz.
- Farklı sınıflandırma algoritmalarını deneyerek modeli iyileştirebiliriz.
- Hiperparametre ayarlarını optimize ederek modelin daha iyi çalışmasını sağlayabiliriz.
## 9. Kapanış
Bu proje, restoran incelemeleri üzerinde duyarlılık analizi yapmak için veri bilimi yöntemlerini kullanmanın etkili bir yolunu göstermektedir. Modelin başarısı, kullanıcıların restoran incelemelerini daha iyi anlamalarına ve değerlendirmelerine yardımcı olabilir.
**İletişim Bilgileri**:
Proje Sorumlusu: MERT METİN ERDEMLİ
E-posta: erdemlimertmetin@gmail.com