Restaurant İncelemeleri Duyarlılık Analizi Raporu

Mert Metin Erdemli
2 min readOct 9, 2023

--

## 1. Giriş

Bu rapor, restoran incelemeleri üzerinde duyarlılık analizi yapmak için gerçekleştirilen veri bilimi projesini sunmaktadır. Projemizin amacı, kullanıcıların restoran incelemelerini pozitif veya negatif olarak sınıflandırmak ve modelin performansını değerlendirmektir.

## 2. Veri Seti

Bu proje için kullanılan veri seti, [Restaurant_Reviews_Preprocessed.csv](datasets/Restaurant_Reviews_Preprocessed.csv) adıyla kaydedilmiştir. Veri seti, restoran incelemeleri ve bu incelemelerin pozitif veya negatif olarak etiketlenmiş sınıflarını içermektedir.

- Toplam Gözlem Sayısı: 988
- Özellik Sayısı: 2 (Review, Label)

## 3. Veri Keşfi

Veri keşfi aşamasında, veri setini yükledik ve ilk birkaç satırını inceledik. Ayrıca, eksik verileri kontrol ettik ve eksik veri bulunmadığını gözlemledik.

## 4. Veri Ön İşleme

Metin verilerini işlemek için aşağıdaki adımları uyguladık:
- Büyük-küçük harf dönüşümü.
- Özel karakterlerin kaldırılması.
- Kelimelerin kök çıkarılması.
- Verinin eğitim ve test kümelerine ayrılması (%80 eğitim, %20 test).

## 5. Metin Madenciliği

Kelimelerin sayma vektörleri, `CountVectorizer` kullanılarak oluşturuldu. Bu sayma vektörleri, metin verilerini sayısal verilere dönüştürdü.

## 6. Model Oluşturma ve Eğitim

Projemizde Gaussian Naive Bayes sınıflandırma algoritması kullanıldı. Model, eğitim verileri üzerinde eğitildi ve aşağıdaki sonuçları verdi:

- Hassasiyet (Precision): 0.84
- Gerçek Pozitif Oranı (Recall): 0.83
- F1-Skoru: 0.84
- Doğruluk (Accuracy): 0.84

## 7. Sonuçlar ve Analiz

Karmaşıklık matrisi aşağıdaki sonuçları verdi:

```
[[88 15]
[15 85]]
```

Karmaşıklık matrisi yorumu:

- Toplam 88 pozitif inceleme doğru bir şekilde tahmin edildi (TP).
- Toplam 85 negatif inceleme doğru bir şekilde tahmin edildi (TN).
- 15 pozitif inceleme yanlış bir şekilde negatif olarak tahmin edildi (FN).
- 15 negatif inceleme yanlış bir şekilde pozitif olarak tahmin edildi (FP).

Modelin performansı oldukça iyi görünüyor, çünkü hassasiyet, gerçek pozitif oranı ve doğruluk yüksek seviyededir. Model, pozitif ve negatif incelemeleri başarıyla sınıflandırabilmektedir.

## 8. İleri Adımlar ve İyileştirmeler

- Veri setini daha büyük bir veri seti ile güncelleyerek modelin performansını artırabiliriz.
- Farklı sınıflandırma algoritmalarını deneyerek modeli iyileştirebiliriz.
- Hiperparametre ayarlarını optimize ederek modelin daha iyi çalışmasını sağlayabiliriz.

## 9. Kapanış

Bu proje, restoran incelemeleri üzerinde duyarlılık analizi yapmak için veri bilimi yöntemlerini kullanmanın etkili bir yolunu göstermektedir. Modelin başarısı, kullanıcıların restoran incelemelerini daha iyi anlamalarına ve değerlendirmelerine yardımcı olabilir.

**İletişim Bilgileri**:

Proje Sorumlusu: MERT METİN ERDEMLİ
E-posta: erdemlimertmetin@gmail.com

Github

Kaggle

--

--

No responses yet