Uygulama: Veri Analizi ve Görselleştirme
Bu uygulamada, bir şirketin yıllık satış verilerini içeren bir CSV dosyasını analiz edeceğiz. Verileri temizleyecek, en çok satış yapılan ayları bulacak ve sonuçları bir grafiğe dökeceğiz.
1. Senaryo ve Veri Hazırlığı
Elimizde satislar.csv adında, içinde Ay, Satis_Miktari, Maliyet sütunları olan bir dosya olduğunu varsayalım.
2. Proje Kodları
Aşağıdaki kod bloğu; veriyi okur, "Kar" adında yeni bir sütun hesaplar ve aylık kar oranlarını çizgi grafiğinde gösterir.
Uçtan Uca Analiz Projesi
import pandas as pd
import matplotlib.pyplot as plt
# 1. Veriyi Yükleme
try:
df = pd.read_csv("satislar.csv")
except FileNotFoundError:
# Örnek olması için manuel veri oluşturma
data = {
'Ay': ['Ocak', 'Şubat', 'Mart', 'Nisan', 'Mayıs', 'Haziran'],
'Satis_Miktari': [15000, 18000, 12000, 22000, 19000, 25000],
'Maliyet': [10000, 11000, 9000, 13000, 12000, 15000]
}
df = pd.DataFrame(data)
# 2. Veri Manipülasyonu (Kar Sütunu Ekleme)
df['Kar'] = df['Satis_Miktari'] - df['Maliyet']
# 3. Analiz Sonuçlarını Yazdırma
print("--- Satış Özeti ---")
print(df)
print(f"\nToplam Kar: {df['Kar'].sum()} TL")
print(f"En Yüksek Satış Ayı: {df.loc[df['Satis_Miktari'].idxmax(), 'Ay']}")
# 4. Görselleştirme
plt.figure(figsize=(10, 6))
plt.bar(df['Ay'], df['Kar'], color='green', label='Aylık Kar')
plt.plot(df['Ay'], df['Satis_Miktari'], color='blue', marker='o', label='Satış Miktarı')
plt.title("Aylık Satış ve Kar Analizi")
plt.xlabel("Aylar")
plt.ylabel("TL miktar")
plt.legend()
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()
Kodun Adım Adım Açıklaması
- idxmax(): En yüksek değerin hangi indekste olduğunu bulur, biz de o indeksteki 'Ay' bilgisini çekeriz.
- sum(): Belirli bir sütundaki tüm değerleri toplar.
- plt.figure(): Grafiğin boyutlarını (en, boy) ayarlamamızı sağlar.
- Kombine Grafik: Hem
plt.barhem deplt.plotkullanarak aynı grafik üzerinde iki farklı veriyi karşılaştırdık.