Uygulama: Veri Analizi ve Görselleştirme

Bu uygulamada, bir şirketin yıllık satış verilerini içeren bir CSV dosyasını analiz edeceğiz. Verileri temizleyecek, en çok satış yapılan ayları bulacak ve sonuçları bir grafiğe dökeceğiz.


1. Senaryo ve Veri Hazırlığı

Elimizde satislar.csv adında, içinde Ay, Satis_Miktari, Maliyet sütunları olan bir dosya olduğunu varsayalım.


2. Proje Kodları

Aşağıdaki kod bloğu; veriyi okur, "Kar" adında yeni bir sütun hesaplar ve aylık kar oranlarını çizgi grafiğinde gösterir.

Uçtan Uca Analiz Projesi
import pandas as pd
import matplotlib.pyplot as plt

# 1. Veriyi Yükleme
try:
    df = pd.read_csv("satislar.csv")
except FileNotFoundError:
    # Örnek olması için manuel veri oluşturma
    data = {
        'Ay': ['Ocak', 'Şubat', 'Mart', 'Nisan', 'Mayıs', 'Haziran'],
        'Satis_Miktari': [15000, 18000, 12000, 22000, 19000, 25000],
        'Maliyet': [10000, 11000, 9000, 13000, 12000, 15000]
    }
    df = pd.DataFrame(data)

# 2. Veri Manipülasyonu (Kar Sütunu Ekleme)
df['Kar'] = df['Satis_Miktari'] - df['Maliyet']

# 3. Analiz Sonuçlarını Yazdırma
print("--- Satış Özeti ---")
print(df)
print(f"\nToplam Kar: {df['Kar'].sum()} TL")
print(f"En Yüksek Satış Ayı: {df.loc[df['Satis_Miktari'].idxmax(), 'Ay']}")

# 4. Görselleştirme
plt.figure(figsize=(10, 6))
plt.bar(df['Ay'], df['Kar'], color='green', label='Aylık Kar')
plt.plot(df['Ay'], df['Satis_Miktari'], color='blue', marker='o', label='Satış Miktarı')

plt.title("Aylık Satış ve Kar Analizi")
plt.xlabel("Aylar")
plt.ylabel("TL miktar")
plt.legend()
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()

Kodun Adım Adım Açıklaması

  • idxmax(): En yüksek değerin hangi indekste olduğunu bulur, biz de o indeksteki 'Ay' bilgisini çekeriz.
  • sum(): Belirli bir sütundaki tüm değerleri toplar.
  • plt.figure(): Grafiğin boyutlarını (en, boy) ayarlamamızı sağlar.
  • Kombine Grafik: Hem plt.bar hem de plt.plot kullanarak aynı grafik üzerinde iki farklı veriyi karşılaştırdık.