Python ile Veri Analizine Giriş
Veri Analizi, ham verilerin toplanması, temizlenmesi ve anlamlı bilgilere dönüştürülmesi sürecidir. Python, sunduğu güçlü kütüphaneler sayesinde bugün dünyanın en popüler veri analizi aracı haline gelmiştir.
Veri Analizinde Kullanılan Temel Kütüphaneler
Python'da veri analizi dendiğinde "Altın Üçlü" olarak bilinen şu kütüphaneler akla gelir:
NumPy
Yüksek performanslı matematiksel hesaplamalar ve çok boyutlu diziler (arrays) için kullanılır.
Pandas
Veri çerçeveleri (DataFrames) ile tablo yapısındaki verileri işlemek, filtrelemek ve analiz etmek için kullanılır.
Matplotlib
Verilerin grafikler (çizgi, sütun, pasta vb.) yoluyla görselleştirilmesini sağlar.
Kütüphanelerin Kurulumu
Veri analizi yapabilmek için öncelikle bu kütüphaneleri PIP ile bilgisayarınıza yüklemelisiniz:
pip install numpy pandas matplotlib
İlk Adım: Veri Seti Oluşturma ve Göz Atma
Pandas kütüphanesi ile bir veri tablosu oluşturup temel bilgileri nasıl göreceğimize dair bir örnek:
import pandas as pd
# Basit bir veri seti (Sözlük yapısı)
veri = {
'İsim': ['Ahmet', 'Ayşe', 'Mehmet', 'Zeynep'],
'Puan': [85, 92, 78, 95],
'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Ankara']
}
# Veriyi DataFrame (Tablo) yapısına çevirme
df = pd.DataFrame(veri)
# İlk 2 satırı göster
print(df.head(2))
# Veri setinin istatistiksel özetini çıkar
print(df.describe())