Python ile Veri Analizine Giriş

Veri Analizi, ham verilerin toplanması, temizlenmesi ve anlamlı bilgilere dönüştürülmesi sürecidir. Python, sunduğu güçlü kütüphaneler sayesinde bugün dünyanın en popüler veri analizi aracı haline gelmiştir.


Veri Analizinde Kullanılan Temel Kütüphaneler

Python'da veri analizi dendiğinde "Altın Üçlü" olarak bilinen şu kütüphaneler akla gelir:

NumPy

Yüksek performanslı matematiksel hesaplamalar ve çok boyutlu diziler (arrays) için kullanılır.

Pandas

Veri çerçeveleri (DataFrames) ile tablo yapısındaki verileri işlemek, filtrelemek ve analiz etmek için kullanılır.

Matplotlib

Verilerin grafikler (çizgi, sütun, pasta vb.) yoluyla görselleştirilmesini sağlar.


Kütüphanelerin Kurulumu

Veri analizi yapabilmek için öncelikle bu kütüphaneleri PIP ile bilgisayarınıza yüklemelisiniz:

pip install numpy pandas matplotlib

İlk Adım: Veri Seti Oluşturma ve Göz Atma

Pandas kütüphanesi ile bir veri tablosu oluşturup temel bilgileri nasıl göreceğimize dair bir örnek:

Pandas DataFrame Örneği
import pandas as pd

# Basit bir veri seti (Sözlük yapısı)
veri = {
    'İsim': ['Ahmet', 'Ayşe', 'Mehmet', 'Zeynep'],
    'Puan': [85, 92, 78, 95],
    'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Ankara']
}

# Veriyi DataFrame (Tablo) yapısına çevirme
df = pd.DataFrame(veri)

# İlk 2 satırı göster
print(df.head(2))

# Veri setinin istatistiksel özetini çıkar
print(df.describe())