Veri Görselleştirme | Seaborn-1

Seda Kayademir
2 min readAug 8, 2020

--

Bu yazı dizisinde veri görselleştirme kütüphanesi olan Seaborn kütüphanesini inceleyeceğiz. Seaborn, Matplotlib tabanlı bir Python veri görselleştirme kütüphanesidir. Çekici ve bilgilendirici istatistiksel grafikler çizmek için üst düzey bir arayüz sağlar.

Seaborn grafiklerini kullanım alanlarına göre 4 gruba ayırabiliriz.

  • Kategorik verileri görselleştirme
  • İstatistiksel ilişkileri görselleştirme
  • Doğrusal ilişkileri görselleştirme
  • Veri kümesinin dağıtımını görselleştirme

Görselleştirme işlemlerine başlamadan önce kullandığım veri seti hakkında kısa bilgilendirme yapayım.

Veri setinin adı Tips. Seaborn kütüphanesinin içinde yer alan bir veri setidir. Bir kafede bırakılan bahşiş miktarı, ödenen ücret vb. gibi bilgileri içeren veri setidir.

Veri setinin sütunları

  • total_bill: Toplam ödenen ücret.
  • tip: Bahşiş
  • sex: Müşterinin cinsiyeti
  • smoker: Sigara içilip/içilmedi bilgisi
  • time: Zaman(Öğle/Akşam)
  • size: Bir masada bulunan müşteri sayısı
  • day: Gün

Şimdi istatistiksel ilişkileri görselleştirme ile başlayalım

İstatistiksel ilişkileri görselleştirme

İki farklı grafik türü kullanılabilir.

  • scatterplot(dağılım grafiği): Dağılım grafiği, veri kümelerindeki değerler ve aykırı değerler arasındaki olası ilişkileri bulmanıza yardımcı olur.
  • lineplot(çizgi grafiği): Zamana bağlı değişkenlere sahip veri kümelerinde ve yapısal olarak tanımak istediğimiz veri setlerinde kullanılır. Ortaya çıkan değişkenin nasıl oluştuğunu anlamamıza yardımcı olur.

Dağılım grafiğine bakarak toplam ödenen tutar arttıkça bırakılan bahşiş değerinin arttığını söyleyebilir. Grafiği özelleştirmek için çeşitli parametreler belirleyebiliriz.

Mesela hue parametresi ile veri setine ayrı bir boyut kazandırabiliriz.

Bu şekilde veri seti hakkında daha fazla bilgi elde edebilir. Mesela yukarıdaki grafiğe bakarak en yüksek bahşişin hafta sonu verildiğini gözlemleyebiliriz.

Çizgi grafikleri daha çok zaman bağlı veri setlerinde kullanılırlar.

Günlere göre bırakılan bahşiş miktarının arttığını gözlemlemekteyiz. Veri seti tam anlamıyla zaman bağımlı olmadığı için çizgi grafikleri çok fazla bilgi vermeyecektir. Çizgi grafikleri daha çok borsa veri setleri, Iot senaryoları gibi anlık veri akışının olduğu durumlarda kullanılmaktadır.

Bir sonraki yazıda kategorik verilerin görselleştirilmesinde hangi grafiklerin kullanıldığına bakacağız.

Kaynaklar

--

--