Veri Görselleştirme | Seaborn-1

Seda Kayademir
2 min readAug 8, 2020

Bu yazı dizisinde veri görselleştirme kütüphanesi olan Seaborn kütüphanesini inceleyeceğiz. Seaborn, Matplotlib tabanlı bir Python veri görselleştirme kütüphanesidir. Çekici ve bilgilendirici istatistiksel grafikler çizmek için üst düzey bir arayüz sağlar.

Seaborn grafiklerini kullanım alanlarına göre 4 gruba ayırabiliriz.

  • Kategorik verileri görselleştirme
  • İstatistiksel ilişkileri görselleştirme
  • Doğrusal ilişkileri görselleştirme
  • Veri kümesinin dağıtımını görselleştirme

Görselleştirme işlemlerine başlamadan önce kullandığım veri seti hakkında kısa bilgilendirme yapayım.

Veri setinin adı Tips. Seaborn kütüphanesinin içinde yer alan bir veri setidir. Bir kafede bırakılan bahşiş miktarı, ödenen ücret vb. gibi bilgileri içeren veri setidir.

Veri setinin sütunları

  • total_bill: Toplam ödenen ücret.
  • tip: Bahşiş
  • sex: Müşterinin cinsiyeti
  • smoker: Sigara içilip/içilmedi bilgisi
  • time: Zaman(Öğle/Akşam)
  • size: Bir masada bulunan müşteri sayısı
  • day: Gün

Şimdi istatistiksel ilişkileri görselleştirme ile başlayalım

İstatistiksel ilişkileri görselleştirme

İki farklı grafik türü kullanılabilir.

  • scatterplot(dağılım grafiği): Dağılım grafiği, veri kümelerindeki değerler ve aykırı değerler arasındaki olası ilişkileri bulmanıza yardımcı olur.
  • lineplot(çizgi grafiği): Zamana bağlı değişkenlere sahip veri kümelerinde ve yapısal olarak tanımak istediğimiz veri setlerinde kullanılır. Ortaya çıkan değişkenin nasıl oluştuğunu anlamamıza yardımcı olur.

Dağılım grafiğine bakarak toplam ödenen tutar arttıkça bırakılan bahşiş değerinin arttığını söyleyebilir. Grafiği özelleştirmek için çeşitli parametreler belirleyebiliriz.

Mesela hue parametresi ile veri setine ayrı bir boyut kazandırabiliriz.

Bu şekilde veri seti hakkında daha fazla bilgi elde edebilir. Mesela yukarıdaki grafiğe bakarak en yüksek bahşişin hafta sonu verildiğini gözlemleyebiliriz.

Çizgi grafikleri daha çok zaman bağlı veri setlerinde kullanılırlar.

Günlere göre bırakılan bahşiş miktarının arttığını gözlemlemekteyiz. Veri seti tam anlamıyla zaman bağımlı olmadığı için çizgi grafikleri çok fazla bilgi vermeyecektir. Çizgi grafikleri daha çok borsa veri setleri, Iot senaryoları gibi anlık veri akışının olduğu durumlarda kullanılmaktadır.

Bir sonraki yazıda kategorik verilerin görselleştirilmesinde hangi grafiklerin kullanıldığına bakacağız.

Kaynaklar

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

Seda Kayademir
Seda Kayademir

No responses yet

Write a response