Veri Görselleştirme | Seaborn-2

Seda Kayademir
3 min readAug 8, 2020

--

Yazı dizisinin ilkinde kullanılan veri seti hakkında kısa bir bilgi verip istatistiksel ilişkileri görselleştirirken hangi grafiklerin kullanıldığına bakmıştık. Şimdi ise kategorik verileri görselleştirilmesine bakacağız.

Kategorik verileri görselleştirme

Kendi içinde üç gruba ayırabiliriz.

  • Kategorik dağılım grafikleri
  • Gözlemlerin kategoriler içindeki dağılımları
  • Kategoriler içinde istatistiksel tahmin

Kategorik dağılım grafikleri

İki farklı grafik türü kullanılabilir.

  • stripplot(şerit grafiği): Şerit grafiği, değişkenlerden birinin kategorik olduğu bir dağılım grafiğidir.
  • swarmplot: Bu işlev stripplot () işlevine benzer, ancak noktalar (sadece kategorik eksen boyunca) örtüşmeyecek şekilde ayarlanır. Bu, değerlerin dağılımının daha iyi bir temsilini verir, ancak çok sayıda gözlem için iyi ölçeklenmez. Daha çok küçük veri setlerinde kullanılır.

Bu grafik bize günlere göre kazancı göstermektedir. Grafiğe göre en az kazancın cuma günü olduğunu söyleyebiliriz.

swarmplot için stripplot özelleştirilmiş hali diyebiliriz. Gözlemleri üst üste bindirmez. Daha düzenli görüntü elde etmemizi sağlar.

Gözlemlerin kategoriler içindeki dağılımları

  • boxplot(kutu grafiği): Kutu grafiği, sayısal veri setlerinin aralığını ve dağılımını karşılaştırmak için uygundur. Sürekli değişkenleri görselleştirmek için kullanılır.
  • violinplot(keman grafiği): Merkezi eğilim hakkında bilgi verir. Nicel verilerin, bir (veya daha fazla) kategorik değişkenin çeşitli düzeylerinde dağılımını gösterir, böylece bu dağılımlar karşılaştırılabilir.
  • boxenplot: Büyük veri kümelerinde kullanılan kutu grafik türüdür.

Grafiklere baktığımızda müşterilerin hafta içi daha çok öğlen saatlerini tercih ederken hafta sonları akşam saatlerini tercih ettiklerini gözlemlemekteyiz aynı zamanda akşam saatlerinin daha fazla kazandırdığını söyleyebiliriz.

Violinplot merkezi eğilim hakkında bize bilgi vermektedir. Aynı zamanda verinin dağılımını gösterir.

Büyük veri kümelerinde kullanılan kutu grafik türüdür.

Kategorik tahmin grafikleri

  • pointplot(nokta grafiği): Bir nokta çizimi, bir sayısal değişken için bir merkezi eğilim tahminini, dağılım çizim noktalarının konumuna göre temsil eder ve hata çubuklarını kullanarak bu tahminin etrafındaki belirsizliğin bazı göstergelerini sağlar.
  • barplot(çubuk grafiği): Genellikle kategorik değişkenler için kullanılır. Çubuk grafik, birden çok değeri karşılaştırmak için uygundur. Boyut ekseni karşılaştırılan kategori öğelerini gösterir ve ölçüm ekseni her bir kategori öğesinin değerini gösterir. Sütunları gruplama ve yığınlama, gruplanmış verilerin görselleştirilmesini kolaylaştırır.
  • countplot(sayım grafiği): Sayım grafiği, niceliksel değişken yerine kategorik bir histogram olarak düşünülebilir.

Bu yazının sonuna gelmiş bulunuyoruz. Gelecek yazıda doğrusal ilişkileri görselleştirme ve veri kümesinin dağılımını görselleştirmek için kullanılan grafikleri inceleyeceğiz.

Kaynaklar

--

--