Postingan

Menampilkan postingan dari Oktober 30, 2022

Seaborn dg Pandas (Python)

Statistik summary df = pd.read_csv('data dalam bentuk.csv', index_col='name') #Missing value plt.figure(figsize=(6, 6)) sns.heatmap(df.isna(), cmap='Blues', cbar=False) #korelasi heatmap plt.figure(figsize=(6, 6)) sns.heatmap(df.corr(), cmap='bwr', cbar=False, vmin=-1, vmax=1, annot=True, square=True, fmt='.1f')  #annot muncul angka, fmt untuk minta nilai dibelkang koma hanya 1 #pairplot sns.pairplot(df, hue='shelf', vars=['calories', 'fat', 'rating']) #analisis secara trend sns.pairplot(df, hue='shelf', vars=['calories', 'fat', 'rating'], kind='reg')  #regresi sns.jointplot('potass', 'fiber', data=df, marginal_kws={'bins' : 25}, kind=reg) #kalau mau analisis 2 pakai joint, marginal kws untuk plot bins #jika data kategori persebaran sns.catplot('mfr', 'rating', data=df) #jika data sedikit sns.boxplot('mfr', 'rating', dat...

Visualisasi Data Sains menggunakan seaborn (Python)

#modules import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('data yang mau dipanggil') df.head()  #print awalan data #contoh data, kita timpa df1 = df(df.tipe == 'data1') df2 = df(df.tipe == 'data2') plt.scatter(df1.X, df1.y) plt.scatter(df2.X, df2.y) #seaborn lebih mempermudah ketimbang scatter sns.scatterplot('X', 'y', data=df, hue='tipe)  #hue warnanya berdasakan, otomatis dalam 1 code ketimbang scatter bisa juga tambhkan matplotlib dg plt.figue(figsize=(6, 6)) #bisa juga kita lakukan regresi sns.lmplot('X', 'y', data=df, hue='tipe) #histogram sns.distplot(df1.x, bins=20) #garis aproximasi bentuk histogramnya