Cara Mengambil Nama Kolom di Dataframe Pandas
Terkadang kita memerlukan nama-nama kolom pada suatu tabel atau dataframe, misal untuk mengambil nama fitur yang akan dimasukkan ke sebuah model machine learning.
# import pandas
import pandas as pd
# load csv
df = pd.read_csv("diabetes.csv")
# menampilkan 5 data awal
df.head()
Output:
column_names =[]
for col in df.columns:
column_names.append(col)
print(column_names)
Output:
['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age', 'Skin', 'Outcome']
Metode 2: Menggunakan columns dataframe object
df.columns
Output:
Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
'BMI', 'DiabetesPedigreeFunction', 'Age', 'Skin', 'Outcome'],
dtype='object')
Mengubahnya ke bentuk list
list(df.columns)
Output:
['Pregnancies',
'Glucose',
'BloodPressure',
'SkinThickness',
'Insulin',
'BMI',
'DiabetesPedigreeFunction',
'Age',
'Skin',
'Outcome']
Metode 3: Mengambil nama kolom tertentu, misal kolom ke 4
df.columns[3]
Output:
'SkinThickness'
Metode 4: Mengambil rentang nama kolom tertentu, misal kolom 1-3
list(df.columns[:3])
Output:
['Pregnancies', 'Glucose', 'BloodPressure']
Metode 5: Mengambil rentang nama kolom tertentu, misal kolom 2-4
list(df.columns[1:4])
Output:
['Glucose', 'BloodPressure', 'SkinThickness']
Metode 6: Mengambil rentang nama kolom tertentu, misal kolom 4-10
list(df.columns[3:10])
Output:
['SkinThickness',
'Insulin',
'BMI',
'DiabetesPedigreeFunction',
'Age',
'Skin',
'Outcome']