Project 2 kelompok FSD

Nama Anggota Kelompok:

Sultan R. Bagu (20523206)

Rafli Assiddiqie Raihan (20523222)

Ananda Ramadhani (20523135)

Data: Kategori Pembelian Online

Di bawah ini adalah data Kategori Pembelian Online, Kami membuat sebuah model untuk memprediksi e-commerce terbaik berdasarkan ulasan konsumen. Kami membuat model ini bertujuan untuk membantu para konsumen e-commerce untuk mengetahui e-commerce mana yang paling sesuai untuk membeli sebuah kategori produk tertentu.

Dataset Kategori Pembelian Online

Untuk memenuhi yang kami buat, maka kami memerlukan sebuah dataset yaitu yang kami pilih data kategori pembelian online. Data ini kami peroleh dari hasil melakukan survei melalui google form dan juga wawancara secara langsung kepada teman-teman kami.

import pandas as pd data = pd.read_csv("Data_Kelompok_Project_FSD.csv") data

Untuk memudahkan kita dalam melihat kategori produk apa dalam sebuah platform yang diminati oleh Pembeli, maka di bawah ini merupakan tampilan data Kategori Pembelian Online dalam bentuk bar chart dengan X axisnya adalah Platform dan Y axisnya adalah Kategori produk.

Pemodelan Data

Kami memfilter dataset yang kami miliki, data yang kami filter yaitu Kategori produk, Kepastian produk, Promo/Cashback, Kualitas barang, Pilihan produk bervariasi, Sistem pembayaran lebih mudah, Mudah dan praktis, keamanan transaksi, Harga yang terjangkau, Platform.

data_filtered = data[['Kategori produk', 'Kepastian Produk', 'Promo/Cashback', 'Kualitas barang', 'Pilihan Produk Bervariasi', 'Sistem Pembayaran Lebih Mudah', 'Mudah dan Praktis', 'Keamanan transaksi', 'Harga yang Terjangkau', 'Platform']] data_filtered

Setelah memfilter dataset yang kami miliki, lalu kami mengubahnya ke dalam bentuk array.

data_list = data_filtered.values data_list

Kami mengdiskretisasi kolom Kategori produk agar model mudah mengolah datanya.

#discretization for i in data_list: if i[0] == 'Fashion': i[0]=0 elif i[0] == 'Pembayaran Tagihan': i[0]=1 elif i[0] == 'Tiket Hiburan': i[0]=2 elif i[0] == 'Kebutuhan sehari-hari': i[0]=3 elif i[0] == 'Travel': i[0]=4 elif i[0] == 'Teknologi': i[0]=5 elif i[0] == 'Kosmetik': i[0]=6 elif i[0] == 'Elektronik': i[0]=7 elif i[0] == 'Buku dan Alat Tulis': i[0]=8 elif i[0] == 'Makanan dan Minuman': i[0]=9 data_list

Pada langkah selanjutnya, kami memisahkan list data yang telah kami ubah pada tahap sebelumnya

X = data_list[:, :9] y = data_list[:, -1] print(X) print(y)

Selanjutnya data dilatih dengan Sklearn model menggunakan test size 0.1

from sklearn.model_selection import train_test_split X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.1, random_state=0)

from sklearn.naive_bayes import MultinomialNB clf = MultinomialNB() clf.fit(X_train, y_train)

Berikut score yang didapat dari model yang dilatih:

clf.score(X_val, y_val)

Untuk menyimpan model yang sudah dibuat kami menggunakan pickle

from sklearn.linear_model import LogisticRegression import pickle filename = 'finalized_model.sav' pickle.dump(clf, open(filename, 'wb'))

Prediksi Data

Memuat model data yang telah disimpan menggunakan pickle.load

import pickle loaded_clf = pickle.load(open('finalized_model.sav', 'rb'))

Kami membuat sebuah data baru dengan kategori produk yaitu teknologi dengan alasannya kepastian produk, sistem pembayaran lebih mudah, mudah dan praktis, dan harga yang terjangkau untuk memprediksikan e-commerce mana yang sesuai dengan data tersebut. Kemudian pada bagian kategori produk kami diskretisasikan.

data_baru = [['Teknologi', 1, 0, 0, 0, 1, 1, 0, 1]] for i in data_baru: if i[0] == 'Fashion': i[0]=0 elif i[0] == 'Pembayaran Tagihan': i[0]=1 elif i[0] == 'Tiket Hiburan': i[0]=2 elif i[0] == 'Kebutuhan sehari-hari': i[0]=3 elif i[0] == 'Travel': i[0]=4 elif i[0] == 'Teknologi': i[0]=5 elif i[0] == 'Kosemetik': i[0]=6 elif i[0] == 'Elektronik': i[0]=7 elif i[0] == 'Buku dan Alat Tulis': i[0]=8 elif i[0] == 'Makanan dan Minuman': i[0]=9 data_baru

Memprediksi data baru dengan loaded_clf.predict, dan hasilnya:

loaded_clf.predict(data_baru)

.css-15w88e5{color:var(--chakra-colors-fg-neutral-primary);font-weight:inherit;letter-spacing:-0.09px;}Nama Anggota Kelompok:

Data: Kategori Pembelian Online

Dataset Kategori Pembelian Online

Pemodelan Data

Prediksi Data

Nama Anggota Kelompok: