Nama Anggota Kelompok:
Sultan R. Bagu (20523206)
Rafli Assiddiqie Raihan (20523222)
Ananda Ramadhani (20523135)
Data: Kategori Pembelian Online
Di bawah ini adalah data Kategori Pembelian Online, Kami membuat sebuah model untuk memprediksi e-commerce terbaik berdasarkan ulasan konsumen. Kami membuat model ini bertujuan untuk membantu para konsumen e-commerce untuk mengetahui e-commerce mana yang paling sesuai untuk membeli sebuah kategori produk tertentu.
Dataset Kategori Pembelian Online
Untuk memenuhi yang kami buat, maka kami memerlukan sebuah dataset yaitu yang kami pilih data kategori pembelian online. Data ini kami peroleh dari hasil melakukan survei melalui google form dan juga wawancara secara langsung kepada teman-teman kami.
40
Nabila Alifah
Travel
41
Natasha G
Tiket Hiburan
42
Daffa Aqilah
Makanan dan Minuman
43
Akbar Firdaus
Pembayaran Tagihan
44
Zidan Mulyana
Makanan dan Minuman
45
Richard Ferdinand
Makanan dan Minuman
46
Rangga Galih Saputra
Teknologi
47
Rania Dewi
Kosmetik
48
Sabina Melinda
Kosmetik
49
Salma A
Buku dan Alat Tulis
Untuk memudahkan kita dalam melihat kategori produk apa dalam sebuah platform yang diminati oleh Pembeli, maka di bawah ini merupakan tampilan data Kategori Pembelian Online dalam bentuk bar chart dengan X axisnya adalah Platform dan Y axisnya adalah Kategori produk.
Pemodelan Data
Kami memfilter dataset yang kami miliki, data yang kami filter yaitu Kategori produk, Kepastian produk, Promo/Cashback, Kualitas barang, Pilihan produk bervariasi, Sistem pembayaran lebih mudah, Mudah dan praktis, keamanan transaksi, Harga yang terjangkau, Platform.
0
Fashion
0
1
Pembayaran Tagihan
0
2
Tiket Hiburan
0
3
Fashion
0
4
Fashion
1
5
Fashion
0
6
Kebutuhan sehari-hari
0
7
Fashion
0
8
Travel
1
9
Teknologi
0
Setelah memfilter dataset yang kami miliki, lalu kami mengubahnya ke dalam bentuk array.
Kami mengdiskretisasi kolom Kategori produk agar model mudah mengolah datanya.
Pada langkah selanjutnya, kami memisahkan list data yang telah kami ubah pada tahap sebelumnya
[[0 0 1 0 1 0 0 0 1]
[1 0 1 0 0 1 1 1 0]
[2 0 0 0 0 1 1 1 1]
[0 0 0 1 0 1 0 1 1]
[0 1 1 0 0 0 1 0 1]
[0 0 1 0 0 1 1 0 0]
[3 0 0 0 1 1 1 0 1]
[0 0 1 0 0 0 1 1 1]
[4 1 1 0 0 0 1 0 1]
[5 0 1 1 0 1 1 0 0]
[3 0 0 0 0 0 0 0 1]
[5 1 0 1 1 0 0 1 0]
[4 0 1 0 0 1 1 0 1]
[1 0 0 0 1 1 1 1 1]
[6 0 1 0 1 0 1 0 1]
[0 0 0 1 1 1 1 0 0]
[7 1 1 1 0 0 1 0 0]
[0 0 1 0 0 0 1 1 0]
[4 0 1 0 0 1 0 1 1]
[3 1 1 1 0 0 0 1 0]
[2 0 1 0 1 0 1 0 1]
[2 0 1 0 0 1 1 0 1]
[0 1 1 0 0 0 0 1 1]
[8 0 1 1 1 1 0 0 0]
[9 1 1 0 0 0 1 0 1]
[0 0 0 1 1 0 0 1 1]
[2 1 1 0 1 1 0 0 0]
[5 0 1 1 0 0 1 1 0]
[0 1 0 0 1 1 0 0 1]
[7 1 0 0 1 0 1 0 1]
[9 1 1 0 0 0 1 0 1]
[5 0 1 0 0 0 1 1 1]
[3 0 1 1 0 0 1 0 1]
[5 0 0 1 1 0 0 1 1]
[2 0 1 0 1 1 1 0 0]
[9 1 1 0 1 0 1 0 0]
[7 0 0 1 1 0 1 1 0]
[1 0 1 0 0 1 1 0 1]
[3 1 0 0 1 1 0 0 1]
[8 1 1 1 0 0 0 1 0]
[4 0 1 0 1 0 1 0 1]
[2 1 0 0 1 1 1 0 0]
[9 0 1 0 0 0 1 1 1]
[1 0 1 0 0 1 1 0 1]
[9 0 1 1 0 1 1 0 0]
[9 1 1 1 1 0 0 0 0]
[5 1 0 1 0 1 1 0 0]
[6 0 0 1 1 0 0 1 1]
[6 1 1 0 0 0 0 1 1]
[8 0 0 1 1 1 1 0 0]]
['Shopee' 'Tokopedia' 'Tix.id' 'Shopee' 'Shopee' 'Shopee' 'Shopee'
'Zalora' 'Traveloka' 'Shopee' 'Shopee' 'Tokopedia' 'Traveloka'
'Tokopedia' 'Shopee' 'Zalora' 'Tokopedia' 'Lazada' 'Traveloka'
'Tokopedia' 'Tiket.com' 'Tix.id' 'Shopee' 'Shopee' 'Grabfood' 'Zalora'
'Tiket.com' 'BukaLapak' 'Zalora' 'BukaLapak' 'Gofood' 'BukaLapak'
'Shopee' 'JD.ID' 'Tix.id' 'Gofood' 'Tokopedia' 'Shopee' 'Tokopedia'
'Tokopedia' 'Tiket.com' 'Traveloka' 'Gofood' 'Tokopedia' 'Gofood'
'Grabfood' 'JD.ID' 'Lazada' 'Lazada' 'Tokopedia']
Selanjutnya data dilatih dengan Sklearn model menggunakan test size 0.1
Berikut score yang didapat dari model yang dilatih:
Untuk menyimpan model yang sudah dibuat kami menggunakan pickle
Prediksi Data
Memuat model data yang telah disimpan menggunakan pickle.load
Kami membuat sebuah data baru dengan kategori produk yaitu teknologi dengan alasannya kepastian produk, sistem pembayaran lebih mudah, mudah dan praktis, dan harga yang terjangkau untuk memprediksikan e-commerce mana yang sesuai dengan data tersebut. Kemudian pada bagian kategori produk kami diskretisasikan.
Memprediksi data baru dengan loaded_clf.predict, dan hasilnya: