Nama Anggota Kelompok:
Sultan R. Bagu (20523206)
Rafli Assiddiqie Raihan (20523222)
Ananda Ramadhani (20523135)
Data: Kategori Pembelian Online
Di bawah ini adalah data Kategori Pembelian Online, Kami membuat sebuah model untuk memprediksi e-commerce terbaik berdasarkan ulasan konsumen. Kami membuat model ini bertujuan untuk membantu para konsumen e-commerce untuk mengetahui e-commerce mana yang paling sesuai untuk membeli sebuah kategori produk tertentu.
Dataset Kategori Pembelian Online
Untuk memenuhi yang kami buat, maka kami memerlukan sebuah dataset yaitu yang kami pilih data kategori pembelian online. Data ini kami peroleh dari hasil melakukan survei melalui google form dan juga wawancara secara langsung kepada teman-teman kami.
Untuk memudahkan kita dalam melihat kategori produk apa dalam sebuah platform yang diminati oleh Pembeli, maka di bawah ini merupakan tampilan data Kategori Pembelian Online dalam bentuk bar chart dengan X axisnya adalah Platform dan Y axisnya adalah Kategori produk.
Pemodelan Data
Kami memfilter dataset yang kami miliki, data yang kami filter yaitu Kategori produk, Kepastian produk, Promo/Cashback, Kualitas barang, Pilihan produk bervariasi, Sistem pembayaran lebih mudah, Mudah dan praktis, keamanan transaksi, Harga yang terjangkau, Platform.
Setelah memfilter dataset yang kami miliki, lalu kami mengubahnya ke dalam bentuk array.
Kami mengdiskretisasi kolom Kategori produk agar model mudah mengolah datanya.
Pada langkah selanjutnya, kami memisahkan list data yang telah kami ubah pada tahap sebelumnya
Selanjutnya data dilatih dengan Sklearn model menggunakan test size 0.1
Berikut score yang didapat dari model yang dilatih:
Untuk menyimpan model yang sudah dibuat kami menggunakan pickle
Prediksi Data
Memuat model data yang telah disimpan menggunakan pickle.load
Kami membuat sebuah data baru dengan kategori produk yaitu teknologi dengan alasannya kepastian produk, sistem pembayaran lebih mudah, mudah dan praktis, dan harga yang terjangkau untuk memprediksikan e-commerce mana yang sesuai dengan data tersebut. Kemudian pada bagian kategori produk kami diskretisasikan.
Memprediksi data baru dengan loaded_clf.predict, dan hasilnya: