Prediksi Harga Rumah di Jakarta Selatan
Pada tugas besar kali ini saya dan team akan menganalisa harga rumah yang ada di daerah jakarta selatan. Umumnya harga rumah di daerah jakarta selatan relatif mahal. Karena dekat dengan pusat kota. Dengan adanya prediksi analisa harga rumah di jakarta selatan ini, para pemuda dapat terbangun jiwanya agar lebih giat untuk mencari uang.
Disini kita akan menggunakan banyak library. 1. Numpy untuk mengkonversi data ke dalam array 2. Pandas untuk membaca dataset 3. matplotlib.pyplot untuk menampilkan plot data dari numpy array 4. Seaborn untuk menampilkan grafik data
1. Load Dataset
Melihat data diatas kita akan kesulitan untuk membaca harga dari rumah yang ada. Kita akan menambahkan satu kolom yaitu HargaJuta agar kita bisa membaca harga lebih mudah.
2. Feature Importance
Kali ini kita akan membandingkan harga dengan atribut lainnya. Apakah harga berpengaruh terhadapa tiap fitur?
Dari visualisasi data diatas kita bisa melihat hubungan antara LB dan LT. Harga sangat dipengaruhi oleh 2 fitur tersebut. Semakin besar luas bangunan dan luas tanah maka harga akan semakin meningkat.
3. Summary
Sekarang kita cari tahu dulu harga rumah yang termurah dan termahal
4. Grouping
Disini kita akan mengkelompokkan harga rumah berdasarkan persebarannya
Hal yang menarik yang kita ketahui disini adalah ternyata di daerah jakarta selatan mayoritas adalah rumah dengan harga tinggi, dari sini kita bisa mengetahui bahwa daerah jakarta selatan adalah kawasan yang didominasi masyarakat menengah atas.
Sekarang kita akan menambahkan fitur baru yaitu Kelas Harga. Ini berguna agar kita tahu data rumah mana saja yang termasuk kedalam harga kelas Rendah, Menengah dan Tinggi.
5. Comparison
Sekarang mari kita coba membandingkan persebaran jumlah kamar tidur, kamar mandi dan garasi dengan harga rumah berdasarkan Kelas Harga.
Bisa kita liat dari visualisasi data diatas fitur KT, KM dan GRS tidak terlalu berpengaruh terhadap harga rumah. Agar lebih meyakinkan mari kita coba cek koefisi korelasi dari ketiga fitur tersebut.
Dari data diatas kita bisa melihat korelasi 3 fitur itu disekitar 50%. Bisa disimpulkan bahwa KT, KM dan GRS tidak terlalu berpengaruh pada harga rumah. Lalu bagaimana dengan Luas bangunan dan Luas Tanah? kita akan coba menggunakan metode yang sama
Bisa kita lihat dengan menggunakan pearson method, korelasi yang kita dapatkan untuk LT dan LB cukup besar di sekitar 75%. Dengan begitu LB dan LT sangat berpengaruh kepada harga rumah.
6. Data Preparation
7. Train data
Library yang kedua yang akan kita pakai adalah Scikit-Learn . Library ini dipakai untuk keperluan pengembangan model machine learning secara umum. Ada banyak fungsi untuk bikin model, penyiapan data, evaluasi, dsb.
8. Prediksi Harga Rumah Baru
Disini kita akan memprediksi harga rumah baru sesuai yang kita mau berdasarkan Luas Bangunan dan Luas Tanah.
Dikarenakan sulit untuk melihat harga maka kita akan menambahkan code konversi harga int ke dalam rupiah.
9. Penutup
Dari apa yang sudah kita lihat diatas bisa kita simpulkan bahwa harga rumah di jakarta selatan relatif mahal. Mungkin sekian yang bisa kami tampilkan dari hasil akhir tugas Fundamen Sains Data. Terimakasih.