Database kodepos dan wilayah Indonesia

Hallo semua,

Kali ini saya pengen share database kodepos dan wilayah Indonesia. Sebelumnya sudah banyak yg nge-share database wilayah indonesia & kodepos secara terpisah. Alangkah baiknya jika keduanya disatukan untuk saling melengkapi.

Sebenernya sudah lama saya cari database kodepos. Beberapa bulan kemaren googling gak ketemu. Ini kemaren googling hasilnya melimpah. Padahal klo diliat postingan lama. Entahlah :/

Sumber data

Klo database wilayah saya ambil disini, sudah disesuaikan dgn Permendagri, sudah komplit databasenya. Ada Propinsi, kota, kecamatan dan daerah. Dilengkapi dgn penomoran kode wilayah.

Sedang data Kodepos akhirnya saya ambi disini. Cuma ya.. itu. Hanya disediakan SQL untuk 1 tabel kodepos. nama wilayah ditulis sebagai teks. Tidak bisa dikatakan database relasional #tepokjidat.

Tantangan

Pertama, tentu saja normalisasi database. Data kodepos saya olah jadi database wilayah bayangan terlebih dahulu. Data bayangan ini kemudian dikonsolidasikan dgn database wilayah yg asli.

Kedua, Typo! tentu saja ini musuh terbesar data. Susah klo datanya sudah puluhan ribu. Untuk propinsi dan kota datanya belum terlalu banyak. Masih memungkinkan untuk dicek satu-per-satu. Tapi kalo kelurahan sudah tidak munkin. Akhirnya pencocokan data menggunakan operator like untuk menemukan nama yg mirip. Begitu sulitnya sampai akhirnya harus dicocokan berdasar pola huruf konsonannya.

Ketiga, nama kabupaten & kota yg sama. Di sumber data kodepos tidak dibedakan sehingga sangat menyulitkan. Akhirnya data kota & kabupaten yg sama saya kelompokkan dulu. Diolah belakangan. Dicek kecamatannya dahulu baru dipastikan itu masuk kota atau kabupaten.

Keempat, input yg benar2 berbeda. Entah salah input atau memang ada pemekaran wilayah saya kurang tau.

Kelima, ketelitian & urutan pengolahan data. Fyuh! sampai hari keempat ternyata ada relasi kecamatan yg tidak cocok dgn kotanya karena punya nama yg sama. Akhirnya harus diulang lagi mulai dr propinsi & kota lagi. Diolah mulai dr nama yg sama persis kemudian dicocokan menggunakan pola.

Saya sendiri harus ngulang pengolahan sampai 4 kali, buat memastikan relasi kota, kecamatan & kelurahan bener semua. Jangan sampai relasi kecamatan & kota tidak nyambung.

Hasil Database kodepos dan wilayah

Database wilayah dan kodepos Indonesia bisa ditemukan folder ini.
bentuknya file SQL. tinggal diimport sesuai urutan file yg ada di folder tersebut.

Kodepos itu unik, 1 kodepos bisa dipake 1 kecamatan, tapi jg ada 1 kelurahan punya 2 kodepos. Ya memang, kodepos bukan termasuk dalam struktur pemerintahan 🙂

Untuk provinsi dan kota sudah dipastikan  ketemu semua di database wilayah. Sedang yg tidak ketemu ada beberapa ratus kecamatan & beberapa ribu desa. Rasanya gak munkin dicocokan satu-per satu :3. Akhirnya kodepos yg gak komplit & duplikat saya hapus saja drpd jadi sampah.

Ingin bantu mengolah data?

Klo masih penasaran dgn kodepos yg gagal diolah bisa cek file tbl_kodepos.sql.zip. Itu dump hasil olahan data terakhir sebelum dirapikan & dihapus data sampahnya.

 

Stat
Sumber Kodepos yg diolah: 81.248 record.
Hasil olahan Kodepos: 76.264 record.
Penelusuran provinsi: 100%.
Penelusuran kota: 100%.
Penelusuran Kecamatan: 99,99% (1 kecamatan tidak ditemukan dr 7.000 master data).
Penelusurankelurahan: 99,99% (208 kelurahan tidak ditemukan dr 82.000 master data).

Kodepos lain yg duplikat & tidak ketemu kelurahannya dihapus.

 

Sekian, semoga bermanfaat 🙂