Metodologi SIPKUMHAM

  1. Pengantar
  2. Kementerian Hukum dan Hak Asasi Manusia Republik Indonesia (Kemenkumham R.I.) merupakan salah satu kementerian yang menangani urusan-urusan atau masalah-masalah hukum dan hak asasi manusia. Berbagai urusan tersebut meliputi pembentukan atau formulasi kebijakan, pelaksanaan/implementasi, sampai dengan penanganan masalah-masalah hukum dan HAM. Meskipun masalah hukum dan masalah HAM mempunyai keterkaitan dan sebetulnya tidak bisa dipisahkan secara tegas, artinya masalah-masalah hukum yang menjadi tanggung jawab pemerintah tidak terlepas dari kerangka utama kewajiban negara dalam bidang HAM, yakni kewajiban untuk menghormati (respect), melindungi (protect), dan memenuhi (fulfil) HAM. Dalam menjabarkan tugas dan fungsi sebelumnya, Menteri Hukum dan HAM R.I. membagikan kewenangannya kepada 11 (sebelas) unit utama di bawah Kemenkumham R.I. dan bertanggung jawab langsung kepada Menteri Hukum dan HAM R.I.

    Dalam implementasinya, Kemenkumham R.I. seringkali membutuhkan adanya basis data dan informasi yang memadai, reliable, dan relevan mengenai permasalahan hukum dan HAM yang ada atau dirasakan oleh masyarakat. Basis data yang dimaksud diperlukan untuk memastikan adanya pembentukan kebijakan bidang hukum dan HAM yang berbasis bukti (policy-based evidence) serta penanganan atau penyelesaian masalah-masalah hukum dan HAM secara tepat dan efisien dalam membentuk kebijakan atau merespon masalah-masalah hukum dan HAM yang ada di masyarakat.

    Selain itu, pemerintah memang telah membentuk berbagai mekanisme atau institusi untuk menangani urusan-urusan hukum dan HAM, tidak bisa dipungkiri masih adanya proses pembentukan kebijakan atau penanganan masalah hukum dan HAM yang sesuai dengan kebutuhan. Dalam konteks tersebut, Sistem Informasi Hukum dan Hak Asasi Manusia (SIPKUMHAM) akan menjadi sistem informasi Kemenkumham R.I. yang mampu memberikan data dan informasi yang akurat, reliable, relevan dan cepat. Data dan informasi yang dimaksud akan dapat digunakan baik untuk kepentingan internal Kemenkumham R.I. sendiri maupun untuk kepentingan pemberian informasi kepada publik.

    Dengan perkembangan teknologi saat ini, dan adanya fenomena big data, informasi secara luas dapat diperoleh di dunia maya (online), yang memungkinan digunakannya metode crawling data dari berbagai sumber, utamanya dari media massa online, untuk mendapatkan data mentah (raw materials) maupun berbagai informasi hukum dan HAM yang dibutuhkan. Dengan tujuan tersebut, sistem informasi dalam SIPKUMHAM, dan termasuk Datamaskumham, dibentuk.

    Dalam pengembangan metodologi dan database SIPKUMHAM, database Deteksi Indonesia yang dikembangkan oleh The Habibie Center menjadi salah satu referensi utama.

  3. Membangun Database
  4. Komponen utama dalam program pembentukan Datamaskumham adalah membangun database yang dapat digunakan untuk tujuan: (i) mendukung pembentukan kebijakan hukum dan HAM yang berbasis bukti; (ii) mendukung peningkatan kualitas penelitian tentang hukum dan HAM dengan adanya data yang memadai; dan (iii) menyediakan informasi tentang permasalahan hukum dan HAM kepada publik. Berbagai tujuan tersebut ditentukan dengan pertimbangan bahwa belum ada data yang komprehensif, valid, dapat diandalkan (reliable), dan seketika (real time) tentang permasalahan hukum dan HAM di masyarakat.

    Dalam SIPKUMHAM terdapat data tentang permasalahan hukum dan HAM (Datamaskumham) yang berupaya untuk menyediakan data permasalahan hukum dan HAM yang komprehensif, reliable dan teraktual baik bagi kebutuhan internal Kemenkumham R.I., maupun bagi lembaga-lembaga negara lainnya dan juga bagi publik. Database ini dibangun dengan melakukan pengumpulan, klasifikasi dan analisis data permasalahan hukum dan HAM di masyarakat yang mencakupi berbagai komponen utama, yakni data dan informasi tentang : (i) peristiwa (waktu dan lokasi); (ii) pelaku dan korban; (iii) hak-hak terdampak yang ditimbulkan, baik berupa kerugian maupun pelanggaran HAM; (iv) penanganan permasalahan hukum dan HAM; serta (v) penyelesaian masalah hukum dan HAM.

    Penyediaan data dan informasi tentang permasalahan hukum dan HAM secara komprehensif dan sistematis, yang bersumber dari kondisi nyata di lapangan, merupakan upaya yang penting untuk dilakukan. Data dan informasi tersebut dapat digunakan untuk mengetahui, selain masalah hukum dan HAM secara umum, secara lebih mendalam tentang akar permasalahan sebagai penyebab permasalahan Hukum dan HAM, mengetahui kelemahan-kelemahan dalam penegakan hukum dan perlindungan HAM, serta melakukan analisis dan memberikan berbagai rekomendasi guna memperkuat mekanisme dan sistem penegakan hukum dan HAM di Indonesia.

  5. Ruang Lingkup
  6. Sering kali, proses pencarian dan pengumpulan informasi dari pihak lain (dalam hal ini media) didefinisikan sebagai proses media monitoring. Dalam prosesnya, informasi yang dikumpulkan dapat berupa berbagai jenis topik, sumber informasi dan format yang dapat digunakan untuk memberikan gambaran informasi yang beragam dari berbagai media.

    Secara singkat, pemantauan media adalah aktivitas meneliti dan mengamati pemberitaan dari media, baik itu cetak, media daring (online) maupun media penyiaran seperti televisi atau radio. Organisasi atau lembaga dapat melakukan pemilihan topik atau jenis sumber informasi yang ingin dipantau sesuai dengan kebutuhan dan mandatnya. Dalam prosesnya, pemantauan media melibatkan proses pengumpulan dan pencatatan informasi secara sistematis sumber media.1

    Datamaskumham akan menggunakan salah satu pendekatan yang telah digunakan secara universal oleh berbagai lembaga internasional yang bergerak di bidang hak asasi manusia yaitu “who did what to whom”2. Untuk menyesuaikan dengan kebutuhan pengembangan Datamaskumham, pendekatan ini akan dikembangkan menjadi “who did what to whom, where and when” dan menggunakan metode sistem media monitoring.

    Sistem media monitoring (event media monitoring) dapat dilakukan secara manual dan secara otomatis dengan melakukan pengecekan dari berita yang dibuat oleh media. Proses ini dimulai dengan menentukan sumber berita (media), pengembangan manual atau kata kunci, pengumpulan data secara berkelanjutan dan menentukan hasil dari berita.

    Permasalahan Hukum
    Permasalahan hukum adalah suatu peristiwa yang terjadi akibat dari adanya pelanggaran hukum atau konsekuensi lain berdasarkan peraturan perundang-undangan pada waktu tertentu di Indonesia. Permasalahan hukum pada umumnya mengandung tiga unsur, yaitu: (i) terjadinya peristiwa yang merupakan pelanggaran terhadap hukum yang berlaku di Indonesia; (ii) terdapat pihak yang terdampak atau terkait dengan permasalahan hukum yang terjadi, diantaranya korban dan pelaku, penggugat dan tergugat, pemohon dan termohon, dan pihak lainnya; (iii) terdapat kerugian yang ditimbulkan, baik materil maupun immateril.

  7. Struktur Database
  8. Struktur Database

    Secara umum, database ini terdiri dari dua bagian besar, yaitu:

    Bagian I: Permasalahan Hukum

    • Peristiwa hukum [waktu, lokasi, pelaku, korban, kerugian].
    • Klasifikasi/jenis masalah hukum [pidana, perdata, TUN/Administrasi, Agama].
    • Penanganan masalah hukum.
    • Penyelesaian masalah hukum.3
    • Isu Hukum.

    Bagian II: Permasalahan HAM

    • Peristiwa pelanggaran HAM [waktu, lokasi, pelaku, korban].
    • Klasifikasi jenis pelanggaran HAM.
    • Tingkat penanganan permasalahan HAM.4
    • Hak yang terdampak.
    • Isu HAM.

  9. Menentukan Sumber Data
  10. Dalam database ini, pencatatan dilakukan dengan menggunakan pendekatan peristiwa yang memuat informasi terkait dengan permasalahan hukum dan HAM. Dalam pengembangan awal database ini, disepakati untuk mengambil sumber informasi dari sumber yang berasal media online/siber,5 lembaga swadaya masyarakat dan jurnal. Jenis sumber informasi mulai dari berita, laporan hingga naskah akademis dapat digunakan selama memenuhi kriteria yang telah ditentukan di atas.

    Variabel data yang dikumpulkan adalah tanggal dan lokasi peristiwa, nama korban dan terduga pelaku, jenis kelamin serta beberapa variabel yang dapat membantu proses analisis seperti hak terdampak, karakteristik korban dan jenis pelaku.

    Berdasarkan kebutuhan di atas, maka sumber informasi yang diambil dalam pencarian setidaknya memiliki beberapa kriteria: Sumber data harus memiliki informasi yang cukup dari sebuah peristiwa dan beserta variabel lain yang dibutuhkan sehingga dapat dibuat menjadi data terpilah; Informasi yang diambil memiliki akurasi terkait dengan peristiwa terjadi serta dapat diperbandingkan (corroborate) dengan sumber data lainnya seperti media dan laporan; Melakukan pembaruan informasi secara berkala; dan Dapat diakses oleh publik.

    Sementara untuk pemilihan sumber informasi yang berbasis media siber, terdapat beberapa kriteria yang perlu diperhatikan: Media siber yang dipantau terdaftar dan telah diverifikasi administrasi dan faktual oleh Dewan Pers; dan Pemberitaan mencakup permasalahan hukum dan HAM.

  11. Mengolah Data
  12. Untuk kebutuhan database ini, metode yang digunakan untuk pengumpulan data adalah web scraping. Metode web scraping adalah upaya mengambil data dari sebuah website, baik secara manual atau menggunakan bantuan dari software. Untuk lengkapnya silakan lihat bagan di bawah:

    Metode ekstraksi informasi yang digunakan adalah melakukan analisis terhadap data hasil crawling yang telah disimpan di dalam database.6 Informasi yang dianalisis adalah judul berita, waktu publikasi berita, dan isi berita. Pertama-tama digunakan metode Named Entity Recognition/NER untuk melakukan pengenalan entitas terhadap masing-masing kata yang ada pada judul dan konten berita. Pengenalan ini nantinya akan menjadi pola yang akan digunakan untuk melakukan pembuatan kesimpulan terhadap suatu hal. Pada dasarnya NER akan menghasilkan output berupa pengenalan terhadap:

    1. Orang (korban, pelaku, penggugat, tergugat, pemohon dan termohon);
    2. Pihak terkait (kementerian/lembaga negara dan lain-lain);
    3. Tempat/lokasi kejadian peristiwa permasalahan hukum dan HAM;
    4. Waktu (tanggal, bulan, dan tahun terjadinya permasalahan);
    5. Kategori (permasalahan hukum dan HAM);
    6. Hak terdampak; dan
    7. Hal lainnya yang diperlukan untuk memperkuat analisa dari sistem.

    Informasi di atas akan diekstrak secara global, tanpa melihat peristiwa yang berkaitan dengan masing-masing entitas. Entitas tersebut akan menjadi bernilai ketika sudah dibubuhi pola pembentukan kalimat dan post tagging dari masing-masing kata.

    NER pada awalnya mengekstrak kata Agus sebagai Person dan Jakarta sebagai Tempat. Tetapi apabila kita memasukan pola bahwa ketika Person + Kata Kerja + Kata Sambung + Tempat memiliki nilai tertentu, maka Ekstraksi lanjutan dapat didapatkan dari Kalimat di atas.

    Selain itu susunan kata juga akan dijadikan formulasi, yang secara semantik sudah terbentuk ketika proses NER berjalan. Referensi dari pembentukan NER ini berdasarkan corpus yang sudah dibentuk sebelumnya. Dimana corpus ini akan selalu di-update dari waktu ke waktu seiring dengan varian susunan kalimat yang dapat menyebabkan perubahan output dari proses ini sendiri.

    Dari susunan kata dan entitas yang berhasil didapatkan oleh NER, selanjutnya dapat dirumuskan pola-pola untuk melakukan event extraction. Event extraction merupakan suatu metode ekstraksi terhadap informasi tertentu berdasarkan beberapa variabel yang sudah ditentukan sebelumnya sehingga dapat menghasilkan output berupa peristiwa atau kejadian yang terjadi dari suatu artikel.

    Selain event extraction, juga diberlakukan information extraction untuk melengkapi informasi penguat yang dibutuhkan ketika terjadi suatu kejadian.

_______________________________________

[1] Pernet, Jérémie, HURIDOCS, Media Monitoring, Information Scanning, Intelligence for Human Rights NGO, 2009. [2] Judith Dueck, HURIDOCS Events Standard Formats: A Tool for Documenting Human Rights Violations, 2001, second Revised edition, 8 - 10 [3] Berdasarkan hasil rapat, fitur ini masuk dalam rencana pengembangan ke depan. [4] Berdasarkan hasil rapat, fitur ini masuk dalam rencana pengembangan ke depan. [5] Istilah media siber adalah istilah yang digunakan oleh Dewan Pers untuk mengkategorikan media daring. [6] Metodologi Deteksi Indonesia, diakses pada 22 Oktober 2019 - https://www.deteksiindonesia.com/metodologi