Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data

Untuk membuat AI lebih akurat, adil, dan tidak bias.

Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data
Ilustrasi artificial intelligence. (Pixabay/KELLEPICS)
Follow Fortune Indonesia untuk mendapatkan informasi terkini. Klik untuk follow WhatsApp Channel & Google News

Jakarta, FORTUNE – Kecerdasan buatan atau AI bukan hal alami atau muncul begitu saja. Prosesnya membutuhkan data dan menggunakan algoritme untuk membuat prediksi berdasarkan data itu, termasuk peran manusia di dalamnya. Oleh karena itu, untuk membuat AI lebih akurat, adil, tidak bias, pelabelan data pun dibutuhkan.

Menurut mit.edu, pelabelan data (data labelling) merupakan proses pemberian makna pada mesin pembelajar tentang poin-poin data individual yang tergambar melalui teks. Pelabelan data seperti satu fase terpenting yang akan menentukan tingkat kecerdasan sebuah sistem AI. Semakin banyak data yang dimiliki, maka sistem AI tersebut akan semakin akurat dalam menghasilkan prediksi.

Frederik Bussler, seorang konsultan dan analis digital, menulis di VentureBeat (7/12), tentang kumpulan data yang berlabel yang diperlukan AI agar bisa berfungsi dengan baik. Ia mencontohkan langkah perusahaan OpenAI dalam menawarkan penggunaan data berlabel untuk ‘meningkatkan perilaku model bahasa’.

Menurut Bussler, pelabelan data seperti yang dilakukan oleh OpenAI akan membawa sebuah revolusi dalam penggunaan AI. “Ini adalah contoh penting, karena model OpenAI telah lama ditegur karena dianggap ‘toxic’ dan rasis,” katanya. “Dan ini adalah contoh sempurna dalam menggunakan data berlabel untuk mengontrol bias.”

Pentingnya pelabelan data

Bussler mengungkapkan bahwa AI sejatinya tidak secerdas yang dibayangkan tanpa adanya pelabelan data. Banyak kasus terjadi yang menunjukkan kesalahan pembacaan data akibat sistem AI yang masih menggunakan data tak berlabel. “Saat diterapkan dalam keseharian, penggunaan data tanpa label akan berdampak serius dalam banyak kasus,” ujarnya.

Kesalahan-kesalahan ini banyak terjadi ketika datang ke domain yang menantang seperti perawatan kesehatan, moderasi konten, atau kendaraan otonom. Dalam banyak kasus, penilaian manusia masih diperlukan untuk memastikan modelnya akurat.

“Perhatikan contoh sarkasme dalam moderasi konten media sosial. Sebuah posting Facebook mungkin berbunyi, ‘Astaga, kamu sangat pintar!’. Namun, itu bisa menjadi sarkastik dengan cara yang bisa dilewatkan oleh robot. Lebih buruk lagi, model bahasa yang dilatih pada bias data dapat menjadi seksis, rasis, atau hal toxic lainnya,” menurut Bussler.

Memadukan AI dengan penilaian manusia

Bussler mengatakan pelabelan data secara manual untuk AI adalah proses padat karya. Diperlukan waktu berminggu-minggu atau berbulan-bulan untuk memberi label beberapa ratus sampel menggunakan pendekatan ini. Hal ini pun juga belum bisa terjamin tingkat akurasinya, terutama ketika menghadapi tugas pelabelan khusus berskala besar.

Bussler menyatakan bahwa cara terbaik untuk menskalakan pelabelan data dalam jumlah besar dan mampu bersaing dengan penyedia lain adalah dengan memadukan pembelajaran mesin dan keahlian manusia. “Perusahaan seperti Toloka, Appen, dan lainnya menggunakan AI untuk mencocokkan orang yang tepat dengan tugas yang tepat, sehingga para ahli melakukan pekerjaan yang hanya bisa mereka lakukan,” katanya.

Cara ini akan meningkatkan upaya pelabelan untuk data yang lebih akurat, kata Bussler. Selanjutnya, AI dapat menimbang jawaban dari responden yang berbeda sesuai dengan kualitas tanggapan. Ini memastikan bahwa setiap label memiliki peluang akurasi yang lebih tinggi.

Bussler menyampaikan bahwa data berlabel memicu revolusi AI baru. “Dengan menggabungkan AI dengan penilaian manusia, perusahaan dapat membuat model data yang akurat. Model-model ini kemudian dapat digunakan untuk membuat keputusan yang lebih baik yang memiliki dampak terukur pada bisnis,” katanya.

Aplikasi yang menggunakan pelabelan data

Bussler berpendapat, pelabelan data sangat penting untuk aplikasi pencarian, visi komputer, asisten suara, moderasi konten, dan banyak lagi. Pencarian adalah salah satu kasus penggunaan AI besar pertama yang mengandalkan penilaian manusia untuk menentukan relevansi. Dengan data berlabel, pencarian bisa sangat akurat.

Pada sektor perawatan kesehatan, AI dapat membantu mendiagnosis kondisi kulit dan retinopati diabetik, meningkatkan tingkat ingatan untuk tinjauan kepatuhan pengobatan, dan menganalisis laporan ahli radiologi untuk mendeteksi kondisi mata seperti glaukoma.

“Moderasi konten juga mengalami kemajuan signifikan berkat AI yang diterapkan pada sejumlah besar data berlabel. Hal ini terutama berlaku untuk topik sensitif, seperti kekerasan atau ancaman kekerasan. Misalnya, AI dengan data berlabel akan mampu membedakan postingan Youtube tentang ancaman bunuh diri dengan video informasi mengenai bunuh diri,” kata Bussler.

Penggunaan AI penting lainnya, ucap Bussler, adalah untuk pelabelan data dalam memahami suara dengan aksen atau nada apa pun, seperti asisten suara Alexa atau Siri. Ini membutuhkan pelatihan algoritme untuk mengenali pola bicara pria dan wanita berdasarkan volume besar audio berlabel.

Magazine

SEE MORE>
The Art of M&A
Edisi November 2024
Businessperson of the Year 2024
Edisi Oktober 2024
Turning Headwinds Into Tailwinds
Edisi September 2024
Indonesia's Biggest Companies
Edisi Agustus 2024
Human-AI Collaboration
Edisi Juli 2024
The Local Champions
Edisi Juni 2024
The Big Bet
Edisi Mei 2024
Chronicle of Greatness
Edisi April 2024

IDN Channels

Most Popular

Harga Saham Bank Rakyat Indonesia (BBRI) Hari Ini, 21 November 2024
Beban Kerja Tinggi dan Gaji Rendah, Great Resignation Marak Lagi
Terima Tawaran US$100 Juta Apple, Kemenperin Tetap Tagih Rp300 Miliar
Harga Saham GoTo Group (GOTO) Hari Ini, 21 November 2024
Siapa Pemilik Grab? Perusahaan Jasa Transportasi Terbesar
Tolak Wacana PPN 12 Persen, Indef Usulkan Alternatif yang Lebih Adil