Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data

Untuk membuat AI lebih akurat, adil, dan tidak bias.

Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data

Ilustrasi artificial intelligence. (Pixabay/KELLEPICS)

by Bayu Pratomo Herjuno Satito

08 December 2021

Follow Fortune Indonesia untuk mendapatkan informasi terkini. Klik untuk follow WhatsApp Channel & Google News

Jakarta, FORTUNE – Kecerdasan buatan atau AI bukan hal alami atau muncul begitu saja. Prosesnya membutuhkan data dan menggunakan algoritme untuk membuat prediksi berdasarkan data itu, termasuk peran manusia di dalamnya. Oleh karena itu, untuk membuat AI lebih akurat, adil, tidak bias, pelabelan data pun dibutuhkan.

Menurut mit.edu, pelabelan data (data labelling) merupakan proses pemberian makna pada mesin pembelajar tentang poin-poin data individual yang tergambar melalui teks. Pelabelan data seperti satu fase terpenting yang akan menentukan tingkat kecerdasan sebuah sistem AI. Semakin banyak data yang dimiliki, maka sistem AI tersebut akan semakin akurat dalam menghasilkan prediksi.

Frederik Bussler, seorang konsultan dan analis digital, menulis di VentureBeat (7/12), tentang kumpulan data yang berlabel yang diperlukan AI agar bisa berfungsi dengan baik. Ia mencontohkan langkah perusahaan OpenAI dalam menawarkan penggunaan data berlabel untuk ‘meningkatkan perilaku model bahasa’.

Menurut Bussler, pelabelan data seperti yang dilakukan oleh OpenAI akan membawa sebuah revolusi dalam penggunaan AI. “Ini adalah contoh penting, karena model OpenAI telah lama ditegur karena dianggap ‘toxic’ dan rasis,” katanya. “Dan ini adalah contoh sempurna dalam menggunakan data berlabel untuk mengontrol bias.”

Pentingnya pelabelan data

Bussler mengungkapkan bahwa AI sejatinya tidak secerdas yang dibayangkan tanpa adanya pelabelan data. Banyak kasus terjadi yang menunjukkan kesalahan pembacaan data akibat sistem AI yang masih menggunakan data tak berlabel. “Saat diterapkan dalam keseharian, penggunaan data tanpa label akan berdampak serius dalam banyak kasus,” ujarnya.

Kesalahan-kesalahan ini banyak terjadi ketika datang ke domain yang menantang seperti perawatan kesehatan, moderasi konten, atau kendaraan otonom. Dalam banyak kasus, penilaian manusia masih diperlukan untuk memastikan modelnya akurat.

“Perhatikan contoh sarkasme dalam moderasi konten media sosial. Sebuah posting Facebook mungkin berbunyi, ‘Astaga, kamu sangat pintar!’. Namun, itu bisa menjadi sarkastik dengan cara yang bisa dilewatkan oleh robot. Lebih buruk lagi, model bahasa yang dilatih pada bias data dapat menjadi seksis, rasis, atau hal toxic lainnya,” menurut Bussler.

Memadukan AI dengan penilaian manusia

Bussler mengatakan pelabelan data secara manual untuk AI adalah proses padat karya. Diperlukan waktu berminggu-minggu atau berbulan-bulan untuk memberi label beberapa ratus sampel menggunakan pendekatan ini. Hal ini pun juga belum bisa terjamin tingkat akurasinya, terutama ketika menghadapi tugas pelabelan khusus berskala besar.

Bussler menyatakan bahwa cara terbaik untuk menskalakan pelabelan data dalam jumlah besar dan mampu bersaing dengan penyedia lain adalah dengan memadukan pembelajaran mesin dan keahlian manusia. “Perusahaan seperti Toloka, Appen, dan lainnya menggunakan AI untuk mencocokkan orang yang tepat dengan tugas yang tepat, sehingga para ahli melakukan pekerjaan yang hanya bisa mereka lakukan,” katanya.

Cara ini akan meningkatkan upaya pelabelan untuk data yang lebih akurat, kata Bussler. Selanjutnya, AI dapat menimbang jawaban dari responden yang berbeda sesuai dengan kualitas tanggapan. Ini memastikan bahwa setiap label memiliki peluang akurasi yang lebih tinggi.

Bussler menyampaikan bahwa data berlabel memicu revolusi AI baru. “Dengan menggabungkan AI dengan penilaian manusia, perusahaan dapat membuat model data yang akurat. Model-model ini kemudian dapat digunakan untuk membuat keputusan yang lebih baik yang memiliki dampak terukur pada bisnis,” katanya.

Aplikasi yang menggunakan pelabelan data

Bussler berpendapat, pelabelan data sangat penting untuk aplikasi pencarian, visi komputer, asisten suara, moderasi konten, dan banyak lagi. Pencarian adalah salah satu kasus penggunaan AI besar pertama yang mengandalkan penilaian manusia untuk menentukan relevansi. Dengan data berlabel, pencarian bisa sangat akurat.

Pada sektor perawatan kesehatan, AI dapat membantu mendiagnosis kondisi kulit dan retinopati diabetik, meningkatkan tingkat ingatan untuk tinjauan kepatuhan pengobatan, dan menganalisis laporan ahli radiologi untuk mendeteksi kondisi mata seperti glaukoma.

“Moderasi konten juga mengalami kemajuan signifikan berkat AI yang diterapkan pada sejumlah besar data berlabel. Hal ini terutama berlaku untuk topik sensitif, seperti kekerasan atau ancaman kekerasan. Misalnya, AI dengan data berlabel akan mampu membedakan postingan Youtube tentang ancaman bunuh diri dengan video informasi mengenai bunuh diri,” kata Bussler.

Penggunaan AI penting lainnya, ucap Bussler, adalah untuk pelabelan data dalam memahami suara dengan aksen atau nada apa pun, seperti asisten suara Alexa atau Siri. Ini membutuhkan pelatihan algoritme untuk mengenali pola bicara pria dan wanita berdasarkan volume besar audio berlabel.

Fortune Indonesia Summit

Fortune 40 Under 40

Fortune Indonesia 100

Magazine

Investor's Guide 2025

Edisi Januari 2025

Change the World 2024

Edisi Desember 2024

The Art of M&A

Edisi November 2024

Businessperson of the Year 2024

Edisi Oktober 2024

Turning Headwinds Into Tailwinds

Edisi September 2024

Indonesia's Biggest Companies

Edisi Agustus 2024

Human-AI Collaboration

Edisi Juli 2024

The Local Champions

Edisi Juni 2024

NEWS WTO Buktikan Uni Eropa Diskriminasi Minyak Sawit Indonesia

17 January 2025

MARKET Daftar 10 Saham Blue Chip 2025 Terbaru

17 January 2025

BUSINESS Selain Bukalapak, Ini 7 e-Commerce yang Tutup di Indonesia

17 January 2025

NEWS Israel Serang Gaza Usai Sepakat Gencatan Senjata, 101 Warga Tewas

18 January 2025

MARKET Suspensi Saham RATU Resmi Dicabut, Jadi Top Gainers

17 January 2025

MARKET Mengapa Nilai Tukar Rupiah Bisa Naik dan Turun? Ini Penyebabnya

18 January 2025