Kenapa data itu penting banget dalam AI?
AI = Otak,
Data = Makanannya.
Tanpa data, AI nggak bisa belajar apa-apa.
Bayangkan kamu ingin ajari anak kecil tentang hewan.
Kamu tunjukkan 100 gambar kucing dan bilang: “Ini kucing.”
Lalu tunjukkan 100 gambar anjing dan bilang: “Ini anjing.”
Baru deh dia mulai bisa bedain mana kucing, mana anjing.
AI juga sama. Dia butuh banyak contoh (data) untuk belajar.
Jenis Data dalam AI:
- Data Tersusun (Structured Data)
→ Bentuknya tabel, seperti Excel
→ Contoh: umur, tinggi, berat, nilai, status - Data Tak Tersusun (Unstructured Data)
→ Bentuknya bebas: gambar, teks, video, suara
→ Contoh: foto, artikel berita, suara rekaman, chat - Data Setengah Tersusun (Semi-structured)
→ Contoh: data JSON, XML, log aktivitas
Apa itu Labeling?
Labeling artinya memberi penjelasan pada data.
Misalnya:
- Gambar ini → diberi label: “kucing”
- Kalimat ini → diberi label: “positif” (dalam analisis sentimen)
- Suara ini → diberi label: “kata: buka pintu”
Label ini sangat penting supaya AI tahu apa yang sedang dipelajari.
Ini dipakai terutama di Supervised Learning.
Contoh:
Kamu mau bikin AI mengenali buah.
Gambar | Label |
---|---|
🍎 | apel |
🍊 | jeruk |
🍌 | pisang |
Semakin banyak contoh, semakin akurat hasil belajar AI-nya.
Masalah jika datanya jelek:
- Data tidak cukup → AI jadi bingung
- Data tidak lengkap → hasilnya meleset
- Data berlabel salah → AI belajar hal yang salah
- Data berat sebelah → AI jadi bias (misalnya, cuma belajar dari data orang dewasa, padahal targetnya anak-anak)
Kesimpulan:
Data = bahan bakar AI.
Tanpa data yang cukup, bersih, dan tepat label, AI nggak akan bisa kerja dengan baik.
Bahkan model AI tercanggih pun akan gagal total kalau datanya buruk.
Leave a Reply