AI dapat membuat gambar berdasarkan teks prompt karena telah dilatih dengan dataset besar yang terdiri dari gambar dan deskripsi. Dengan menggunakan teknik Deep Learning, AI dapat mempelajari keterkaitan antara gambar dan deskripsinya, dan kemudian menciptakan gambar baru berdasarkan teks yang diberikan.
Berikut adalah alur tahapan umum yang digunakan oleh AI untuk membuat gambar berdasarkan teks prompt:
Pelatihan Model AI
Model AI dilatih menggunakan dataset yang berisi gambar dan deskripsi. Selama pelatihan, model mempelajari keterkaitan antara gambar dan deskripsi tersebut sehingga dapat menghasilkan gambar yang sesuai dengan deskripsi.
Preprocessing AI
Sebelum membuat gambar baru, teks prompt harus diproses terlebih dahulu untuk dikonversi menjadi representasi vektor yang dapat dimengerti oleh model AI. Proses ini melibatkan penghapusan kata-kata yang tidak relevan, penghilangan tanda baca, dan konversi kata-kata menjadi vektor numerik.
Generasi Gambar
Setelah teks prompt diproses, akan melakukan generasi gambar baru berdasarkan representasi vektor teks tersebut. Proses ini melibatkan penggunaan algoritma yang kompleks untuk menciptakan gambar yang memenuhi kriteria tertentu yang dijelaskan dalam teks prompt.
Evaluasi Hasil AI
Hasilnya dievaluasi untuk memastikan bahwa gambar yang dihasilkan sesuai dengan deskripsi teks prompt. Jika hasilnya tidak memenuhi kriteria, model AI akan disesuaikan dan dilatih kembali dengan dataset yang lebih besar dan diversifikasi.
Dengan kombinasi dari teknik Deep Learning dan dataset yang besar dan representatif, AI dapat menghasilkan gambar-gambar baru yang sesuai dengan deskripsi teks prompt. Namun, meskipun dapat membuat gambar yang hampir mirip dengan realitas, tetapi tidak selalu sempurna dan masih memerlukan penilaian manusia untuk menentukan kebenaran dan kualitasnya.
Data Sample
AI membutuhkan dataset sebagai sumber data untuk melakukan pelatihan. Dataset tersebut biasanya dikumpulkan dari berbagai sumber, seperti internet, basis data publik, dan sumber-sumber internal perusahaan atau organisasi.
Contohnya, jika ingin dilatih untuk memahami gambar dan deskripsinya, maka dataset dapat terdiri dari gambar yang diambil dari internet beserta dengan deskripsi yang relevan dengan gambar tersebut. Atau jika ingin dilatih untuk menjawab pertanyaan, dataset dapat terdiri dari pasangan pertanyaan dan jawaban yang telah dikumpulkan dari berbagai sumber.
Pengumpulan dataset harus dilakukan dengan hati-hati agar dataset tersebut tidak mengandung bias atau kesalahan data yang dapat mempengaruhi hasil pelatihan dan kinerja model. Oleh karena itu, pemilihan dataset merupakan aspek yang sangat penting dalam pengembangan AI.
Waktu yang dibutuhkan
Waktu yang dibutuhkan dalam pelatihan model AI sangat bervariasi dan tergantung pada beberapa faktor, seperti jumlah data dalam dataset, kompleksitas model, kecepatan komputer yang digunakan, serta metode pelatihan yang digunakan.
Pada umumnya, pelatihan model membutuhkan waktu yang sangat lama, biasanya berhari-hari, bahkan berminggu-minggu atau bahkan berbulan-bulan. Namun, waktu yang dibutuhkan juga dapat dipangkas dengan menggunakan teknik-teknik seperti transfer learning, pemrosesan paralel, dan penggunaan hardware khusus seperti GPU.
Setelah model AI dilatih, waktu yang dibutuhkan untuk menghasilkan gambar baru dari teks prompt umumnya relatif singkat, tergantung pada kompleksitas model dan panjang teks prompt tersebut. Pada beberapa kasus, dapat menghasilkan gambar dalam hitungan detik setelah menerima teks prompt.
Contoh prompt yang membutuhkan waktu lama untuk menghasilkan gambar adalah prompt yang sangat spesifik atau kompleks. Misalnya, jika promptnya adalah “Gambar kartun seekor anjing berbulu cokelat sedang berlari di atas rumput hijau di tengah kota besar yang sibuk dengan bangunan tinggi dan lalu lintas yang padat”, AI memerlukan waktu yang lebih lama untuk menghasilkan gambar yang mencerminkan deskripsi ini karena ada banyak detail yang harus diambil kira.
Sementara itu, contoh prompt yang relatif singkat dan mudah dipahami oleh AI dapat menghasilkan gambar dengan cepat. Contohnya, prompt yang mengatakan “Gambar seekor anjing labrador hitam”, AI dapat menghasilkan gambar tersebut dalam waktu yang relatif singkat karena deskripsinya sangat spesifik dan tidak terlalu kompleks.