Google ciptakan AI revolusioner: obrolan cerdas dengan lumba-lumba!

Google baru saja meluncurkan DolphinGemma, sebuah model AI terbaru yang dirancang untuk membantu para ilmuwan memahami komunikasi lumba-lumba. Model bahasa besar ini merupakan hasil kolaborasi Google dengan peneliti dari Georgia Tech dan Wild Dolphin Project (WDP).

Memecahkan Kode Komunikasi Lumba-Lumba dengan DolphinGemma

DolphinGemma memanfaatkan dataset suara lumba-lumba yang luas dari WDP, yang telah bertahun-tahun meneliti perilaku dan komunikasi lumba-lumba totol Atlantik. Data ini memberikan kesempatan unik untuk melatih model AI yang canggih.

Bacaan Lainnya

Model ini menggunakan tokenizer SoundStream milik Google untuk memecah vokalisasi lumba-lumba menjadi unit audio yang lebih mudah diproses. Kemudian, arsitektur model khusus memproses urutan suara kompleks tersebut.

Arsitektur Model yang Ringan dan Efisien

DolphinGemma terdiri dari sekitar 400 juta parameter, membuatnya cukup ringan untuk dijalankan di ponsel Pixel. Hal ini memungkinkan para peneliti WDP untuk menggunakannya langsung di lapangan.

Berbeda dengan model pembelajaran mesin tradisional, DolphinGemma berbasis audio-in dan audio-out. Ini berarti model memproses dan memprediksi suara lumba-lumba tanpa mengandalkan teks atau gambar.

Cara Kerja DolphinGemma dalam Mempelajari Suara Lumba-Lumba

DolphinGemma memproses urutan vokalisasi lumba-lumba alami, meniru cara model bahasa besar memahami ucapan manusia. Model kemudian memprediksi suara yang paling mungkin terjadi selanjutnya dalam suatu urutan.

Dr. Denise Herzing, pendiri WDP, membandingkan DolphinGemma dengan fitur pelengkapan otomatis, tetapi untuk suara lumba-lumba. Sistem ini dilatih untuk mengidentifikasi pola dan struktur suara, mirip seperti model teks memprediksi kata berikutnya dalam kalimat.

Integrasi dengan Teknologi CHAT dan Perangkat Keras

Sebelum DolphinGemma, WDP menggunakan sistem CHAT (Cetacean Hearing Augmentation Telemetry) untuk mencoba berkomunikasi dengan lumba-lumba. CHAT bertujuan membangun kosakata sederhana untuk interaksi, bukan memecahkan kompleksitas bahasa lumba-lumba sepenuhnya.

CHAT mengasosiasikan peluit sintetis dengan objek tertentu yang disukai lumba-lumba. Dengan pengulangan, diharapkan lumba-lumba akan meniru peluit untuk meminta objek tersebut.

Pemanfaatan Google Pixel dalam Penelitian

CHAT dijalankan menggunakan Google Pixel 6, yang memungkinkan analisis audio berkualitas tinggi secara real-time. Penggunaan ponsel umum ini membuat peralatan lebih terjangkau dan mudah dirawat di lingkungan laut.

Untuk musim penelitian mendatang, tim akan menggunakan Pixel 9 yang memiliki kemampuan speaker dan mikrofon yang lebih baik. Ponsel ini juga memiliki daya yang cukup untuk menjalankan model pembelajaran mendalam dan pencocokan pola secara bersamaan.

Masa Depan DolphinGemma: Kolaborasi Terbuka dan Pengembangan Lebih Lanjut

Google berencana untuk merilis DolphinGemma sebagai model terbuka pada musim panas ini. Hal ini diharapkan dapat membantu para peneliti di seluruh dunia untuk menganalisis dataset akustik mereka sendiri.

DolphinGemma merupakan bagian dari keluarga model bahasa besar ringan Gemma, yang terbaru adalah Gemma 3 dengan berbagai ukuran parameter. Model ini menjanjikan kemajuan signifikan dalam memahami komunikasi lumba-lumba dan perilaku mamalia laut lainnya.

Dengan akses terbuka terhadap DolphinGemma, penelitian mengenai komunikasi lumba-lumba diharapkan akan semakin berkembang pesat. Pengetahuan yang lebih dalam tentang komunikasi lumba-lumba dapat memberikan wawasan penting bagi konservasi dan pemahaman kita tentang kehidupan laut. Kolaborasi internasional melalui platform terbuka ini berpotensi membuka jalan bagi penemuan-penemuan baru yang menakjubkan di masa depan.

Pos terkait

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *