Setiap suara menyimpan rahasia. Sebuah perusahaan di Israel menggunakan analisis suara real-time selama melakukan panggilan untuk menilai apakah seseorang cenderung gagal bayar terkait pinjaman mereka ke bank, membeli produk yang lebih mahal, atau menjadi calon pelamar terbaik untuk sebuah pekerjaan.
Dalam beberapa tahun terakhir, para peneliti dan startup telah mencatat banyak sekali informasi yang dapat ditambang dari suara, terutama karena popularitas asisten rumah seperti Amazon Alexa yang telah membuat konsumen semakin nyaman berbicara dengan perangkat mereka.
Pasar teknologi suara sedang tumbuh dan diperkirakan akan mencapai $15,5 miliar pada tahun 2029, menurut sebuah laporan oleh perusahaan analisis bisnis IdTechEx. Satrajit Ghosh, seorang ilmuwan riset di MIT's McGovern Center for Brain Research menyatakan saat ini hampir semua orang berbicara dan ada banyak perangkat yang menangkap suara, baik itu smartphone, Amazon Alexa dan Google Home.
Meskipun jumlahnya berlimpah, setiap suara sifatnya personal, sulit untuk dipalsukan. Saat ini, orang sudah banyak sadar bahwa tweet dan unggahan Instagram mereka akan dipantau, tetapi lebih sedikit yang memikirkan suara mereka sebagai bentuk data lain yang dapat memberi tahu tentang siapa diri mereka dan memberikannya (data) kepada orang lain.
Baca Juga: Seperti Apa Kesiapan Praktisi PR pada Era Artificial Intelligence?
Kunci analisis suara bukanlah pada apa yang seseorang katakan, tapi bagaimana mereka mengatakannya: nada, kecepatan, penekanan, jeda. Ini semua bisa dianalisa oleh mesin yang belajar.
Ambil contoh ada dua kelompok, orang yang penuh kecemasan dan orang yang tenang, masukkan data itu ke suatu algoritma. Algoritma kemudian belajar untuk mengambil tanda-tanda untukmengindikasikan apakah seseorang itu adalah bagian dari Grup A atau Grup B. Ini sudah pernah dilakukan oleh Louis-Philippe Morency, seorang ilmuwan komputer di Carnegie Mellon University yang membuat program SimSensei untuk mendeteksi tingkat depresi seseorang menggunakan suara.
Morency menemukan bahwa orang-orang dengan suara lembut, mendesah, bukan orang-orang dengan suara tegang atau marah, lebih mungkin untuk mencoba kembali, katanya. Namun penelitian ini masih sangat tahap awal. dan penggunaan algoritma untuk mengalaisa suara makin meluas, misalnya untuk membantu mengidentifikasi segala sesuatu mulai dari penyakit Parkinson hingga gangguan stres pascatrauma.?
David Ahern, doktor yang bekerja di Digital Behavioral Health di Brigham and Women's Hospital dan juga peneliti utama pada uji klinis startup CompanionMx, sistem pemantauan kesehatan mental yang diluncurkan Desember lalu meyakni algoritma bisa menghasilkan sebuha peringatan dini terkait gangguan keseatan mental.
Baca Juga: Tembus! Jumlah Startup di Indonesia Ada 2000-an, Ini Sektor Paling Diminati
Startup lain, seperti Sonde Health dan Ellipsis Health juga melakukan hal yang sama. Pasien mereka merekam diaries audio menggunakan aplikasi. Program ini menganalisis diaries bersama dengan metadata seperti catatan panggilan dan lokasi untuk menentukan bagaimana skor pasien berdasarkan empat faktor - suasana hati yang tertekan, berkurangnya minat, penghindaran, dan kelelahan. Informasi ini, sudah dilindungi oleh undang-undang privasi federal HIPAA, dan dibagikan ke pasien dan juga disajikan di dashboard ke dokter yang ingin mengawasi bagaimana keadaan pasien mereka.
Perusahaan telah menguji produk selama tujuh tahun dan dengan lebih dari 1.500 pasien, menurut kepala eksekutif CompanionMx, Sub Datta. Produk yang keluar dari perusahaan analisis suara lain bernama Cogito, telah menerima dana dari DARPA dan National Institutes of Mental Health. Hasil yang dipublikasikan dalam Journal of Medical Internet Research menunjukkan bahwa teknologi ini dapat memprediksi gejala depresi dan PTSD, meskipun diperlukan validasi lebih lanjut.
Dalam studi percontohan, 95 persen pasien telah meninggalkan buku harian audio setidaknya sekali seminggu, dan dokter mengakses dashboard setidaknya sekali sehari, menurut Datta. Angka-angka ini menjanjikan, meskipun Ahern menunjukkan bahwa masih banyak pertanyaan tentang komponen mana yang paling bermanfaat. Apakah itu aplikasi itu sendiri? Umpan balik? Dasbor? Kombinasi itu semua??
Baca Juga: Dari BIM, AI, Hingga Big Data, Ini Peta Jalan Digitalisasi Wika
Disatu sisi, startup seperti Voicesense, CallMiner ,RankMiner, dan Cogito juga berencana menggunakan analitik suara dalam konteks bisnis. CEO Voicesense, Yoav Degani bahkan berani menjamin bahwa perusahaannya bisa menghasilkan profil kepribadian yang lengkap,mulai dari prediksi kredit macet, prediksi klaim asuransi, mengungkapkan gaya investasi pelanggan, penilaian kandidat in-house untuk SDM, menilai apakah karyawan kemungkinan akan resign.
"Akurasinya mendekati 100%. Kami dapat memberikan prediksi tentang perilaku kesehatan, perilaku kerja, hiburan, dan sebagainya," kata dia.?
Dalam satu studi kasus yang dibagikan Degani, Voicesense menguji teknologinya bersama salah satu bank besar Eropa. Bank menyediakan sampel suara dari beberapa ribu debitur. (Bank sudah tahu siapa yang telah dan belum melunasi pinjaman mereka). Voicesense lalu menjalankan algoritme pada sampel ini dan mengklasifikasikan rekaman ke dalam risiko rendah, sedang, dan tinggi.
Dalam analisisnya, 6 persen orang yang diprediksi "berisiko rendah" mengalami kegagalan oleh bank, dibandingkan dengan 27 persen kelompok Voicesense yang dianggap berisiko tinggi. Intinya, makin banyak sampel yang diuji, keakuratan analisanya makin meningkat.?
Mau Berita Terbaru Lainnya dari Warta Ekonomi? Yuk Follow Kami di Google News dengan Klik Simbol Bintang.
Penulis: Yosi Winosa
Editor: Clara Aprilia Sukandar