Mereka sedang membuat aplikasi yang mengubah aksen

Bagi mereka, itu tidak masuk akal. Dia fasih berbahasa Inggris dan Spanyol, sangat ramah dan ahli dalam rekayasa sistem. Mengapa dia tidak bisa menahan pekerjaan call center?

Aksennya, kata teman itu, membuat banyak pelanggan sulit memahaminya; beberapa bahkan melontarkan hinaan karena caranya berbicara.

Ketiga siswa tersebut menyadari masalahnya lebih besar dari pengalaman temannya. Maka mereka mendirikan sebuah startup untuk mengatasinya.

Sekarang perusahaan mereka, Sanas, sedang menguji perangkat lunak bertenaga kecerdasan buatan yang bertujuan untuk menghilangkan miskomunikasi dengan mengubah aksen orang secara real time. Seorang pekerja call center di Filipina, misalnya, dapat berbicara secara normal melalui mikrofon dan akhirnya terdengar lebih seperti seseorang dari Kansas kepada pelanggan di ujung sana.

Call center, kata pendiri startup, hanyalah permulaan. Situs web perusahaan memuji rencananya sebagai “Speech, Reimagined.”

Akhirnya, mereka berharap aplikasi yang mereka kembangkan akan digunakan oleh berbagai industri dan individu. Itu bisa membantu dokter lebih memahami pasien, kata mereka, atau membantu cucu lebih memahami kakek-nenek mereka.

“Kami memiliki visi yang sangat besar untuk Sanas,” kata CEO Maxim Serebryakov.

Dan untuk Serebryakov dan rekan pendirinya, proyek ini bersifat pribadi.

‘Suara orang tidak didengar sebanyak aksen mereka’

Trio yang mendirikan Sanas bertemu di Universitas Stanford, tetapi mereka semua berasal dari negara yang berbeda — Serebryakov, sekarang CEO, berasal dari Rusia; Andrés Pérez Soderi, sekarang direktur keuangan, berasal dari Venezuela; dan Shawn Zhang, sekarang chief technology officer, berasal dari China.

Mereka bukan lagi mahasiswa Stanford. Serebryakov dan Pérez telah lulus; Zhang keluar untuk fokus menghidupkan Sanas.

Mereka meluncurkan perusahaan tahun lalu, dan memberinya nama yang dapat dengan mudah diucapkan dalam berbagai bahasa “untuk menyoroti misi global kami dan ingin mendekatkan orang,” kata Pérez.

Selama bertahun-tahun, ketiganya mengatakan bahwa mereka telah mengalami bagaimana aksen bisa menghalangi.

“Kami semua berasal dari latar belakang internasional. Kami telah melihat secara langsung bagaimana orang memperlakukan Anda secara berbeda hanya karena cara Anda berbicara,” kata Serebryakov. “Terkadang itu memilukan.”

Zhang mengatakan ibunya, yang datang ke Amerika Serikat lebih dari 20 tahun yang lalu dari China, masih menyuruhnya berbicara dengan kasir ketika mereka pergi berbelanja bersama karena dia malu.

“Itulah salah satu alasan saya bergabung dengan Max dan Andrés dalam membangun perusahaan ini, mencoba membantu orang-orang yang merasa suaranya tidak didengar sebanyak aksen mereka,” katanya.

Serebryakov mengatakan dia melihat bagaimana orang tuanya diperlakukan di hotel ketika mereka datang mengunjunginya di Amerika Serikat — bagaimana orang membuat asumsi ketika mereka mendengar aksen mereka.

“Mereka berbicara sedikit lebih keras. Mereka mengubah perilaku mereka,” katanya.

Pérez mengatakan bahwa setelah menghadiri sekolah di Inggris, pada awalnya dia berjuang untuk memahami aksen Amerika ketika dia tiba di Amerika Serikat.

Dan jangan biarkan dia memulai tentang apa yang terjadi ketika ayahnya mencoba menggunakan Amazon Alexa yang diberikan keluarganya untuk Natal.

“Kami segera mengetahui, ketika Alexa menyalakan lampu di tempat-tempat acak di rumah dan menjadikannya merah muda, bahwa Alexa sama sekali tidak mengerti aksen ayah saya,” kata Pérez.

Pusat panggilan sedang menguji teknologi

bahasa Inggris adalah tdia bahasa yang paling banyak digunakan di dunia. Diperkirakan 1,5 miliar orang berbicara itu — dan kebanyakan dari mereka bukan penutur asli. Di Amerika Serikat saja, jutaan orang berbicara bahasa Inggris sebagai bahasa kedua.

Itu menciptakan pasar yang berkembang untuk aplikasi yang membantu pengguna melatih pengucapan bahasa Inggris mereka. Tapi Sanas menggunakan AI untuk mengambil pendekatan yang berbeda.

Premis: bahwa alih-alih belajar mengucapkan kata-kata secara berbeda, teknologi dapat melakukannya untuk Anda. Tidak ada lagi kebutuhan untuk pelatihan pengurangan aksen yang mahal atau memakan waktu. Dan pemahaman akan hampir seketika.

Serebryakov mengatakan dia tahu aksen dan identitas orang dapat dikaitkan erat, dan dia menekankan bahwa perusahaan tidak mencoba untuk menghapus aksen, atau menyiratkan bahwa satu cara berbicara lebih baik daripada yang lain.

“Kami mengizinkan orang untuk tidak harus mengubah cara mereka berbicara untuk memegang posisi, untuk memegang pekerjaan. Identitas dan aksen sangat penting. Mereka saling terkait,” katanya. “Anda tidak pernah ingin seseorang mengubah aksen mereka hanya untuk memuaskan seseorang.”

Saat ini algoritme Sanas dapat mengonversi bahasa Inggris ke dan dari aksen Amerika, Australia, Inggris, Filipina, India, dan Spanyol, dan tim berencana untuk menambahkan lebih banyak lagi. Mereka dapat menambahkan aksen baru ke sistem dengan melatih jaringan saraf dengan rekaman audio dari aktor profesional dan data lainnya — sebuah proses yang memakan waktu beberapa minggu.

Tim Sanas memainkan dua demonstrasi untuk CNN. Dalam satu, seorang pria dengan aksen India terdengar membaca serangkaian kalimat sastra. Kemudian frasa yang sama diubah menjadi aksen Amerika:

Contoh lain menampilkan frasa yang mungkin lebih umum dalam pengaturan pusat panggilan, seperti “jika Anda memberi saya nama lengkap dan nomor pesanan Anda, kami dapat melanjutkan dan mulai membuat koreksi untuk Anda.”

Hasil beraksen Amerika terdengar agak artifisial dan kaku, seperti suara asisten virtual seperti Siri dan Alexa, tetapi Pérez mengatakan tim sedang berupaya meningkatkan teknologi.

“Aksennya berubah, tapi intonasinya tetap terjaga,” katanya. “Kami terus bekerja untuk membuat hasilnya sealami dan semenarik mungkin.”

Umpan balik awal dari pusat panggilan yang telah mencoba teknologi itu positif, kata Pérez. Jadi, mintalah komentar yang dikirimkan di situs web mereka saat berita menyebar tentang usaha mereka.

Bagaimana para pendiri startup melihat masa depannya

Itu memungkinkan Sanas untuk mengembangkan stafnya. Sebagian besar karyawan perusahaan yang berbasis di Palo Alto, California ini berasal dari latar belakang internasional. Dan itu bukan kebetulan, kata Serebryakov.

“Apa yang kami bangun telah beresonasi dengan begitu banyak orang, bahkan orang-orang yang kami pekerjakan. … Sangat menarik untuk dilihat,” katanya.

Sementara perusahaan berkembang, mungkin masih perlu beberapa saat sebelum Sanas muncul di toko aplikasi atau muncul di ponsel di dekat Anda.

Tim mengatakan mereka bekerja dengan perusahaan outsourcing pusat panggilan yang lebih besar untuk saat ini dan memilih peluncuran yang lebih lambat untuk pengguna individu sehingga mereka dapat menyempurnakan teknologi dan memastikan keamanan.

Tangkapan layar ini menunjukkan apa yang dilihat pengguna di aplikasi desktop Sanas.

Namun pada akhirnya, mereka berharap Sanas bisa digunakan oleh siapa saja yang membutuhkan — di bidang lain juga.

Pérez membayangkannya memainkan peran penting membantu orang berkomunikasi dengan dokter mereka.

“Setiap detik yang hilang karena kesalahpahaman karena waktu yang hilang atau pesan yang salah berpotensi sangat, sangat berdampak,” katanya. “Kami benar-benar ingin memastikan bahwa tidak ada yang hilang dalam terjemahan.”

Suatu hari nanti, katanya, itu juga bisa membantu orang belajar bahasa, meningkatkan sulih suara di film dan membantu speaker pintar di rumah dan asisten suara di mobil memahami aksen yang berbeda.

Dan tidak hanya dalam bahasa Inggris — tim Sanas juga berharap dapat menambahkan bahasa lain ke dalam algoritme.

Ketiga co-founder masih mengerjakan detailnya. Tapi bagaimana teknologi ini bisa membuat komunikasi lebih baik di masa depan, kata mereka, adalah satu hal yang mudah dimengerti.

We will be happy to hear your thoughts

Leave a reply

DETEKSIMALUT.COM PARTICIPE AU PROGRAMME ASSOCIÉ D'AMAZON SERVICES LLC, UN PROGRAMME DE PUBLICITÉ AFFILIÉ CONÇU POUR FOURNIR AUX SITES UN MOYEN POUR GAGNER DES FRAIS DE PUBLICITÉ DANS ET EN RELATION AVEC AMAZON.IT. AMAZON, LE LOGO AMAZON, AMAZONSUPPLY ET LE LOGO AMAZONSUPPLY SONT DES MARQUES COMMERCIALES D'AMAZON.IT, INC. OU SES FILIALES. EN TANT QU'ASSOCIÉ D'AMAZON, NOUS OBTENONS DES COMMISSIONS D'AFFILIATION SUR LES ACHATS ÉLIGIBLES. MERCI AMAZON DE NOUS AIDER À PAYER LES FRAIS DE NOTRE SITE ! TOUTES LES IMAGES DE PRODUITS SONT LA PROPRIÉTÉ D'AMAZON.IT ET DE SES VENDEURS.
Deteksimalut