Jako, że świat sztucznej inteligencji (AI) rozwija się w zawrotnym tempie, firma ElevenLabs z San Francisco ogłosiła przełomową nowinę. Opracowali oni nowy model AI, który może generować mowę za pomocą Twojego głosu w 30 językach, co stanowi znaczny skok z pierwotnych ośmiu. Ten postęp ma na celu rewolucję w dziedzinie klonowania głosu i wielojęzycznej komunikacji.
Przejście na wielojęzyczność
ElevenLabs wykorzystało Lukeman Literary, agencję literacką i niezależnego wydawcę, jako studium przypadku, aby zademonstrować skuteczność swojej technologii. Lukeman produkuje wiele wielojęzycznych audiobooków rocznie, proces, który kiedyś trwał tygodnie ze względu na konieczność znalezienia odpowiedniego lektora, zarezerwowania studia nagraniowego i zarządzania postprodukcją. Teraz, dzięki modelowi AI firmy ElevenLabs, cały proces można zakończyć w ciągu kilku godzin.
Nowy model Multilingual v2 może dostarczać dźwięki bogate w emocje i przechwytujące subtelne intonacje naturalnej mowy. Użytkownicy mogą wpisać tekst, który chcą usłyszeć w wybranym języku, a AI wygeneruje płynny voiceover.
Opcje klonowania głosu
ElevenLabs oferuje dwa podstawowe narzędzia do klonowania głosu: narzędzie do przekształcania tekstu na mowę i „VoiceLab” do klonowania konkretnych głosów. Użytkownicy mogą przesyłać próbki mowy, aby stworzyć niestandardowy klon głosu, który jest analizowany przez AI w celu skonstruowania syntetycznej wersji. Ten sklonowany głos może następnie zostać zmodyfikowany tak, aby mówił cokolwiek. Najnowsza aktualizacja umożliwia tym klonom AI płynne mówienie w językach takich jak szwedzki, arabski i malajski.
Adresowanie obaw etycznych
Pomimo potencjalnych korzyści, istnieją obawy dotyczące nadużywania tej technologii. Deepfake audio może sprawić, że użytkownicy staną się podatni na oszustwa i kampanie dezinformacyjne. ElevenLabs doświadczył krytyki w zeszłym roku, kiedy na ich platformie wykorzystano podszywanie się i nękanie osobistości publicznych. Firma wprowadziła od tamtej pory bardziej rygorystyczne zabezpieczenia, ale obawy etyczne wciąż pozostają.
Podobną krytykę spotkały również duże firmy technologiczne, takie jak Meta, za rozwijanie potężnej generatywnej AI bez pełnej przejrzystości. Meta niedawno ujawniła narzędzie do syntez mowy AI o nazwie Voicebox, przyznając, że może ono łatwo ułatwiać tworzenie deepfake’ów. Jednak Meta powstrzymała się od jakiejkolwiek publicznej premiery ze względu na „ryzyko nadużycia”.
Pomimo tych obaw, szybki postęp w klonowaniu głosu AI wydaje się być niepowstrzymany. Jak powiedział językoznawca Mati Staniszewski z ElevenLabs: „Ostatecznie mamy nadzieję, że dzięki pomocy AI będziemy mogli obejmować jeszcze więcej języków i głosów, eliminując bariery językowe w dostępie do treści.”
Wyzwaniem jest zapewnienie etycznego wdrożenia. Granica między globalną dezinformacją a innowacyjnymi sposobami komunikacji jest bardzo cienka, dlatego ostrożność jest kluczowa.
W ciągle zmieniającym się świecie kryptowalut i AI, platformy takie jak cryptoview.io odgrywają istotną rolę w dostarczaniu aktualnych i istotnych informacji. Bądź na bieżąco z wiadomościami i aktualizacjami dotyczącymi kryptowalut dzięki cryptoview.io.
Dowiedz się więcej na temat Cryptoview.io
