Czy teraz można generować mowę za pomocą swojego głosu w 30 językach dzięki AI?

23 sierpnia, 2023
10:22 pm

CryptoView.io APP

Rentgen rynków kryptowalut

Jako, że świat sztucznej inteligencji (AI) rozwija się w zawrotnym tempie, firma ElevenLabs z San Francisco ogłosiła przełomową nowinę. Opracowali oni nowy model AI, który może generować mowę za pomocą Twojego głosu w 30 językach, co stanowi znaczny skok z pierwotnych ośmiu. Ten postęp ma na celu rewolucję w dziedzinie klonowania głosu i wielojęzycznej komunikacji.

Przejście na wielojęzyczność

ElevenLabs wykorzystało Lukeman Literary, agencję literacką i niezależnego wydawcę, jako studium przypadku, aby zademonstrować skuteczność swojej technologii. Lukeman produkuje wiele wielojęzycznych audiobooków rocznie, proces, który kiedyś trwał tygodnie ze względu na konieczność znalezienia odpowiedniego lektora, zarezerwowania studia nagraniowego i zarządzania postprodukcją. Teraz, dzięki modelowi AI firmy ElevenLabs, cały proces można zakończyć w ciągu kilku godzin.

Nowy model Multilingual v2 może dostarczać dźwięki bogate w emocje i przechwytujące subtelne intonacje naturalnej mowy. Użytkownicy mogą wpisać tekst, który chcą usłyszeć w wybranym języku, a AI wygeneruje płynny voiceover.

Opcje klonowania głosu

ElevenLabs oferuje dwa podstawowe narzędzia do klonowania głosu: narzędzie do przekształcania tekstu na mowę i „VoiceLab” do klonowania konkretnych głosów. Użytkownicy mogą przesyłać próbki mowy, aby stworzyć niestandardowy klon głosu, który jest analizowany przez AI w celu skonstruowania syntetycznej wersji. Ten sklonowany głos może następnie zostać zmodyfikowany tak, aby mówił cokolwiek. Najnowsza aktualizacja umożliwia tym klonom AI płynne mówienie w językach takich jak szwedzki, arabski i malajski.

Adresowanie obaw etycznych

Pomimo potencjalnych korzyści, istnieją obawy dotyczące nadużywania tej technologii. Deepfake audio może sprawić, że użytkownicy staną się podatni na oszustwa i kampanie dezinformacyjne. ElevenLabs doświadczył krytyki w zeszłym roku, kiedy na ich platformie wykorzystano podszywanie się i nękanie osobistości publicznych. Firma wprowadziła od tamtej pory bardziej rygorystyczne zabezpieczenia, ale obawy etyczne wciąż pozostają.

Podobną krytykę spotkały również duże firmy technologiczne, takie jak Meta, za rozwijanie potężnej generatywnej AI bez pełnej przejrzystości. Meta niedawno ujawniła narzędzie do syntez mowy AI o nazwie Voicebox, przyznając, że może ono łatwo ułatwiać tworzenie deepfake’ów. Jednak Meta powstrzymała się od jakiejkolwiek publicznej premiery ze względu na „ryzyko nadużycia”.

Pomimo tych obaw, szybki postęp w klonowaniu głosu AI wydaje się być niepowstrzymany. Jak powiedział językoznawca Mati Staniszewski z ElevenLabs: „Ostatecznie mamy nadzieję, że dzięki pomocy AI będziemy mogli obejmować jeszcze więcej języków i głosów, eliminując bariery językowe w dostępie do treści.”

Wyzwaniem jest zapewnienie etycznego wdrożenia. Granica między globalną dezinformacją a innowacyjnymi sposobami komunikacji jest bardzo cienka, dlatego ostrożność jest kluczowa.

W ciągle zmieniającym się świecie kryptowalut i AI, platformy takie jak cryptoview.io odgrywają istotną rolę w dostarczaniu aktualnych i istotnych informacji. Bądź na bieżąco z wiadomościami i aktualizacjami dotyczącymi kryptowalut dzięki cryptoview.io.

Dowiedz się więcej na temat Cryptoview.io

CryptoView.io

Czy teraz można generować mowę za pomocą swojego głosu w 30 językach dzięki AI?

CryptoView.io APP

Przejście na wielojęzyczność

Opcje klonowania głosu

Adresowanie obaw etycznych

Kontroluj RSI wszystkich rynków krypto

RSI Weather

Co Napędza Wzrost Zysku XRP w Sieci Flare?

Czy Ripple na Nowo Definiuje Płatności Transgraniczne Jak SWIFT?

Czy zwrot Trumpa w stronę kryptowalut to tarcza przed „piramidą finansową” bankowości?

Usługi

CryptoView.io

Obserwuj nas