مع استمرار تطور عالم الذكاء الاصطناعي (AI) بمعدل تصاعدي، أعلنت شركة ElevenLabs المقرَّة في سان فرانسيسكو عن إنجاز ثوري. لقد وضعوا نموذجًا جديدًا للذكاء الاصطناعي يمكنه “توليد كلام باستخدام صوتك بـ 30 لغة”، وهو قفزة كبيرة عن الثماني الأصلية. يعتبر هذا التطور نقلة نوعية في مجالات استنساخ الصوت والاتصال متعدد اللغات.
النقلة متعددة اللغات
استخدمت ElevenLabs شركة Lukeman Literary، وهي وكالة أدبية وناشر مستقل، كدراسة حالة لتوضيح فعالية تكنولوجيتهم. تنتج Lukeman العديد من الكتب الصوتية متعددة اللغات سنويًا، وهو عمل كان يستغرق أسابيع بسبب الحاجة إلى إيجاد فنان الرئيس الصوتي المناسب، وحجز استوديو التسجيل، وإدارة ما بعد الإنتاج. الآن، بفضل نموذج الذكاء الاصطناعي لدى ElevenLabs، يمكن إكمال العملية بأكملها في مسألة من ساعات.
يمكن للنموذج الجديد للنسخة متعددة اللغات v2 تقديم صوت غني بالعاطفة ويتسم بالحنكة الدقيقة للكلام الطبيعي. يمكن للمستخدمين كتابة النص الذي يرغبون في نطقه باللغة المستهدفة، وسيقوم الذكاء الاصطناعي بتوليد تعليق صوتي سلس.
خيارات استنساخ الصوت
تقدم ElevenLabs أداة رئيسية لاستنساخ الصوت: أداة نص إلى كلام و”VoiceLab” لاستنساخ أصوات محددة. يمكن للمستخدمين تحميل عينات الكلام لإنشاء استنساخ صوتي مخصص، يقوم الذكاء الاصطناعي بتحليله لإنشاء نسخة اصطناعية. يمكن بعد ذلك تلاعب بهذا الصوت المستنسخ ليقول أي شيء ممكن تخيله. يسمح التحديث الأخير لهذه النسخ المتناسقة مع الذكاء الاصطناعي بالتحدث بطلاقة بلغات مثل السويدية والعربية والمالايو.
معالجة المخاوف الأخلاقية
على الرغم من الفوائد المحتملة، هناك مخاوف من سوء استخدام هذه التكنولوجيا. يمكن أن يجعل الصوت المزيف المتقدم المستخدمين عرضة للتزوير وحملات نشر المعلومات الخاطئة. تعرضت ElevenLabs لانتقادات في العام الماضي عندما تم استخدام منصتها لتقمص ومضايقة الشخصيات العامة. منذ ذلك الحين، قامت الشركة بتنفيذ إجراءات وقائية أكثر صرامة، ولكن المخاوف الأخلاقية ما زالت قائمة.
واجهت شركات التكنولوجيا الكبرى مثل Meta نقدًا مماثلاً لتطوير ذكاء اصطناعي توليدي قوي بدون شفافية كاملة. قدمت Meta مؤخرًا أداة توليد كلام بالذكاء الاصطناعي تسمى Voicebox، واعترفت بأنه يمكن أن يسهل بسهولة عمليات الصوت المزيف المتقدم. ومع ذلك، امتنعت Meta عن أي إصدار عام بسبب “مخاطر السوء الاستخدام”.
على الرغم من هذه المخاوف، يبدو أن التقدم السريع في استنساخ الصوت بواسطة الذكاء الاصطناعي لا يمكن إيقافه. كما صرح اللغوي Mati Staniszewski من ElevenLabs: “نأمل في نهاية المطاف أن نتمكن من تغطية المزيد من اللغات والأصوات بمساعدة الذكاء الاصطناعي والتغلب على الحواجز اللغوية في المحتوى.”
التحدي يكمن في ضمان تنفيذ أخلاقي. الخط الفاصل بين نشر المعلومات الكاذبة عالميًا وطرق الاتصال المبتكرة ضئيل جدًا، والحذر هو الأمر الرئيسي.
في عالم العملات المشفرة والذكاء الاصطناعي المتطور، تلعب منصات مثل cryptoview.io دورًا أساسيًا في توفير المعلومات الحديثة والمتعلقة. ابق على اطلاع على أخبار العملات المشفرة والتحديثات مع cryptoview.io.
اكتشف المزيد على Cryptoview.io
