▪︎ مجلس نيوز
من المساعدين الافتراضيين إلى التعليقات الصوتية للكتب الصوتية ، برز توليد الصوت بالذكاء الاصطناعي كمجال سريع النمو – ولا عجب أن تسارع الشركات للاستفادة من إمكانات التكنولوجيا.
من بينها ومقرها فالنسيا Voicemod. طورت الشركة الناشئة مغيرًا صوتيًا يعمل بالذكاء الاصطناعي وبرنامجًا لموجه الصوت يتيح التحويل الفوري للكلام إلى كلام. على عكس معظم منافسيها ، تدعي الشركة أنها تقوم بتحويل الأصوات في الوقت الفعلي وبزمن انتقال منخفض ، مما يتيح للمستخدمين التحدث كما يفعلون في الحياة الواقعية.
وفقًا لـ Jaime Bosch ، الرئيس التنفيذي والمؤسس المشارك لشركة Voicemod ، تدرب الشركة نموذج الذكاء الاصطناعي الخاص بها باستخدام مجموعات البيانات المتاحة للجمهور والجهات الفاعلة الصوتية المحترفة ، مما ينتج عنه مجموعة واسعة من التعبيرات الصوتية والنغمات والنغمات والعواطف. من خلال تقنيات التعلم الآلي ، يتعلم النموذج فهم أنماط كلام الشخص وتعقيداته وتحليلها والتنبؤ بها.
قال بوش لـ TNW: “عندما يتحدث المستخدم إلى برنامجنا أو تطبيقنا ، تتم معالجة مدخلاته الصوتية في الوقت الفعلي”. ثم يطبق نموذج الذكاء الاصطناعي الخاص بنا الأنماط والتحولات المكتسبة على المدخلات ، مما يسمح بتحويل صوتي فوري.
يستهدف Voicemod بشكل أساسي صناعة الترفيه ، بما في ذلك اللاعبين ، ومنشئو البث ، ومنشئي المحتوى ، و vtubers في منصات تتراوح من Discord و Twitch ، إلى Zoom و WhatsApp.
لمزيد من معالجة زيادة طلب المستخدم للتعبير عن الذات والأسماء المستعارة والإبداع عبر الإنترنت ، بجانب 100 خيار صوتي في محفظتها ، تطلق الشركة الناشئة الآن ما يسمى بمجموعة “AI Humans”. على الرغم من أن Voicemod يقدم بالفعل مرشحات صوتية بشرية ، إلا أنه من المقرر أن تكون المجموعة الجديدة أكثر مجموعات الشركة واقعية حتى الآن.
تم تدريب AI Humans على تسجيلات من الممثلين الصوتيين ، ويتكون من 20 صورة رمزية صوتية تتراوح في الشخصية والجنس والعمر. تشمل الشخصيات جو ، صوت ذكر يبلغ من العمر 80 عامًا “نبرة خشن ساخر” وجينيفر ، صوت أنثى يبلغ من العمر 25 عامًا ، يتميز بشخصية “حيوية وودودة”. يمكن للمستخدمين أيضًا تخصيص درجة الصوت لكل شخصية ، وتغيير تصور جنس الصوت وعمره.
يمكن أن يمنحك الفيديو أدناه فكرة عن كيفية ظهور هذه الشخصيات:
قال بوش: “توفر أصوات الذكاء الاصطناعي فرصًا مثيرة للصناعات التي تتطلع إلى تنمية الاستكشاف الإبداعي والتعبير عن الذات ، وتعزيز التخصيص ، وتعزيز الشمولية في المساحات الرقمية”.
ولكن على الرغم من التأثير الإيجابي الذي يمكن أن يحدثه توليد الصوت بالذكاء الاصطناعي ، فإن التكنولوجيا مرتبطة أيضًا بالعديد من المخاطر. بعضها يشمل سوء الاستخدام ، احتيالوانتحال الهوية وحتى سرقة الصوت، والتي تؤثر بشكل خاص على الممثلين الصوتيين المحترفين.
وفقًا لـ Bosch ، تعمل Voicemod بنشاط للتخفيف من هذه المخاطر. على سبيل المثال ، تقوم بتطوير تقنية العلامات المائية لمساعدة المنصات على تحديد وتتبع الأصوات التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، بينما نفذت تدابير لحماية الملكية الفكرية لممثلي الصوت الذين تعمل معهم.
يعتقد بوش أن الذكاء الاصطناعي سيصبح “أداة” لهؤلاء المحترفين. وقال لـ TNW: “هناك شيء ربما يكون مفقودًا في هذه المناقشات هو أنه وراء كل استخدام للذكاء الاصطناعي الصوتي في الوقت الفعلي ، فإن حالة الاستخدام التي يستهدفها Voicemod ، هو إنسان يقود الذكاء الاصطناعي بشكل فعال”.
يحسب Voicemod بالفعل أكثر من 40 مليون تنزيل لسطح المكتب. في المستقبل ، يخطط لإطلاقه على الهاتف المحمول أيضًا ، والوصول إلى ملايين المستخدمين النشطين شهريًا. إنها تعمل أيضًا على شراكات B2B مع شركات الألعاب ومنصات سماعات الرأس VR.
البرنامج متاح مجانًا ، مع خيار إصدار PRO مدفوع يفتح الميزات والمحتوى الإضافي.