OpenAI تطلق تقنية استنساخ صوت جديدة.. كل ما تحتاج معرفته عنها
مي كمال الدين
أعلنت شركة OpenAI أنها أجرت مؤخرًا معاينة على نطاق صغير لأداة جديدة تسمى Voice Engine، وهي تقنية استنساخ صوت يمكنها تقليد أي متحدث من خلال تحليل عينة صوتية مدتها 15 ثانية، والتي تقول الشركة إنها تنتج “كلامًا طبيعيًا” مع مشاعر عاطفية وعاطفية. أصوات واقعية.
تعتمد هذه التقنية على واجهة برمجة تطبيقات تحويل النص إلى كلام الموجودة مسبقًا للشركة، والتي تعمل منذ عام 2022، وتستخدم OpenAI بالفعل إصدارًا من مجموعة الأدوات لتشغيل الأصوات المعدة مسبقًا والمتوفرة حاليًا في تحويل النص إلى كلام، مثل واجهة برمجة التطبيقات (API) وميزة القراءة بصوت عالٍ.
هناك مجموعة من العينات على المدونة الرسمية للشركة، وهي تبدو قريبة بشكل مخيف من الشيء الحقيقي، وفقًا لتقارير Engadget.
يقول OpenAI إنهم يرون أن هذه التكنولوجيا مفيدة للمساعدة في القراءة وترجمة اللغات ومساعدة أولئك الذين يعانون من حالات النطق المفاجئة أو التنكسية.
أطلقت الشركة برنامجًا تجريبيًا في جامعة براون ساعد مريضًا يعاني من ضعف النطق عن طريق إنشاء محرك صوتي مستنسخ مأخوذ من الصوت المسجل لمشروع مدرسي.
على الرغم من الفوائد المحتملة، فمن المؤكد أن الجهات الفاعلة السيئة ستسيء استخدام هذه التكنولوجيا للانخراط في بعض التزييف العميق الخطير، وهو ما يمثل مشكلة بالفعل. مع أخذ هذا في الاعتبار، فإن المحرك الصوتي ليس جاهزًا تمامًا للاستخدام في أوقات الذروة، حيث توجد مخاوف جدية. يجب تلبية المخاوف المتعلقة بالخصوصية قبل الإطلاق الكامل.
تعترف OpenAI بأن هذه التكنولوجيا تشكل “مخاطر جسيمة، والتي تحتل مرتبة عالية بشكل خاص في قائمتنا في عام الانتخابات”، وتقول الشركة إنها تدمج تعليقات من “الشركاء الأمريكيين والدوليين من مختلف أنحاء الحكومة ووسائل الإعلام والترفيه والتعليم والمجتمع المدني، وما بعده” لضمان إطلاق المنتج بأقل قدر من المخاطر. من المخاطر.
وافق جميع مختبري المعاينة على سياسات استخدام OpenAI، التي تحظر انتحال شخصية فرد آخر دون موافقة أو حق قانوني.
بالإضافة إلى ذلك، سيتعين على أي شخص يستخدم هذه التكنولوجيا أن يكشف لجمهوره أن الأصوات يتم إنشاؤها بواسطة الذكاء الاصطناعي، وقد نفذت شركة OpenAI تدابير السلامة، مثل العلامة المائية لتتبع أصل أي صوت و”المراقبة الاستباقية” لكيفية عمل النظام. مستخدم.
عندما يتم إطلاق المنتج رسميًا، ستكون هناك “قائمة محظورة للصوت” تكتشف وتحظر مكبرات الصوت التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تشبه الشخصيات البارزة.
أما بالنسبة للوقت الذي سيتم فيه هذا الطرح، فإن OpenAI تظل متحفظة، وقد كشفت TechCrunch عن بعض بيانات التسعير المحتملة. ويمكن أن يكلف المحرك الصوتي 15 دولارًا لكل مليون حرف، أي ما يعادل حوالي 162.500 كلمة، كما تشير المواد التسويقية إلى إصدار “HD”. ويكلف ضعف ذلك، لكن الشركة لم توضح بالتفصيل كيفية عمله.
تقوم شركة OpenAI باتخاذ خطوات كبيرة هذا الأسبوع، وقد أعلنت للتو عن شراكة أخرى مع أفضل صديق لها مايكروسوفت لبناء حاسوب عملاق قائم على الذكاء الاصطناعي يسمى “Stargate”. وبحسب ما ورد سيتكلف المشروع 100 مليار دولار، وفقًا للمعلومات.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
اكتشاف المزيد من العاصمة والناس
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.