خبر

علي بابا تطلق أدوات ذكاء اصطناعي لتوليد الأصوات واستنساخها

أعلنت شركة علي بابا كلاود عن إطلاق نموذجين جديدين من عائلة Qwen3 للذكاء الاصطناعي، يركزان على توليد الأصوات واستنساخها باستخدام أوامر نصية، في خطوة تستهدف تعزيز تطبيقات الصوت الاحترافية وصناعة المحتوى.

ويحمل أول نموذج اسم Qwen3-TTS-VD-Flash، ويتيح للمستخدمين إنشاء أصوات اعتمادًا على أوصاف تفصيلية، مثل تحديد المشاعر ونبرة الصوت وسرعة الإلقاء.

ووفقًا للشركة، يمكن للمستخدم طلب صوت بمواصفات دقيقة مثل العمر ونوع الصوت والأسلوب، مما يمنح تحكمًا واسعًا في المخرجات الصوتية.

وتؤكد علي بابا أن النموذج يتفوق في الأداء على واجهة OpenAI الخاصة بنموذج GPT-4o mini-tts الذي أُطلق في وقت سابق هذا العام.

وأما النموذج الثاني، Qwen3-TTS-VC-Flash، فيختص باستنساخ الأصوات، إذ يستطيع نسخ صوت شخص اعتمادًا على مقطع صوتي لا يتجاوز ثلاث ثوانٍ، مع إعادة إنتاجه بعشر لغات مختلفة. وتقول الشركة إن النموذج يحقق معدل أخطاء أقل مقارنةً بمنافسين بارزين مثل ElevenLabs و MiniMax.

وبحسب علي بابا، فإن النماذج الجديدة تتميز بقدرتها على التعامل مع نصوص معقدة، وتقليد أصوات الحيوانات، واستخراج الأصوات من التسجيلات الصوتية. وتتوفر الأداتان عبر واجهة برمجة التطبيقات الخاصة بعلي بابا كلاود، مع إتاحة نسخ تجريبية للنموذجين عبر منصة Hugging Face.

ويأتي إطلاق نماذج Qwen3 الجديدة في وقت تشهد فيه سوق توليد الأصوات بالذكاء الاصطناعي منافسة متصاعدة، مدفوعة بالطلب المتزايد من قطاعات مثل الإعلانات والألعاب وصناعة الفيديو.

وتفتح النماذج الجديدة المجال أمام استخدامات متعددة، منها إنتاج الإعلانات الصوتية، والدبلجة المتعددة اللغات، وصناعة الشخصيات الصوتية في الألعاب، إضافةً إلى دعم منصات التعليم الإلكتروني وخدمات مراكز الاتصال، مع تقليل الوقت والتكلفة مقارنةً بأساليب التسجيل التقليدية.

نسخ الرابط تم نسخ الرابط

أخبار متعلقة :