تعرف على أحدث أبحاث مايكروسوفت فى الذكاء الاصطناعى لتحويل النص إلى كلام

0 157 2 دقائق

أفادت شركة Ars Technica أن Microsoft عرضت أحدث أبحاثها في مجال الذكاء الاصطناعي لتحويل النص إلى كلام باستخدام نموذج يسمى VALL-E يمكنه محاكاة صوت شخص ما من عينة صوتية مدتها ثلاث ثوانٍ فقط، وفقا لتقرير engadget.

ولا يمكن للخطاب أن يطابق الجرس فحسب بل يتطابق أيضًا مع النغمة العاطفية للمتكلم، وحتى صوتيات الغرفة، ويمكن استخدامه يومًا ما لتطبيقات تحويل النص إلى كلام المخصصة أو المتطورة، على الرغم من أنه مثل التزييف العميق ، فإنه ينطوي على مخاطر إساءة الاستخدام.

VALL-E هو ما تسميه Microsoft “ونموذج لغة الترميز العصبي” إنه مشتق من ترميز الشبكة العصبية للضغط المدعوم بالذكاء الاصطناعي من ميتا ، مما يولد الصوت من إدخال النص وعينات قصيرة من السماعة المستهدفة.

وفي ورقة بحثية ، وصف الباحثون كيف قاموا بتدريب VALL-E على 60.000 ساعة من الكلام باللغة الإنجليزية من أكثر من 7000 متحدث في مكتبة Meta الصوتية LibriLight ، ويجب أن يكون الصوت الذي تحاول تقليده مطابقًا تمامًا للصوت الموجود في بيانات التدريب، وإذا كان الأمر كذلك فإنه يستخدم بيانات التدريب لاستنتاج ما سيبدو عليه المتحدث المستهدف إذا كان يتحدث بإدخال النص المطلوب.

ويوضح الفريق بالضبط كيف يعمل هذا بشكل جيد على صفحة VALL-E Github. لكل عبارة يريدون من الذكاء الاصطناعي “التحدث” ، لديهم مطالبة مدتها ثلاث ثوان من المتحدث لتقليد، “حقيقة أساسية” للمتحدث نفسه يقول عبارة أخرى للمقارنة ، “خط أساسي” لتحويل النص إلى كلام التقليدي التوليف وعينة VALL-E في النهاية.

والنتائج مختلطة، بعضها يشبه الآلة والبعض الآخر واقعي بشكل مدهش، حقيقة أنه يحتفظ بالنبرة العاطفية للعينات الأصلية، كما أنه يطابق البيئة الصوتية بأمانة، لذلك إذا قام المتحدث بتسجيل صوته في قاعة echo-y ، فإن إخراج VALL-E يبدو أيضًا وكأنه جاء من نفس المكان.

ولتحسين النموذج، تخطط Microsoft لتوسيع نطاق بيانات التدريب الخاصة بها “لتحسين أداء النموذج عبر وجهات نظر التشابه بين العروض الفنية وأسلوب التحدث والمتحدثين.” كما أنها تستكشف طرقًا لتقليل الكلمات غير الواضحة أو المفقودة.

واختارت Microsoft عدم جعل الكود مفتوح المصدر، ربما بسبب المخاطر الكامنة في الذكاء الاصطناعي التي يمكن أن تضع الكلمات في فم شخص ما.

وأضافت أنها ستتبع “مبادئ مايكروسوفت للذكاء الاصطناعي” في أي تطوير آخر، وكتبت الشركة في قسم “التأثيرات الأوسع” في استنتاجها: “نظرًا لأن VALL-E يمكنه تجميع الكلام الذي يحافظ على هوية المتحدث، فقد يحمل مخاطر محتملة في إساءة استخدام النموذج ، مثل انتحال التعرف على الصوت أو انتحال الشخصية”.

مرتبط

اكتشاف المزيد من إن سفن

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

الوسوم

0 157 2 دقائق

تعرف على أحدث أبحاث مايكروسوفت فى الذكاء الاصطناعى لتحويل النص إلى كلام

معجب بهذه:

مرتبط

اكتشاف المزيد من إن سفن

eshrag

اترك تعليقاً إلغاء الرد

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

تحقق من نقاط الائتمان الخاصة بك مجانًا باستخدام هذه المواقع

7 بدائل لبحث Google أفضل استخدامها يوميًا

كشف تسربات الحمامات بالرياض

كيفية تعطيل التحديث التلقائي لصفحة الويب في المستعرض الخاص بك

كيفية إيقاف تشغيل وضع تقييد المحتوى على YouTube

روابط ميجا mega ,روابط ميقا مجانية ,مقاطع ميقا 2021رابط mega

كيفية تنظيف الجزء الداخلي من جهاز الكمبيوتر الخاص بك

كيفية نسخ نص من موقع يمنع النسخ في كروم

7 منصات مجانية لإنشاء تطبيقات بدون تشفير

اختصارات لوحة المفاتيح العامة لوضع المؤسسة

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

تحقق من نقاط الائتمان الخاصة بك مجانًا باستخدام هذه المواقع

7 بدائل لبحث Google أفضل استخدامها يوميًا

كشف تسربات الحمامات بالرياض

كيفية إصلاح خطأ “Spotify لا يمكنه تشغيل هذا الآن”

روابط نصية AA50

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

كيفية تقسيم شاشتك في Windows 10

6 طرق للتحقق من صحة القرص الصلب على نظام التشغيل Windows 10

12 شيئًا يجب عليك القيام به عند تشغيل SSD في نظام التشغيل Windows 10

كيفية الوصول إلى مجلد WindowsApps في نظام التشغيل Windows 10

كيفية جعل وضع التصفح الخاص الافتراضي في متصفحات مختلفة

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

تحقق من نقاط الائتمان الخاصة بك مجانًا باستخدام هذه المواقع

7 بدائل لبحث Google أفضل استخدامها يوميًا

كشف تسربات الحمامات بالرياض

كيفية إصلاح خطأ “Spotify لا يمكنه تشغيل هذا الآن”

اختصارات لوحة المفاتيح العامة لوضع المؤسسة

شارك هذا الموضوع:

معجب بهذه:

مرتبط

اكتشاف المزيد من إن سفن

تقرير: تحسن حالة ثقب الأوزون المتسع لـ8.91 مليون ميل مربع فوق القطب الجنوبى

تقرير: أيفون 16 برو سيوفر ميزة بصمة الوجه Face ID تحت الشاشة

مقالات ذات صلة

اترك تعليقاً إلغاء الرد

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

كيفية تقسيم شاشتك في Windows 10

6 طرق للتحقق من صحة القرص الصلب على نظام التشغيل Windows 10

12 شيئًا يجب عليك القيام به عند تشغيل SSD في نظام التشغيل Windows 10

كيفية الوصول إلى مجلد WindowsApps في نظام التشغيل Windows 10

كيفية جعل وضع التصفح الخاص الافتراضي في متصفحات مختلفة

5 أسباب لماذا لا يجب عليك أبدًا تسجيل الدخول باستخدام Google أو Facebook

تحقق من نقاط الائتمان الخاصة بك مجانًا باستخدام هذه المواقع

7 بدائل لبحث Google أفضل استخدامها يوميًا

كشف تسربات الحمامات بالرياض

كيفية إصلاح خطأ “Spotify لا يمكنه تشغيل هذا الآن”

اختصارات لوحة المفاتيح العامة لوضع المؤسسة

اكتشاف المزيد من إن سفن