واجهة برمجة تطبيقات نصية الى كلام

واجهة برمجة تطبيقات نصية الى كلام فالبرامج الحديثة والتي يستخدمها المستخدم في كافة ما يقوم به على هذه التطبيقات، يعتمد استخدامها بشكل كلي على الواجهات التي يتعامل معها، فكلما ما كانت الواجهة أسلس وبسيطة وسهلة، حققت إفادة أكبر للمستخدم وسهولة في العمل ومرونة في الأداء، وكذلك الأمر مع واجهات تطبيقات تحويل النص إلى كلام، وفي مقالنا اليوم عبر موقع المرجع سوف نجيب على هذا السؤال المطروح ونتعرف أكثر ما هو تحويل النص إلى كلام.

ما هو تحويل النص إلى كلام

تحويل النص إلى كلام، المعروف أيضًا باسم تركيب الكلام، وهو عملية تحويل النص المكتوب إلى صوت منطوق، وفي معظم الحالات، يشير مصطلح تحويل النص إلى كلام، إلى نص موجود على جهاز كمبيوتر أو جهاز آخر، وتُنشئ هذه الميزة بيانات صوتية أولية للخطاب البشري الطبيعي، أي أنه ينشئ صوتًا يبدو وكأنه شخص يتحدث، كما وتحتوي هذه الميزة، مجموعة واسعة من الأصوات المخصصة المتاحة لاستخدامها، وتختلف الأصوات حسب اللغة والجنس واللهجة وإلى جانب الصوت، يمكن للمستخدم أيضًا تكوين جوانب أخرى من إخراج البيانات الصوتية التي تم إنشاؤها بواسطة تركيب الكلام، حيث أنه يدعم تحويل النص إلى كلام، تكوين معدل التحدث ودرجة الصوت ومستوى الصوت ومعدل العينة هرتز.[1]

شاهد أيضًا: من الأمثلة على لغات البرمجة بالكائنات

واجهة برمجة تطبيقات نصية الى كلام

في الوقت الحالي، تعتبر ميزة تحويل النص إلى كلام مهمة وسهلة للغاية، وما يجعلها سهلة هو استخدام واجهات تطبيق سلسلة، وهذه الواجهات يتم تعريفها على أنها:[1]

  • واجهات توفر عرض الكلام التركيبي الناتج عن تحويل النص إلى كلام Text-to-speech API، وذلك عن طريق ترميز النص باستخدام لغة ترميز تركيب الكلام SSML أو JSON وغيرها،

ويتمكن المستخدم من خلال لغة ترميز تركيب الكلام SSML، من إدراج التوقفات أو النطق المختصر أو تفاصيل إضافية أخرى، في البيانات الصوتية التي تم إنشاؤها بواسطة تحويل النص إلى كلام API، كما تدعم ميزة تحويل النص إلى كلام، مجموعة فرعية من عناصر SSML المتاحة، والتي تقدم ميزات هامة، مثل التأكد من أن الكلام التركيبي يلفظ الأرقام الترتيبية بشكل صحيح.

شاهد أيضًا: هي مجموعة من البرامج التي تقوم بإدارة جهاز الحاسب وتتحكم في عمل المكونات المادية والتطبيقات

كيف تعمل واجهة برمجة تطبيقات نصية إلى كلام

تبدأ العملية عندما يرسل البرنامج نصًا إلى واجهة برمجة التطبيقات كطلب، والتي عادة ترسل بأكثر من تنسيق، كتنسيق JSON، ولكن غالباً ما يستخدم تنسيق SSML، والذي هو نوع من لغة الترميز التي تم إنشاؤها لتحسين كفاءة برامج تركيب الكلام، وبمجرد أن تتلقى API الطلب، فإنها ستعيد كائن الصوت المكافئ، ويمكن بعد ذلك دمج هذا الكائن في البرنامج الذي قدم الطلب، والذي يقوم أيضًا بتشغيله للمستخدم، وتسمح أيضًا أفضل واجهات برمجة تطبيقات تحويل النص إلى كلام باختيار اللكنة والجنس، فمثلاً يمكن اختيار اللغة الإنكليزية بلكنة أسترالية، كما يمكن أن اختيار نوع الصوت من نوع الجنس، فيمكن مثلاً اختيار صوت امرأة كبيرة أو صغيرة في العمر.[1]

وبهذا القدر نصل إلى نهاية مقالنا الذي كان بعنوان واجهة برمجة تطبيقات نصية الى كلام والذي أجبنا من خلاله على هذا السؤال المطروح وتعرفنا أكثر على ما هو تحويل النص إلى كلام، وكيف تعمل واجهة برمجة تطبيقات نصية إلى كلام.

المراجع

  1. rapidapi.com , Best Text to Speech APIs , 24/12/2021

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *