الأخبار
ملخص بالذكاء الاصطناعي
٢١ ذو القعدة ١٤٤٧ هـ٨ مايو ٢٠٢٦
OpenAI تطلق نماذج صوتية جديدة لتحسين التفاعل الفوري

OpenAI تطلق نماذج صوتية جديدة لتحسين التفاعل الفوري

كشفت OpenAI عن ثلاثة نماذج صوتية جديدة تعمل بنحو لحظي، وهي تستهدف المطورين العاملين على تطبيقات المساعدات الصوتية، والترجمة الفورية، وتحويل الكلام إلى نصوص مباشرةً عبر واجهاتها البرمجية API. تتضمن المجموعة الجديدة نماذج GPT-Realtime-2 و GPT-Realtime-Translate و GPT-Realtime-Whisper، حيث تهدف إلى توفير تفاعلات صوتية طبيعية بشكل أكبر. كما تدعم هذه النماذج الترجمة الحية، مما يعزز من فعالية التطبيقات التي تعتمد على الصوت. تعتبر هذه الخطوة مهمة في مجال الذكاء الاصطناعي، حيث تفتح آفاق جديدة للمطورين في تصميم تطبيقات مبتكرة. من المتوقع أن تؤثر هذه النماذج على كيفية تفاعل المستخدمين مع التكنولوجيا، مما يسهل التواصل الفوري عبر اللغات المختلفة.

تابع هذه المواضيع

سجّل دخولك لمتابعة المواضيع التي تهمك

تسجيل الدخول للمتابعة

يُنتج هذا الملخص باستخدام تقنيات الذكاء الاصطناعي مع مراجعة تحريرية دورية، ويرجى الرجوع إلى المصدر الأصلي للتفاصيل الكاملة.

0
0 يقرأون الآن

تقييم الخبر

سيظهر متوسط التقييم بعد 3 تقييمات.

سجل الدخول للتفاعل والتقييم والحفظ. تسجيل الدخول
مقالات ذات صلة

مقالات ذات صلة

مزيج خفيف من الوسوم والموضوعات القريبة والزخم الحديث.

جوجل تطلق نموذجين جديدين للذكاء الاصطناعي التوليدي
متعدد الوسائطنماذج

جوجل تطلق نموذجين جديدين للذكاء الاصطناعي التوليدي

أعلنت جوجل عن إطلاق نموذجين جديدين للذكاء الاصطناعي التوليدي، وهما Nano Banana 2 Lite وGemini Omni Flash. يعمل Nano Banana 2...

تلائم لغتك الحالية

اقرأ الرؤية
جوجل تطلق نموذج Gemini 3.5 Live Translate للترجمة الصوتية الفورية
متعدد الوسائطنماذج

جوجل تطلق نموذج Gemini 3.5 Live Translate للترجمة الصوتية الفورية

أعلنت جوجل عن إطلاق نموذج Gemini 3.5 Live Translate، الذي يهدف إلى تحسين الترجمة الصوتية الفورية. النموذج الجديد يمكنه التعر...

تلائم لغتك الحالية

اقرأ الرؤية
إطلاق نموذج Qwen3.7-Plus من Alibaba كوكيل متعدد الوسائط
متعدد الوسائطالوكلاء والأتمتة

إطلاق نموذج Qwen3.7-Plus من Alibaba كوكيل متعدد الوسائط

أطلقت مجموعة Qwen التابعة لشركة Alibaba نموذج Qwen3.7-Plus، وهو نموذج وكيل متعدد الوسائط يجمع بين الإدراك البصري وتشغيل واجه...

تلائم لغتك الحالية

اقرأ الرؤية
إطلاق Gemini 3.5 Live Translate لترجمة الكلام الفوري
متعدد الوسائطنماذج

إطلاق Gemini 3.5 Live Translate لترجمة الكلام الفوري

أعلنت جوجل عن إطلاق Gemini 3.5 Live Translate، الذي يوفر ترجمة فورية للكلام بشكل طبيعي. هذه الميزة الجديدة متاحة الآن في Goo...

تلائم لغتك الحالية

اقرأ الرؤية
جوجل توسع خدمة توليد الصور الذكية لمستخدميها المجانيين في أمريكا
متعدد الوسائطنماذج

جوجل توسع خدمة توليد الصور الذكية لمستخدميها المجانيين في أمريكا

أعلنت شركة جوجل عن توسيع خدمة Gemini لتوليد الصور الذكية، حيث ستتاح هذه الميزة لمستخدميها المجانيين في الولايات المتحدة. ستت...

تلائم لغتك الحالية

اقرأ الرؤية