مساعد الذكاء الاصطناعي الصوت ChatGPT مع ميزات الصورة الجديدة بواسطة OpenAI

تقدم OpenAI إمكانات صوت وصورة جديدة إلى ChatGPT ، مما يوفر تفاعلات أكثر سهولة. الآن ، يمكنك الحصول على تفاعلات أكثر سهولة مع مساعد الذكاء الاصطناعي الخاص بك.

هل تريد إجراء محادثة باستخدام صوتك؟ لا توجد مشكلة.


تحتاج إلى إظهار

ChatGPT
صورة لمناقشتها؟ أنت ستفعل ذلك!

تستكشف هذه المقالة كيفية عمل الذكاء الاصطناعي الصوتية للأعمال وميزات الصور وتطبيقاتها المحتملة في المحادثات الذكاء الاصطناعي.

المحادثات الصوتية مع ChatGPT

أخبار مثيرة! الآن ، يمكنك بالفعل التحدث إلى ChatGPT وإجراء محادثة ذهابا وإيابا.

يدعم ChatGPT الآن التفاعلات الصوتية ، مما يسمح للمستخدمين بإجراء محادثات ذهابا وإيابا مع مساعدهم الذكاء الاصطناعي. باستخدام هذه الميزة الجديدة ، يمكنك طلب القصص وتسوية المناقشات والمشاركة في محادثات تفاعلية مع ChatGPT. تستخدم القدرة الصوتية نموذج تحويل النص إلى كلام لتوليد صوت يشبه الإنسان.

ولكن هناك المزيد! أنت لست مقيدا بصوت واحد فقط. بدلا من ذلك ، يمكنك الاختيار من بين خمسة أصوات مختلفة لجعل محادثاتك أكثر متعة.

الذكاء الاصطناعي الصوت وفهم الصور في ChatGPT

الآن ، يمكنك إظهار ChatGPT ما تتحدث عنه من خلال مشاركة الصور! يمكنك الآن مشاركة الصور مع ChatGPT للمناقشات أو استكشاف الأخطاء وإصلاحها أو التحليل. سواء كان الأمر يتعلق بإصلاح الشواية ، أو تحديد ما يجب طهيه من الثلاجة ، أو تفسير الرسوم البيانية المعقدة للعمل ، يمكن ل ChatGPT تقديم رؤى بناء على الصور التي تشاركها.

بفضل قوة نماذج GPT-3.5 و GPT-4

متعددة الوسائط ، فإنه يستخدم مهارات التفكير اللغوي لفهم ومناقشة مجموعة واسعة من الصور ، سواء كانت صورا أو لقطات شاشة أو مستندات.

النشر التدريجي للسلامة

تدور استراتيجية OpenAI حول أخذ الأمور خطوة بخطوة للحفاظ على الأمور آمنة ومسؤولة. في حين أن تقنية الصوت ممتازة ، إلا أنها تأتي مع مخاطر مثل انتحال الشخصية أو الاحتيال. لذلك ، فإن OpenAI يتوخى الحذر من خلال طرحه للدردشة الصوتية أولا. لقد تعاونوا مع الممثلين الصوتيين والشركاء ، مثل Spotify

، لضمان استخدامه لحالات محددة ومدروسة بعناية ، مثل الترجمة الصوتية.

عندما يتعلق الأمر بالنماذج القائمة على الرؤية للصور ، فهناك بعض التحديات الفريدة على الطاولة. أحد المخاوف الكبيرة هو الخصوصية – فأنت بالتأكيد لا تريد الذكاء الاصطناعي تحليل والإدلاء ببيانات حول الأفراد دون موافقتهم. يحصل OpenAI على هذا وقد اتخذ تدابير لضمان احترام ChatGPT لخصوصية الأشخاص.

بالإضافة إلى ذلك ، فإنهم يبقون آذانا صاغية للتعليقات والاستخدام في العالم الحقيقي لتحسين تدابير السلامة هذه. لذا ، فإن الخصوصية هي أولوية قصوى بالنسبة لهم.

الشفافية وقيود النموذج

تؤمن OpenAI بالشفافية بشأن ما يمكن وما لا يمكن ل ChatGPT فعله. إنه ممتاز في نسخ النص الإنجليزي ، لكنه قد لا يعمل بشكل جيد لبعض اللغات الأخرى ، خاصة تلك التي تحتوي على نصوص غير رومانية. لذلك ، إذا كنت تستخدم ChatGPT لموضوعات أو لغات متخصصة ، فهي أقل كفاءة في التحقق من النتائج والتحقق منها فكرة جيدة. يجب عليك استخدام الأداة بحكمة وفهم نقاط قوتها وقيودها.

توسيع نطاق الوصول

تظهر ميزات الصوت والصورة الرائعة لأول مرة في
Plus
و
Enterprise
المستعملون. يحصلون على طعمهم الأول! بالنسبة للمطورين ، ستكون هذه القدرات الرائعة في الطريق قريبا لأي شخص آخر.

قام OpenAI للتو بترقية ChatGPT بشكل كبير عن طريق إضافة إمكانات الصوت والصورة. هذا يعني أنه يمكنك الحصول على تفاعلات أكثر تنوعا والقيام بالكثير باستخدام هذا الذكاء الاصطناعي للأعمال. إنه يجعل تفاعلاتك اليومية مع التكنولوجيا أكثر ابتكارا وسهولة في الاستخدام.

استنتاج

تعمل إمكانات الصوت والصورة الجديدة من OpenAI في ChatGPT على تحسين تفاعلات المستخدم بشكل كبير مع مساعدي الذكاء الاصطناعي. يمكنك الآن المشاركة في المحادثات الصوتية ومشاركة الصور ، مما يجعل المهام أكثر سهولة. السلامة والخصوصية أمران أساسيان ، مع طرح تقنية الصوت بعناية وتدابير الخصوصية المعمول بها لمناقشات الصور.

شفافة بشأن حدودها ، ChatGPT هي أداة قوية الأنسب للنص الإنجليزي. تتوفر هذه الإمكانات في البداية لمستخدمي Plus و Enterprise ، وتعد بجعل تفاعلات الذكاء الاصطناعي أكثر ابتكارا وسهولة في الاستخدام.

اقرأ المزيد: مترجم الكود: قفزة جديدة ل ChatGPT

Author

Oriol Zertuche

Oriol Zertuche is the CEO of CODESM and Cody AI. As an engineering student from the University of Texas-Pan American, Oriol leveraged his expertise in technology and web development to establish renowned marketing firm CODESM. He later developed Cody AI, a smart AI assistant trained to support businesses and their team members. Oriol believes in delivering practical business solutions through innovative technology.

More From Our Blog

تم إصدار سوناتة كلود 3.5 سونيت من أنثروبيك: أفضل من GPT-4o؟

تم إصدار سوناتة كلود 3.5 سونيت من أنثروبيك: أفضل من GPT-4o؟

Claude 3.5 Sonnet هو أحدث نموذج في عائلة Claude 3.5 من نماذج اللغات الكبيرة (LLMs). تم تقديمه من قبل أنثروبيك في مارس 2024، وهو يمثل قفزة كبيرة إلى الأمام. ي�...

Read More
RAG كخدمة: أطلق العنان للذكاء الاصطناعي التوليدي لأعمالك

RAG كخدمة: أطلق العنان للذكاء الاصطناعي التوليدي لأعمالك

مع ظهور النماذج اللغوية الكبيرة (LLMs) واتجاهات الذكاء الاصطناعي التوليدي، يمكن أن يؤدي دمج حلول الذكاء الاصطناعي التوليدي في أعمالك إلى ز�...

Read More

Build Your Own Business AI

Get Started Free
Top