OpenAI שחררו עדכון חדש שמאפשר להשתמש בקול כדי ליצור שיחה עם ChatGPT. דברו איתו תוך כדי תנועה, בקשו ממנו סיפור לפני השינה, או בקשו נהלו איתו דיון על נושא שמעניים אתכם. וכן, הוא גם יודע לפרש תמונות.
מה צריך לדעת על יכולות הקול והתמונה החדשות של GhatGPT?
יכולות קול ChatGPT
נהלו שיחות קוליות על ChatGPT- פלט וקלט.
זמין ב-iOS וב-Android.
מופעל על ידי מודל טקסט לדיבור חדש שיוצר אודיו דמוי אדם.
משתמש במערכת Whisper לזיהוי דיבור.
Open AI יצרו שיתופי פעולה עם שחקני קול מקצועיים ליצירת הקול.
יכולות תמונה ChatGPT
אפשר לתקשר ChatGPT באמצעות תמונות. תעלו תמונה והוא יפרש אותה.
אפשרות למקד את ChatGPT בפרטים ספציפיים בתמונה.
הבנת התמונה מופעלת על ידי מודלים GPT-3.5 ו-GPT-4 ChatGPT.
מבין תצלומים, צילומי מסך ומסמכים עם טקסט ותמונות.
Open AI מציינים כי אמצעים טכניים ננקטים כדי לכבד את פרטיותם של אנשים ולהפחית ניתוח של אנשים.
הפרטים המלאים כולל דוגמאות כאן:https://openai.com/blog/chatgpt-can-now-see-hear-and-speak