OpenAI הכריזה על הגרסה השלישית של פלטפורמת יצירת התמונות באמצעות הבינה המלאכותית שלה DALL-E, המאפשרת כעת למשתמשים להשתמש ב-ChatGPT כדי ליצור הנחיות וכוללת אפשרויות בטיחות נוספות.
DALL-E ממיר הנחיות טקסט לתמונות. אבל אפילו DALL-E 2 עושה לא מעט טעויות, ולעתים קרובות התעלם מניסוחים ספציפיים. הגרסה האחרונה, אמרו חוקרי OpenAI, מבינה את ההקשר הרבה יותר טוב.
תכונה חדשה של DALL-E 3 היא אינטגרציה עם ChatGPT.
אז מה חדש בDALL-E 3
באמצעות ChatGPT, לא צריך להמציא הנחיה מפורטת אפשר פשוט לבקש מ-ChatGPT להמציא הנחיה, והצ’אטבוט יכתוב פסקה (DALL-E עובד טוב יותר עם משפטים ארוכים ) כדי ש-DALL-E 3 ימשיך. משתמשים אחרים עדיין יכולים להשתמש בהנחיות משלהם אם יש להם רעיונות ספציפיים עבור DALL-E.
בהדגמה ל-The Verge, אדיטיה ראמש, חוקרת ראשית וראש צוות DALL-E, הניעה את ChatGPT לעזור לו להמציא לוגו למסעדת ראמן בהרים. לאחר מכן, ChatGPT כתב הנחיה ארוכה יותר, ו-DALL-E העלה ארבע אפשרויות. הצ’אטבוט, אמר OpenAI, מאפשר ליותר אנשים ליצור אמנות בינה מלאכותית מכיוון שהם לא צריכים להיות טובים מאוד בבוא עם הנחיה.
מה ההבדל בין הגרסאות השונות של DALL-E?
DALL-E, ששוחרר לראשונה בינואר 2021, הגיע לפני פלטפורמות אחרות של אמנות בינה מלאכותית מחוללת טקסט לתמונה של Stability AI ו-Midjourney. עד שה-DALL-E 2 שוחרר בשנת 2022, OpenAI פתחה רשימת המתנה כדי לשלוט על מי שיוכל להשתמש בפלטפורמה לאחר ביקורת על כך ש-DALL-E יכול ליצור תמונות מפורשות פוטוריאליסטיות והראה הטיה בעת יצירת תמונות. החברה הסירה את רשימת ההמתנה בספטמבר אשתקד ופתחה את DALL-E 2 לציבור.
גרסה חדשה זו של DALL-E תשוחרר לראשונה למשתמשי ChatGPT Plus ו-ChatGPT Enterprise באוקטובר, ולאחריה מעבדות מחקר ושירות ה-API שלה בסתיו. OpenAI מתכננת להדהים את שחרורו של DALL-E 3 אך לא התחייבה למועד שבו תשוחרר גרסה ציבורית חינמית.
רמות אבטחה חדשות
OpenAI טוענת שהיא התמקדה בעבודה רבה ב-DALL-E 3 ביצירת אמצעי בטיחות חזקים כדי למנוע יצירת תמונות שאינן הולמות או פוטנציאליות לאלימות. OpenAI אמרה שהיא עבדה עם צוותים אדומים חיצוניים – קבוצה שמנסה לשבור מערכת בכוונה כדי לבדוק את בטיחותה – והסתמכה על מסווגי קלט, דרך ללמד מודלים של שפה להתעלם ממילים מסוימות רמות אבטחה חדשות כדי להימנע מהנחיות מפורשות או אלימות. DALL-E 3 גם לא יוכל לשחזר תמונות של אישי ציבור – בתנאי שההנחיה מזכירה שם במפורש.
Sandhini Agarwal, חוקרת מדיניות בחברה, אמרה שיש לה “אמון גבוה” באמצעי הבטיחות , אך הבהירה כי המודל משתפר ללא הרף ואינו מושלם. נציגי OpenAI אמרו ש-DALL-E 3 הוכשר לסרב לייצר תמונות בסגנון של אמנים חיים. בניגוד ל-DALL-E 2 שכאשר תתבקש, הוא יכול לחקות אמנות בסגנון של אמנים מסוימים.
OpenAI, כדי להימנע מתביעות משפטיות, תאפשר גם לאמנים לבטל את האמנות שלהם בגרסאות עתידיות של מודלים של טקסט לתמונה. יוצרים יכולים להגיש תמונה שבבעלותם הזכויות עליה ולבקש את הסרתה בטופס באתר האינטרנט שלה. גרסה עתידית של DALL-E יכולה אז לחסום תוצאות שנראות דומות לתמונה ולסגנון של האמן. אמנים תבעו את מתחרות ה-DALL-E Stability AI ו-Midjourney, יחד עם אתר האמנות DeviantArt, על כך שהשתמשו לכאורה בעבודות שלהם המוגנות בזכויות יוצרים כדי להכשיר את דגמי הטקסט לתמונה שלהם.