מחקר: אפשר לאמן מודל בינה מלאכותית להתנהג באופן זדוני

    • חוקרים, בהם אנשי הסטארט-אפ אנתרופיק שמתחרה ב-OpenAI, גילו שניתן באמצעות שימוש במשפטי או מילות מפתח לשכנע מודלי שפה גדולים לסייע ביצירת קוד זדוני. לא פחות מדאיג: הבינה המלאכותית לומדת להסתיר את ההתנהגות הזדונית וכמעט בלתי אפשרי לתקן מודל שאומן בצורה הזאת המשך לכתבה

תגובות:

מציג 0 תגובות משורשרות
  • יש להתחבר למערכת על מנת להגיב.