פער בין התוצאות שהושגו במדדים פנימיים וחיצוניים מעלה שאלות על השקיפות והבדיקות של מודל הבינה המלאכותית o3 של OpenAI. בחודש דצמבר הכריזה החברה כי המודל מסוגל לפתור מעט יותר מרבע מהשאלות במבחן FrontierMath – מבחן מתמטי מאתגר, והציון שהתקבל הפתיע...
פער בין התוצאות שהושגו במדדים פנימיים וחיצוניים מעלה שאלות על השקיפות והבדיקות של מודל הבינה המלאכותית o3 של OpenAI. בחודש דצמבר הכריזה החברה כי המודל מסוגל לפתור מעט יותר מרבע מהשאלות במבחן FrontierMath – מבחן מתמטי מאתגר, והציון שהתקבל הפתיע...