ניווט בפורום
צריך להתחבר כדי ליצור נושאים ותגובות.

פלטפורמת NVIDIA Blackwell Ultra: קפיצת מדרגה בביצועים ובעלות בתחום AI

פלטפורמת NVIDIA Blackwell Ultra: קפיצת מדרגה בביצועים ובעלות בתחום AI

פלטפורמת NVIDIA Blackwell Ultra מספקת פתרון חדשני לספקי אינפרנס מובילים כמו Baseten, DeepInfra, Fireworks AI ו-Together AI, כשהיא מצליחה להקטין את העלות לכל טוקן בעד פי 10. מעבר לכך, הפלטפורמה מציעה שיפור משמעותי בביצועים עבור סוכני AI ועוזרי קידוד, המניעים צמיחה מהירה בשאילתות AI הקשורות לתכנות תוכנה.

שוק האינטליגנציה המלאכותית רואה בשנים האחרונות גידול משמעותי בדרישה לפתרונות מהירים ויעילים. פלטפורמת Blackwell Ultra של NVIDIA מביאה איתה פריצות דרך בשני התחומים החשובים ביותר: הפחתת עלויות והגברת ביצועים. מערכות GB300 NVL72 של NVIDIA מספקות עד פי 50 תפוקה גבוהה יותר לכל מגהוואט בהשוואה לפלטפורמות קודמות.

ההישגים הללו מתאפשרים באמצעות חדשנות בצ'יפים, ארכיטקטורת מערכת ותוכנה. NVIDIA ממשיכה לשפר את התפוקה בעזרת צוותי TensorRT-LLM, Dynamo ו-SGLang, המובילים לשיפור משמעותי בביצועים עבור אינפרנס של תערובת מומחים (MoE). לדוגמה, שיפורי הספרייה של NVIDIA TensorRT-LLM מספקים עד פי 5 ביצועים טובים יותר לעומסי עבודה בעלי השהיה נמוכה.

עם ההשקה של GB300 NVL72, פלטפורמת Blackwell Ultra מציעה כלכלה מעולה לעומסי עבודה בעלי הקשר ארוך. עבור קלטים ופלטים גדולים, הפלטפורמה מציעה עד פי 1.5 עלות נמוכה יותר לכל טוקן בהשוואה לדורות קודמים. בנוסף, השקת תוכניתית תלויה מאפשרת למזער זמן בטלה ולשפר את יעילות הפלטפורמה.

השיפור בביצועים מתורגם לכלכלה מעולה, כאשר NVIDIA GB300 מפחיתה עלויות בהשוואה לפלטפורמת Hopper בכל ספקטרום ההשהיה. חברות כמו Microsoft ו-OCI כבר פרסו את GB300 NVL72 במקרי שימוש של השהיה נמוכה והקשר ארוך, ומאפשרות שימוש בזמן אמת ליישומים מורכבים.

העתיד נראה מבטיח עם פלטפורמת NVIDIA Rubin, שצפויה להציע עוד קפיצות ביצועים מאסיביות. Rubin תשלב שישה שבבים ליצירת מחשב-על AI אחד, ותספק עד פי 10 תפוקה גבוהה יותר לכל מגהוואט בהשוואה ל-Blackwell, מה שיאפשר אימון מודלים גדולים עם פחות משאבים.

הכתבה הזו מציגה תמונה מרתקת של התקדמות בתחום האינטליגנציה המלאכותית. האם לדעתכם פלטפורמות כמו Blackwell Ultra ישפיעו באופן משמעותי על פיתוח טכנולוגיות חדשות בעתיד הקרוב? נשמח לשמוע את דעתכם!