ענקית הטכנולוגיה מטא בלחץ וחוששת שסטארט-אפ סיני קטן יעקוף אותה במרוץ ה-AI. באתר החדשות דה אינפורמיישן צוין כי "מנהלי חלק מצוותי ה-AI בחברה הביעו בגלוי חשש שמודלי בינה מלאכותית חדשים, שפותחו על ידי DeepSeek, מעידים שמטא מפגרת במרוץ ה-AI". מניית מטא יורדת בכ-5% במסחר המוקדם בוול סטריט.
בנוסף צוין כי "מנהלים, כולל מנהל תשתיות ה-AI, אמרו לעמיתים רבים שהם מודאגים שהגרסה הבאה של מודל ה-AI של מטא, Llama, לא תתפקד טוב כמו ה-AI הסיני".
DeepSeek חשף בסוף דצמבר מודל שפה גדול חינמי בקוד פתוח בשם V3, שלדבריו לקח כחודשיים לבנות בעלות נמוכה מ-6 מיליון דולר. לצורך ההשוואה, גוגל ואנת'רופיק השקיעו מאות מיליוני דולרים כדי לאמן את המודלים הקיימים שלהם – והחברות מתכננות להמשיך להשקיע מיליארדים בעתיד. בדיווחים נכתב כי הם השתמשו בשבבים בעלי יכולת נמוכה יותר של אנבידיה בשם H800. במאמר ב-FT,צוין כי המודל החדש של DeepSeek פותח בעזרת 2,000 שבבים בלבד, בעוד המתחרות מפתחות בעזרת מחשבי על שבהם נעשה שימוש בכ-16 אלף שבבים לכל הפחות.
מודל החשיבה של DeepSeek הוא "אחת מפריצות הדרך המדהימות והמרשימות ביותר שראיתי – וכקוד פתוח, מתנה עמוקה לעולם", ציין המשקיע מארק אנדרסן ביום שישי האחרון ברשת החברתית X (לשעבר טוויטר).
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen – and as open source, a profound gift to the world. 🤖🫡
– Marc Andreessen 刚刚 (@pmarca) January 24, 2025
הוקמו ארבעה חמ"לים
בניסיון לתת מענה לתחרות המפתיעה, בדה אינפורמיישן צוין כי "מטא הקימה מספר חמ"לים, או קבוצות מיוחדות של חוקרים, כדי לנתח את DeepSeek ולהשתמש בתובנות לשיפור Llama, אמרו העובדים. מטא רמזה שהגרסה הבאה של Llama תשוחרר ברבעון הזה".
לפי הפרסום, נפתחו במטא ארבעה חמ"לים במטרה להבין איך עובדים מודלי השפה הסיניים. המטרה של שניים מתוך החמ"לים היא להבין איך הגיעו לעלויות הפיתוח וההפעלה הנמוכות, מתוך כוונה לשכפל את התהליך גם לפיתוח של Llama.
"קבוצת מחקר שלישית של מטא מנסה להבין באילו נתונים החברה הסינית עשויה הייתה להשתמש לאימון המודלים שלה", נכתב. ואילו החמ"ל הרביעי "שוקל טכניקות חדשות לארגון מחדש של המודלים של מטא בהתבסס על מאפיינים של מודלי DeepSeek". בנוסף צוין כי "מטא שוקלת להשיק גרסה של Llama שכמו DeepSeek, תכלול מודלי AI רבים, כל אחד מאומן לטפל במשימות שונות. כך, כשלקוח מבקש מ-Llama לטפל במשימה מסוימת, רק חלקים מהמודל יצטרכו לעבוד עליה".
בהצהרה מטעם מטא, צויין כי "אנחנו באופן קבוע מעריכים את כל המודלים המתחרים בתהליך הפיתוח שלנו ועשינו זאת מאז שקבוצת ה-AI היצרנית שלנו הוקמה".
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה אוטומטית ולא יפורסמו באתר.