איתי בן דןאיתי בן דן

על חתולים והתגלית ששינתה את העשור

מה הקשר בין תמונות של חתולים ברשת, המהנדסים של גוגל ומניית אנבידיה? ואיך יכול מחשב לזהות את אותו חתול ספציפי בכל התמונות והסרטונים ברשת?
איתי בן דן | (4)

מה זה חתול? האם חשבתם מה גורם לכם כשאתם רואים חתול להבין שמדובר בחתול ולא בכלב, שועל, נמייה, גבר משופם ומדושן מעונג. מה מאפשר לנו בתור אנשים להבדיל, לזהות אנשים שאנחנו מכירים. עצרו לכמה שניות תעשו לרגע את התרגיל המחשבתי של מה גורם לנו כשאנחנו רואים חתול לזהות חתול.

טיק-טוק טיק-טוק... עשיתם? השפם? הפרווה? העיניים? הזנב? אם זו אחת התשובות שלכם אז אתם שקרנים. חתול הוא חתול כי ככה למדנו איך חתול נראה לרוב לפני שלמדנו לדבר כהלכה וזה מחווט אצלנו במוח.

מחשב לעומת זאת מקבל אלפי-מיליוני-מילארדי תמונות ומשתמש בעיבוד מידע מתוחכם בשביל ללמוד ממאפיינים שונים ומשונים של התמונה המתקבלת. אגדה בודהיסטית (אודנה, יש גם מקור הינדי) שממחישה את דרך הפעולה: שישה עיוורים שטרם נתקלו בפיל צריכים על ידי מישוש להגיע להבנה של מה זה פיל כאשר כל עיוור ממשש חלק אחר של הפיל בנפרד, חדק, אוזן ,פנים, רגל, עור הגוף, זנב, ישבן... האם העיוורים יוכלו להשתמש בתיאור המישוש הקולקטיבי להבין שמדובר בחיה שטרם מוששה על ידם ולהבין שמדובר בפיל?

במקום עיוורים ותחושות המישוש שלהם, למחשב יש פיצ׳רים, כאשר פיצ׳רים יכולים להיות חלקים מהתמונה, מספר הצבעים השונים ולמעשה כל פונקציה שאתם יכולים להעלות על דעתכם שמופעלת על התמונה או חלקים ממנה.

פיצ׳רים לזיהוי אופנוע

תנסו לחשוב כמה אנשים תוכלו לזהות, ממש לנקוב בשמם (כולל ידוענים וקים קרדשיאן) על סמך תמונה שיראו לכם, אם תגיעו למספר אלפים מצבכם טוב. כמה אנשים תצטרכו בשביל לזהות 100 אלף איש שונים??? לאנדרו נג (מדען עם התמחות בתחום למידת מכונה, לטעמי האדם עם ההבנה הרחבה והמעמיקה ביותר בתחום) ולמהנדסי גוגל היה ברור שפתרון של הבעיה יהווה הוכחה ניצחת לעליונות הטכנולוגית של טכניקות למידת המכונה והעיבוד המקבילי שהם פיתחו.

  

אנחנו אנושיים, ולכן ההתחלה מנסה לחקות באיזשהו אופן חשיבה אנושית, באופן גס ההבדל בין מחשבים לאנשים הוא שהזכרון ויכולת החישוב האנושי מוגבלת, מה שאנחנו עושים בלי להרגיש הוא המון קישורים אסוציאטיבים שכרגע (וככל הנראה גם בעתיד) נגיע להבנה מוגבלת של איך הקישורים האלה מתבצעים אם בכלל.

נחזור לבעיית החתולים. השאלות שהטרידו את חוקרי גוגל היו האם מחשב יוכל להבין מה הוא חתול בלי שיצטרכו להגדיר לו חתול? והאם מחשב יוכל לזהות את כל המופעים של חתול ספציפי בכל התמונות והסרטונים ברשת.

קיראו עוד ב"ניתוחים ודעות"

הבעיה הייתה שמדובר במיליארדי תמונות, בניית מאגרי הנתונים תיקח משאבי זכרון עצומים וגם אם זה יתבצע בהצלחה תהליך לימוד שינסה למצוא פתרון אופטימלי על כל הדוגמאות יהיה תלוי במכפלה של מספר הדוגמאות במספר העיבודים של כל דוגמא כלומר במקרה הטוב יארך אלפי שנים.

לקראת סוף העשור של שנות ה-2000 היו התקדמויות משמעותיות בתחום החישוב המקבילי, במילים אחרות חישוב שבו מספר תהליכים מתבצעים במקביל. השאלה הגדולה הייתה האם ניתן לבצע לימוד חלקי, כלומר על חלק מהדוגמאות, שהתוצאה בלימוד הזה תשפר משמעותית את התוצאה הכללית.

התשובות שניתנו לשאלה הזו בהקשר של למידת מכונה היו חלקיות ותאורטיות. בשביל להגיע לפתרון כלשהו של בעיית זיהוי כל תמונות החתולים ברשת לא הייתה ברירה חוץ מלהפוך את הבעיה לאוסף של המון תתי בעיות קטנות. המספר שאליו הגיעו מהנדסי גוגל הוא 160 אלף. כלומר הם היו צריכים לגרם לכ-160 אלף מחשבים (או מעבדים) לעבוד במקביל ולתקשר ביניהם על מנת ליצור מודל שבהנתן תמונת חתול ידע כי:

  1. מדובר בחתול.
  2. יימצאו את כל מופעי תמונת אותו חתול ברשת.
לכל מי שמזלזל מדובר לטעמי בהישג שאינו נופל משליחת רובוט למאדים (קיוריאסיטי 2012) בגלל הצורך בבעלי מקצוע מהשורה הראשונה בכל מה שקשור לחישוב מקבילי, הבנה בחומרה (קרי ניתוב מהיר, חיבורים פיזיים, תפירה של מערכות הפעלה ייעודיות), קומפילציה, עיבוד אותות ועוד ועוד. ההצלחה הגדולה הגיעה ממספר פריצות דרך משמעותיות:
  1. ייצוג חכם של תוצרי עיבוד הנתונים ובחירת ארכיטקטורת תוכנה וחומרה יעילה ויציבה.
  2. אופטימזציה רב שלבית חכמה (בניגוד לבעיות דומות כאן אין בדיוק דוגמאות שיש להן תוויות שניתן למדוד דיוק ביחס אליהן).
  3. חיבור מודלים שהתקבלו ממקורות שונים וביצוע אופטימיזציה של המודל  המאוחד.

בניית מחשב העל שזיהה חתולים עלתה מיליוני דולרים. בשביל להפוך את הגילוי ליעיל היה צורך במעבדים חזקים, מהירים, זולים יחסית, וביכולת להשמיש אותם כאן נכנסה לתמונה (תרתי משמע) לקראת 2013 חברה שפיתחה מאיצים גרפיים למשחקי מחשב בשם NVDIA.

בגלל הפוזיציה הקטנה שלהם, הם איפשרו גישה חופשית למהנדסים של גוגל על מנת להשמיש את המעבדים הגרפיים שלהם לדברים נוספים שישמשו אותם בחישובים, כך במקום מחשב על במיליוני דולרים אפשר היה לבנות מכונה בעלת יכולות דומות בעלות של עשרות אלפי דולרים. המנייה של NVDIA ותחום למידת המכונה מאז….

ב-2015 התפרסם שיתוף הפעולה בין גוגל ל-NVIDIA והשאר כמו שתראו בגרף המנייה של NVIDIA להלן.

כותב המאמר: איתי בן דן, מתמטיקאי, מומחה בשווקים הפיננסיים, עוסק בפיתוח של אלגוריתמים מתקדמים למסחר בבורסות שונות ופיתוח של כלים מתקדמים להשקעה

תודה לנטע שוהם ושימרית עובדיה על העזרה עם המאמר

תגובות לכתבה(4):

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
  • 4.
    הגהה חובה 25/02/2020 19:36
    הגב לתגובה זו
    מה יהיה עם הכתבות כאן? מי עובר על זה?
  • 3.
    ICייסי 25/02/2020 18:18
    הגב לתגובה זו
    איך קורה ששימוש במעבד גרפי חוסך מיליונים שהיו הולכים להשקעה במעבד מרכזי?
  • 2.
    פיני 25/02/2020 16:03
    הגב לתגובה זו
    כך מציגים ציר אופקי??
  • 1.
    איפה שיש חתול יש תרבות-:) (ל"ת)
    חיים 25/02/2020 15:58
    הגב לתגובה זו
כלכלת ישראל (X)כלכלת ישראל (X)

איך 270 כלכלנים ישראליים בכירים טעו לגמרי וכמה הפסיד מי שהקשיב להם?

על נבואות הזעם, על המשק הישראלי ועל הישראלים - הכלכלה הישראלית מפגינה עוצמה

ד"ר אדם רויטר |

בסוף ינואר 2023 יצא נייר עמדה שהתפרסם בכל כותרות העיתונים ותפס את הבמה המרכזית גם בערוצי הטלוויזיה ובו אזהרה חריפה "קיים חשש כבד שהחלשת מערכת המשפט תביא לפגיעה ארוכת טווח בתוואי הצמיחה של המשק, ובאיכות החיים של תושבי ישראל". 

 החותמים, קבוצה של 270 פרופסורים ודוקטורים לכלכלה ומנהל עסקים שמהווים את רוב האקדמיה הישראלית בתחומים אלו.

מה יגרום לפגיעה הזו בצמיחה? "הפגיעה ביכולת הממשלה והחברות לממן את עצמם, תביא לירידה בהיקף ההשקעות, והירידה תפגע בענף ההייטק הישראלי המהווה את הקטר של המשק ... וחברות ההייטק יעתיקו את מרכזיהן אל מחוץ למדינה". 


מה קרה בפועל?

חלפו שנתיים וחצי. זמן מספק לבחון את הדברים. רבים מאמינים שמעשי הממשלה גרמו לכך שמערכת המשפט נפגעה באופן חסר תקנה (נקווה שהם טועים ובכל מקרה דברים ניתנים לתיקון במהלך הזמן). אין כל ספק שרוטמן ולוין שהובילו את הקו ולאחריהם מספר שרי ממשלה, פעלו בשחצנות, בדורסנות ועשו כמיטב יכולתם על מנת לצמצם ולדחוק את כוחה של מערכת המשפט. 

 התקיפות משולחות הרסן, ההתעלמות החמורה מפסיקות בג"ץ, הניסיון לפוליטיזציה של המערכת והחשש העצום מלא פחות מאשר פירוק המדינה שחשים ציבורים מסוימים - נראה שכל אלו לא ממש הטרידו את מנוחתם של לוין, רוטמן ונוספים.

נראה שהחששות של הכלכלנים הבכירים בנוגע לפגיעה במערכת המשפט התממשו. אך מה קרה למשק הישראלי - תחום מומחיותם שבגינו התריעו?

תבלינים. צילום: Marta Branco, Pexelsתבלינים. צילום: Marta Branco, Pexels
בלוגסטריט

הרווחתם על מתכות נדירות? מה עם משאבי מזון נדירים?

יצרנית התבלינים הגדולה בעולם, יצרנית שוקולד, ספקית אגוזים ומגדלת אבוקדו - הכירו את חברות המזון המעניינות שמשקפות פוטנציאל עלייה 

זיו סגל |

לפני שנגיע להזדמנויות נדירות נתחיל עם גרף תוך יומי של האס אנד פי 500. הוא מראה את הקפיצה החדה בתחילת המסחר ביום שישי, את הירידה החדה בהמשך ואת העובדה שהמדד סגר בסופו של יום בירידה קלה. ללמדנו שאנחנו עדיין נמצאים באזור שיווי משקל. לחודש ספטמבר שיווי משקל זו תוצאה טובה והשאלה אם זה ימשיך כך.

בתרשים המוכר לנו מהשבועות האחרונים אנחנו רואים את הקו המחזיר העולה שבולם ולמעשה גורם לאס אנד פי להתכנס לתנודתיות צרה מאד. זאת מכיוון שמתחתיו מתקרב אליו הממוצע ל-21 יום שלמעט חריגה קטנה תומך ב-S&P500  מאז סוף חודש אפריל. 


מדד S&P תוך יומי
מדד S&P תוך יומי


דבר אחד בטוח. התנודתיות הצרה הזו לא תימשך עוד הרבה זמן ואנחנו צריכים להיערך לפריצה. השאלה לאיזה כיוון. אם אני צריך להעריך לפי האינדיקטורים הטכניים אז יש סיכון שהלחץ כלפי מטה יימשך. 

בכל מקרה יש לכם קווים ברורים לקבלת החלטות. סגירה משמעותית בזמן ובמחיר מעל 6532, הגבוה היומי של יום שישי, תיחשב פריצה למעלה וסימן למהלך עלייה מהותי בהמשך. סגירה מתחת ל-6360, שתהיה גם מתחת לממוצע הנע ל-21 יום וגם מתחת לפקודת ההיפוך הפרבולית, תהיה סימן לתחילתו של תיקון שבשלב הראשון שלו יגיע ל-6100-6200. 

אפשר עוד להצטרף לזינוק של הליתיום?

התשובה היא כן. אומנם הצגתי כאן את קרן הסל ILIT  לפני זמן מה והיא אכן בנתה מהלך עלייה יפה אבל יש לו פוטנציאל להימשך. ניתן לצפות שהקרן תעלה ל-13 דולר בשלב ראשון. אפשר להצטרף למגמה כל עוד מעל 10 דולר.