מחפשים פתרון לחידה מתמטית (בעזרת AI)
מחפשים פתרון לחידה מתמטית (בעזרת AI)

מודל של OpenAI הפריך השערה מתמטית בת 80 שנה

מודל פנימי של החברה מצא דוגמה נגדית לבעיית מרחק יחידה של פאול ארדש מ-1946 - בעיה שעמדה בפני מתמטיקאים שמונה עשורים. ההוכחה אומתה במסמך נלווה בידי תשעה מתמטיקאים חיצוניים, והריצה עלתה לפי הערכה פחות מ-1,000 דולר


ענת גלעד |
נושאים בכתבה חידה מתמטית OpenAI

אחד המודלים של OpenAI הפריך השערה מוכרת בגאומטריה קומבינטורית, הקשורה ל"בעיית מרחק יחידה" שמזוהה עם פאול ארדש. לא מדובר בעוד טריק של חישוב מהיר או בפתרון תרגיל אולימפיאדה, אלא בתוצאה שסותרת השערה ותיקה: לא אישור של מה שחשבו, אלא מציאת דוגמה נגדית.

בעיית מרחק יחידה בנוסח הפשוט שלה נשמעת כמעט תמימה: מציבים n נקודות במישור, ושואלים כמה זוגות נקודות אפשר ליצור כך שהמרחק ביניהן יהיה בדיוק 1. ארדש הראה כבר ב-1946 שסידור רשת מסוים מייצר מספר גדול של זוגות במרחק הזה, והוא שיער שאין דרך "לנצח" את הסידור הזה בהרבה. במשך עשורים ניסו חוקרים לחזק, לחדד או להוכיח וריאציות של הרעיון. OpenAI טוענת עכשיו שהמודל שלה מצא סידור אחר שמניב יותר זוגות, וההשערה כפי שנוסחה נופלת.

ההפתעה נגעה לדרך לא פחות מאשר לתוצאה: ב-OpenAI מתארים מצב שבו החוקרים עצמם הפעילו את המודל כניסוי פנימי כדי לבדוק עד כמה הוא מתקדם מול גרסאות קודמות. כשנחשפה ההוכחה, התגובה הראשונית הייתה ספקנות, ואז התחיל תהליך אימות. החברה מציינת שבדקה את הטיעון, חיפשה כשלים, והצליבה את התוצאה עם גורמים חיצוניים וכלים פנימיים נוספים. במקביל פרסמה OpenAI מסמך נלווה עם הערות של מתמטיקאים, כדי לתווך את הפתרון לקהילה שאינה ממהרת להתרשם.

ארדש נחשב לאחד המתמטיקאים הפוריים בהיסטוריה. "בעיות ארדש" הן שם כולל לאוסף שאלות שהציב לקהילה, לעתים עם פרסים כספיים קטנים כמסורת. לבעיית מרחק יחידה יוחס פרס של 500 דולר. גם כשהתגמול הכספי הוא בעיקר סמלי, עצם הבחירה של ארדש להבליט את השאלה מסמנת עד כמה היא נחשבה מרכזית.

למה מודל מצליח במקום שבו מתמטיקאים נתקעו

רבים מהניסיונות ההיסטוריים יצאו מההנחה שההשערה של ארדש כנראה נכונה, ולכן הושקע מאמץ בכיוון של הוכחה. המודל, לפי התיאור, "התיר לעצמו" לנסות אסטרטגיות שנראות מוזרות או לא סבירות, ולחפש באופן שיטתי גם דוגמה נגדית. זה הבדל תרבותי לא קטן: מתמטיקאים יודעים שדוגמה נגדית שוברת השערה, אך בפועל הרבה מזמן המחקר נשאב למקום שבו התחושה המקצועית אומרת "זה אמור להיות נכון".

גורם נוסף נוגע לסינתזה בין תחומים. במתמטיקה מודרנית יש התמקצעות עמוקה: מי שעוסק בגאומטריה דיסקרטית לא בהכרח "מדבר" את השפה של תורת המספרים האלגברית. ב-OpenAI טוענים שהמודל השתמש בשני העולמות יחד. לא קסם, אלא תוצאה של מאגר ידע גדול והיכולת לחבר דפוסים - חיבור שלא תמיד קורה אצל בני אדם, לא בגלל מגבלה אינטלקטואלית אלא בגלל מבנה מקצועי של התמחות.

רצף חשיבה של 75 אלף מילים, פחות מ-1,000 דולר

משאב נוסף הוא ההתמדה. המודלים מחזיקים רצף עבודה ארוך ועקבי בלי ההתשה האנושית של זמן, קשב ושגרה. גרסה מקוצרת של מהלך החשיבה הפנימי שהוביל לפתרון הגיעה לאורך של יותר מ-75 אלף מילים - סדר גודל של רומן. חוקר לשעבר בחברה העריך שהריצה ארכה פחות מ-32 שעות ועלתה פחות מ-1,000 דולר בטוקנים. OpenAI לא אישרה את המספרים במדויק, אך ציינה שהעלויות לא היו חריגות. לא פרויקט שדורש מעבדות עתק, אלא משאב מחשוב שנראה נגיש לחברה גדולה, ועם הזמן עשוי להפוך זמין גם לאקדמיה.

להרחבה: אנבידיה שוקלת השקעת ענק ב-OpenAI בשווי של 730 מיליארד דולר

עד לא מזמן מודלים התקשו בחשבון בסיסי. בתקופה קצרה יחסית הם הגיעו לרמה שמדווחת כמתקרבת למדליות זהב באולימפיאדות, ועכשיו מדובר בטענה לפתרון בעיה קלאסית עם הוכחה שאמורה לעבור סף של קבלה אקדמית. היכולת לייצר טיעונים מתמטיים ארוכים, עקביים ומקוריים מפסיקה להיות ניסיונית. ב-OpenAI מדברים על מודל שמרחיב את מרחב החיפוש, מציע קונסטרוקציות, ומאפשר לחוקרים להתמקד בהבנה, בהכללה ובפיתוח תורות חדשות.

להרחבה: העתיד על פי OpenAI - מכשירי קצה ועולם עם פחות מסכים

את המסמך הנלווה שאימת את התוצאה כתבו תשעה מתמטיקאים חיצוניים

הוספת תגובה

תגובות לכתבה:

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה