
סקנדל ב-MIT: המחקר המצוטט על AI התגלה כפייק
המנחה פרופ' לכלכה וחתן פרס נובל החמיא למחקר, המחקר הפך להיות אחד המצוטטים בתחום הכלכלה ושוק העבודה והתגלה כזיוף; הבעיה: חלק גדול מהחומר האקדמי הוא פייק: מפרופ' דן אריאלי דרך פרופסורית בהרווארד ועד לעבודות שנעשות בעזרת AI; וגם - 5 עובדות על פייק באקדמיה
איידן טונר-רודג'רס, סטודנט דוקטורנט במחלקה לכלכלה במכון הטכנולוגי של מסצ'וסטס (MIT), פרסם בתחילת 2025 מאמר תחת הכותרת "בינה מלאכותית, גילוי מדעי ותוצאות בשוק העבודה". המאמר תיאר ניסוי שבו כלי AI להאצת גילויי חומרים הוענק למדענים במעבדה גדולה בארה"ב, והוביל לעלייה של 25% בפריון, כמות גבוהה יותר של פטנטים וחדשנות מוגברת.
המחקר זכה לתשומת לב מיידית: הוא צוטט בכתבי עת מרכזיים, דווח בעיתונים ואתרים וצויין לשבח על ידי כלכלנים בכירים כולל דייוויד אוטור ודרון אסמוגלו, חתן פרס נובל בכלכלה.
הנתונים הוצגו כמבוססים על ניסוי אמיתי עם 1,018 מדענים במעבדת מחקר ופיתוח של חברה אמריקאית בתחום חומרים. טונר-רודג'רס טען שהכלי AI, שפותח על ידי חברה חיצונית, שיפר את היעילות בכימות תכונות חומרים, מה שהשפיע על שוק העבודה בכך ששמר על רמות תעסוקה גבוהות תוך הגברת הפרודוקטיביות. הוא כלל ניתוח סטטיסטי מפורט, גרפים חלקים ותוצאות עקביות שתמכו במסקנה: AI יכול להאיץ חדשנות מבלי לפגוע בתעסוקה.
החשדות עלו כמה חודשים לאחר מכן, כשבלוגר עצמאי בשם בן שינדל פרסם פוסט שבחן את הנתונים. שינדל ציין סתירות: הנתונים היו נקיים מדי, ללא וריאציות טבעיות, והתוצאות התאימו באופן מושלם למסקנות הרצויות. הוא בדק את כתובות הדוא"ל שטונר-רודג'רס ציין כמקורות לנתונים, ומצא שהן אינן קיימות או שייכות לחברות שלא אישרו שיתוף פעולה. חברות כמו קורנינג ו-3M, שזוהו כמעורבות אפשריות, הכחישו כל קשר לניסוי. בדיקה נוספת גילתה שהסכמי השימוש בנתונים שהוצגו היו מזויפים, כולל חתימות דיגיטליות שלא ניתן לאמת.
החקירה וההדחה מ-MIT
הגילוי הועבר לפרופסורים אוטור ואסמוגלו, שהיו מנחים של טונר-רודג'רס. הם הפנו את העניין לוועדת אתיקה פנימית ב-MIT, שפתחה חקירה סודית. הוועדה בדקה את קבצי הנתונים הגולמיים וגילתה חוסר בהוכחות לניסוי המקורי. המסקנה הייתה חד-משמעית: הנתונים נוצרו באופן מלאכותי. טונר-רודג'רס לא סיפק הסברים משכנעים, והודה חלקית בזיוף במהלך השימוע. MIT פרסמה הצהרה רשמית: האוניברסיטה אינה תומכת עוד במאמר, וקראה לאתרים להסירו. טונר-רודג'רס סולק מ-MIT והמאמר נמחק מהפלטפורמה.
המקרה חשף בעיות עמוקות יותר בתהליכי הפיקוח האקדמי. ב-MIT, כמו במוסדות רבים, סטודנטים דוקטורנטים אחראים על איסוף נתונים עצמאי, עם ביקורת מוגבלת בשלבים מוקדמים. המאמר פורסם כמקדים ללא ביקורת עמיתים, מה שאפשר לו להתפשט במהירות. בעקבות הפרשה, המחלקה לכלכלה ב-MIT עדכנה את הנהלים: כעת נדרשים סטודנטים להגיש נתונים גולמיים עם קוד הניתוח, וועדות אתיקה יבדקו דגימות אקראיות ממחקרים בשלבי פרסום ראשוניים. דרישה נוספת היא שיתוף פעולה עם מנטורים בשלבי איסוף הנתונים, כדי למנוע בידוד שמאפשר זיופים.
אין תירוצים לזיופים, אך צריך להגיד שחלק גדול מאוד עם לא כל העבודות הקיימות כיום מקבלות השראה מעבודות אחרות. השאלה היא רק עד כמה מחקר אחד נשען על אחר. זיופים ופייקים באקדמיה הם רבים הרבה יותר ממה שמתפרסם. זאת במקומות לא מעטים דרך עבודה. מעבר לכך, הלחץ בעולם המחקר תורם גם לתופעות כאלה, כשקיימת תחרות על מימון ופרסומים, במיוחד בתחום AI, שמושך השקעות רבות. סטודנטים צעירים נמדדים על פי פרסומים מוקדמים, מה שיוצר תמריץ למהירות על חשבון דיוק.
- בשורה רפואית - תרופת הכולסטרול של מרק עם תוצאות מרשימות; המניה זינקה
- תוכן שיווקי שוק הסקנדרי בישראל: הציבור יכול כעת להשקיע ב-SpaceX של אילון מאסק
- בשורה רפואית - תרופת הכולסטרול של מרק עם תוצאות מרשימות;...
במקרה של טונר-רודג'רס, הרקע שלו, בוגר אוניברסיטת סטנפורד עם רקע בהנדסה, הציב ציפיות גבוהות ואולי גרם למנחים המכובדים שלו שלא לבדוק ולהתעמק בעיקרי העבודה הנתונים והממצאים. אי אפשר שלא להאשים באופן מסוים את המנחים. הם בסוף אחראים על התוצר ועל פרסומו.
תרמיות אקדמיות דומות בעבר
כאמור יש אלפי ורבבות מקרים, אבל רובם לא מתגלים ולא יוצאים החוצה. מקרה מפורסם הוא של מייקל לה-קור מלפני כעשור. סטודנט דוקטורנט בפוליטיקה באוניברסיטת UCLA פרסם מאמר בכתב העת Science על שינוי דעות פוליטיות דרך שיחות אישיות. הנתונים התבררו כמזויפים - לה-קור המציא ראיונות עם אלפי משתתפים, כולל פרטים אישיים שלא ניתן לאמת. החשיפה הגיעה לאחר שבודק עצמאי לא הצליח לשחזר את הנתונים.
לפני כשנתיים היה מקרה מפורסם של פרנצ'סקה גינו - פרופסור בהרווארד נחשפה כמי שזייפה נתונים במחקרים על כנות. גינו, שחקרה את הסיבות לשקרים, שינתה תוצאות בסקרים ובניסויים כדי להתאים למסקנותיה. החקירה החלה מחשדות של עמיתים והובילה לפיטוריה.
יש גם מקרה ישראלי מוכר - דן אריאלי החוקר הישראלי-אמריקאי מדיוק הואשם בזיוף נתונים במחקר על חתימה ידנית שמשפיעה על התנהגות. המקרה עורר דיון על כך שחוקרים שחוקרים שקרים עלולים להיות מושפעים מהנושא עצמו.
באוניברסיטת מינסוטה, סטודנט דוקטורנט סולק לאחר שהואשם בשימוש ב-AI לכתיבת עבודת גמר. באילינוי, סטודנטים נתפסו בהעתקה בעזרת AI, ואז השתמשו בכלים דומים כדי לכתוב התנצלויות. בייל, סטודנט במסלול עסקים תבע את האוניברסיטה על השעיה בגלל שימוש ב-AI, וטען שהמדיניות לא הייתה ברורה. מקרים אלה מראים כיצד AI, שנועד להאיץ מחקר, הופך לכלי זיוף: כלים כמו ChatGPT יכולים לייצר נתונים מדומים או מאמרים שלמים, מה שמקשה על זיהוי.
בתחום הכלכלה, היו מספר תרמיות מפורסמות - תרמית של גלן בגמן מ-2001, פרופסור באוניברסיטת סטנפורד שזייף נתונים על מדיניות מוניטרית, ודייוויד גודמן שהודה ב-2011 בזיוף נתונים על סחר בינלאומי.
הפרשה של טונר-רודג'רס עושה רעש ובמוסדות האקדמיה דנים כעת בהנחיות חדשות לפרסום מקדים, כולל חובת אימות נתונים, כמו כן האקדמיה מנסה לפתח כלים אוטומטיים לזיהוי זיופים, כמו בדיקות סטטיסטיות על חריגות.
5 עובדות על זיופים באקדמיה
1. קו הגבול בין השראה להעתקה: לא תמיד ברור
בעולם האקדמיה, כמעט כל עבודה מסתמכת על עבודות קודמות, זוהי תשתית המחקר. אך הגבול בין השראה לגניבה אינטלקטואלית הוא דק ולעיתים מעורפל. סטודנטים עלולים לנסח מחדש רעיונות קיימים מבלי לציין את המקור או להסתמך על ניסוח דומה מדי, מה שמעמיד שאלה: האם מדובר בהבנה עצמאית או בשכתוב לא מקורי? במקרים כאלה, גם בלי כוונה להונות, התוצאה עלולה להיחשב כפלגיאט. לכן באקדמיה מקובל להחמיר גם עם טעויות שנובעות מחוסר הבנה, ולא רק עם ניסיונות זיוף מודעים.
2. גניבת תוכן נפוצה יותר ממה שחושבים
על פי מחקרים, כ־33% מהסטודנטים הודו שהעתיקו טקסטים לפחות פעם אחת במהלך לימודיהם. כיום, בעידן הבינה המלאכותית והגישה החופשית למאגרים אקדמיים, הפיתוי להעתיק גדל. חלק מההעתקות נעשות באמצעות כלים אוטומטיים, שכתוב טקסטים קיימים, תרגום מרושל של מאמרים זרים או שילוב מקורות מבלי לתת קרדיט. מרצים מדווחים על עלייה בעבודות "חשודות", בעיקר בשל חוסר עקביות בסגנון הכתיבה והיעדר התאמה לרמת הסטודנט. מוסדות רבים נלחמים בכך באמצעות תוכנות מתקדמות לאיתור פלגיאט.
3. זיוף נתונים: הבעיה העמוקה של מחקרים מתקדמים
בעבודות מחקר לתארים מתקדמים, לא מדובר רק בהעתקת טקסט, אלא בזיוף נתונים, יצירת ניסויים שמעולם לא התקיימו או עיבוד ממצאים לא מדויקים כדי "להתאים" אותם לתזה. מקרים כאלה מסכנים את אמינות המדע כולו. לעיתים קרובות, המחקרים הללו מתקבלים לפרסום בכתבי עת מובילים לפני שמתגלה התרמית. כאשר מדובר בתחומים מדעיים או כלכליים שבהם קשה לבדוק את הנתונים המקוריים, האחריות על שקיפות ואימות היא קריטית, והאכיפה לעיתים לקויה.
4. לחצים אקדמיים כמנוע לזיוף
סטודנטים לתארים מתקדמים, במיוחד באוניברסיטאות יוקרתיות, פועלים תחת לחץ עצום להצטיין, לפרסם ולבלוט. סביבת התחרות יוצרת מצב שבו חלקם רואים בזיוף או בעיגול פינות פתרון קל ללחצים. הרצון להרשים מנחים, להיכנס לקונגרסים חשובים או להשיג משרות אקדמיות גורם "למתוח את הגבולות". כשאין ביקורת מוקדמת על הנתונים, הדרך לזיוף קלה יותר. מכאן עולה חשיבותו של פיקוח שיטתי, כולל גישה לנתונים הגולמיים.
5. מוסדות אקדמיים מחמירים, אך רק לאחר פיצוץ פרשייה
למרות קיומם של קודים אתיים ברורים, מוסדות נוטים לגלות גמישות או עצימת עין. רק כשמתפוצצת פרשייה, כמו במקרה של איידן טונר-רוג'רס ב-MIT, מופעלים בדיעבד בדיקות וגם אז, לעיתים התגובה מוגבלת, בעיקר בשל החשש לפגיעה במוניטין המוסד. האקדמיה מגיבה באיחור למקרים קיצוניים, ורק לאחר שהנזק נחשף לציבור.
