טכנולוגיית OCR חדשה שפותחה בישראל הצילה מאובדן 11 אלף ספרים עתיקים בעברית

ספריית האגודה לשימור ספרים בניו-יורק עשתה שימוש במוצר של חברת ליגטורה הישראלית על מנת להעלות 11 אלף ספרים בעברית לרשת האינטרנט

11 אלף ספרים בעברית, ובכללם אלפי ספרים עתיקים שמצויים ברשותה של ספריית האגודה לשימור ספרים בניו-יורק, הועלו השבוע במלואם לרשת האינטרנט ויהיו זמינים לכל גולש ללא תשלום. חלק ניכר מהספרים שמצויים בספריה הוירטואלית הגדולה בעולם בעברית הם ספרים עתיקים, שפגעי הזמן איימו לכלותם והעלאתם לאינטרנט נועדה לשמר אותם לדורות הבאים.

הפרויקט בוצע באמצעות טכנולוגיית OCR (זיהוי תווים אופטי) חדשנית שפיתחה החברה הישראלית ליגטורה מקבוצת ויזקום. הטכנולוגיה מאפשרת המרה של סריקות לקובצי טקסט בעברית שניתן לחפש בהם. בקבצים אלו, המערכת מוסיפה שכבת טקסט מתחת לשכבת התמונה וכך נוצר קובץ בעל שתי שכבות: העליונה - הנראית למשתמש - היא התמונה הסרוקה, והתחתונה היא שכבת הטקסט.

בין הספרים שניצלו מאבדן: חומש מראשית הדפוס העברי מ-1492, שו"ת בעניין התרת עגונה מהטיטניק משנות ה-20 של המאה הקודמת, ספרי רבנים מאירופה מלפני 400-300 שנה וכן הלכות כשרות על הירח בעקבות נחיתתה של אפולו 12 על הירח ב-1969.

את הפרויקט יזמה האגודה לשימור ספרים בעברית בניו-יורק. האגודה הוקמה לפני כעשור ללא כוונת רווח, במטרה לדאוג לשימורם של כתבי יד בעברית. את הספרים השיגה האגודה באמצעות תרומות כמו גם באמצעות נבירה בפחי האשפה בשכונות יהודיות בניו-יורק לפני חג הפסח.

חיים רוזנברג, מנהל ומייסד האגודה לשימור כתבי יד בעברית בניו-יורק, שעוסק במלאכה בהתנדבות: "חלק מאוצרות התרבות שמצויים בספריה הודפסו בנייר שאינו יכול להחזיק מעמד שנים כה רבות. הטכנולוגיה של ליגטורה אפשרה לנו לא רק לשמר את הספרים, אלא גם להביא לכך שהם יהיו נגישים לכל קורא בעולם".

גיורא שמעוני, ליגטורה: "אמנם מוקדם מדי לדבר על היעלמותה של הסימנייה ו/או הצלה של יערות הגשם, אולם הטכנולוגיה לספריה וירטואלית נמצאת כבר כאן ועכשיו, גם בעברית, ואנו צופים כי בעתיד הקרוב גם ספריות וגופים אחרים יאמצו פיתרון זה, שמלבד היתרונות של הגברת הנגישות לספרים ושימורם, הוא מעניק גם כלי מחקר חשוב ביותר של חיפוש בטקסטים".

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה