הבלוג של ארתיום
בלוג על מוזיקה, סלסה, לינוקס, תוכנה חופשית ומה לא!
מאמרים בנושא "LaTeX ועברית"
התעוררות מסביב ל־BiDiTeX?
בימים אחרונים הרגשתי התעוררות מסוימת מסביב ל־BiDiTeX. גם כמות ההורדות של הגרסה האחרונה הגיע ל־20. אני יודע שזה לא הרבה בממדי תוכנה אבל עדיין זה כ־20% מהורדות של culmus-latex שנותן תמיכה בעברית בכלל. לאחרונה, אפילו קיבלתי בקשה לנסות ולהכניס את החבילה למאגרים הרשמיים של Debian.
אני התחלתי את הפרויקט קצת לפני יותר משנה וממשיך לבצע עדכונים מעת לעת, כדי לפתור בעיות קטנות שאני מגלה. התכנה הקטנה הזו, משמשת אותי כל הזמן לכתיבת מסמכים לא כל־כך קצרים בעברית ועוזרת לי המון. למעשה, מבחינתי בלעדיה, LaTeX ועברית לא היום קיימים ביחד.
עם כל זה, מה שמאוד חסר לי זה משוב מהמשתמשים:
- באילו בעיות הם נתקלים? מה חסר להם?
- היכן ניתן לשפר את התיעוד?
- אולי הצעות מועילות מה אפשר להוסיף.
כמובן, שאני לא מבטיח שאענה על כל הבקשות ודרישות, אבל אני בהחלט אשמח לעשות קצת יותר בכל הנוגע לשיפור של מצבה של עברית ב־LaTeX.
תכנה חופשית, תיעוד ומה שביניהם
למרות שניסיון שלי בתחום פיתוח תכנה חופשית יכול להסתכם בכמה שנים של עובדה אקראית על פרויקטים שונים, למדתי משהו מאוד חשוב. לכתוב תכנה טובה, זאת משימה מאוד חשובה, אבל, זאת רק חצי מכל העובדה.
הבלוג הזה מתעסק בעיקר בתוכנה חופשית ופיתוח. חלק גדול מקוראי הבלוג, יודעים לכתוב קוד וגם יודעים לעשות את זה מצוין. אבל כמה מכם אוהבים לכתוב תיעוד? כמה מכם יודעים לפתוח מעבד־תמלילים, wiki או כל כלי אחר עם סיום העבודה ולתעד את השינויים: בממשק הספריות, לכתוב דוגמאות שימוש, הסברים על הבדלים מול הגרסה הקודמת? ממש לא כולם. מה שעוד יותר חשוב, רובינו, המפתחים, די סולדים מכתיבת המסמכים, אנחנו טובים בכתיבת הקוד, אבל לא בתיעוד.
המשך...שוחררה גרסה 0.0.8 של BiDiTeX -- תיקון של באג
שוחררה גרסה 0.0.8 של BiDiTeX. הגרסה מכילה מעקף לבאג בספריית fribidi שגרם למסמכים מקודדים ב־cp1255 וכוללים סימני LRM/RLM לא להתקמפל ב־LaTeX.
הבעיה היא בפונקציות שממירות מקידוד cp1255 ל־Unicode ולא מתייחסות לשני הסימנים האלו. בגלל שבאופן פנימי fribidi עובדת עם unicode אז המרה של מסמכים האלה הייתה לא תקינה והם לא עבדו כראוי, בנוסף לזה הם לא הוסרו בטקסט שמועבר ל־LaTeX וגרמו להודעות שגיאה. הבאג הזה לא רלוונטי לאלו שהטקסט המקורי שלהם שמור ב־UTF-8 והמסמך מומר ע"י BiDiTeX ל־cp1255.
הודעה נוספת חשובה היא שאיגוד האינטרנט הישראלי לא יוכל לספק אתר המראה לפרויקט, מכיוון ש־SourceForge לא נותן שירותי rsync לצרכים אלו. אל תשתמשו יותר באתר המראה, הגרסאות שם לא יהיו עדכניות.
שוחררה גרסה 0.0.7 של biditex עם תמיכה בתווים LRM/RLM.
שוחררה גרסה חדשה של BiDiTeX. למרות שהתיקון כולל סה"כ לא יותר מעשר שורות, הוא מספיק חשוב לצורך שחרור גרסה חדשה.
במה מדובר?
נגיד אתם מסבירים על קריאה לפונקציה "getchar()" בתוך הטקסט בעברית. אם אתם תכתבו כפי שזה getchar ולאחר מכן "(" ו־")" תגלו שהסוגריים יופיעו בצד השני בצורה הבאה: "getchar()" או לחילופין, אם תרצו לכתוב נתיב במערכת UNIX, למשל "/etc/hosts" תגלו שהוא נראה כך: "/etc/hosts", כלומר קו נטוי מופיע בהתחלה במקום בסוף.
הסיבה היא שאלגוריתם bidi משייך את הסימן "/" וסימני "()" לתווים המשתייכים לטקסט בעברית – כי הם נמצאים בגבול בין עברית לאנגלית.
אז כיצד לפתור את הבעיה? אמרנו שהסימנים "/" או "()" משתייכים לטקסט העברי לא אנגלי, אז אם נכתוב getchar() A או A /etc/hosts ונגלה שזה עובד כפי שאנחנו רוצים, למעט העובדה שאנחנו לא צריכים את "A". פה בדיוק באים הסימנים LRM ו־RLM – סימני "כיווניות חזקה" בלתי נראים. אם נחליף את A בסימן בלתי נראה בעל כיווניות "שמאל לימין" הכל יסתדר.
כך גם אם נרצה לתקן את המשפט: "ASP פירושו Active Server Pages. PHP פירושו…" נצמטרך להכניס תו עברי בין "Pages" לבין "PHP". אז ניתן להכניס תו כיווניות בלתי נראה השני וזה יראה: "ASP פירושו Active Server Pages. PHP פירושו…" כפי שרצינו.
ניתן להכניס את התווים האלה בעזרת Shift+T ו־Shift+Y ב־Linux עם פריסת מקלדת lyx: תו LRM ו-RLM בהתאם. ב־Windows צריך להקליד Alt+0253 ו־Alt+0254 על מנת להכניס את התווים האלה, תשימו לב שכאשר אתם מקלידים Alt+0253 וודאו כי פריסת המקלדת היא עברית אחרת תקבלו תו "ý" במקום סימן LRM.
חייב לציין, שעד לא מזמן לא הבנתי כיצד להשתמש בהם לכן פשוט שכחתי להתייחס אליהם ב־BiDiTeX.
עברית, LaTeX, מסמכים ומה שביניהם.
בתוקפה אחרונה, אני מצאתי את עצמו כותב לא מעט מסמכי עבודה פנימיים בעברית בעזרת LaTeX. מאחר ורוב המסמכים שכתבתי היו פנימיים לחלוטין ורק אני הכנתי אותם אז לא הייתה שום בעיה להכין אותם בעזרת כל כלי שמספק פתרון הולם, כל עוד התוכן של המסמכים הוא עונה על הדרישות.
כידוע, LaTeX ועברית לא חיים בצורה מאושרת ביחד ועושים לא מעט בעיות לאלו שמנסים לכתוב ב־LaTeX בפעם הראשונה. מצד שני, אחרי שלומדים את השיגעונות הבסיסיים ומתרגלים לעבוד עם BiDiTeX, אז מגלים שעולם כתיבה המסמכים נראה הרבה יותר טוב.
המשך...