תקלה עולמית באתר Facebook – יד המקרה או יד מכוונת? דלג לתוכן

תקלה עולמית באתר Facebook – יד המקרה או יד מכוונת?

מאת אמנון מרגלית – מכללת מסד

בתאריך 5/3/24 ארעה תקלה עולמית באתר Facebook ובמשך שעתיים לא יכלו גולשים להתחבר לאתר. התקלה השפיעה גם על אתר Instagram.

 

נקיטת פעילות מונעת כמקדם לפי האירוע

על פי העיקרון של חשיבה מבוססת סיכונים והזדמנויות (ראו מהדורת 2015 של Iso9001) יכלה Facebook  לנקוט במספר פעולות מונעות כדי למנוע את תקלת הגישה לאתר שלה:

  • גיבוי נתונים: Facebook אמורה לוודא שקיים גיבוי מלא ותקין של כל הנתונים שלה, כולל קוד ותוכן. גיבוי זה היה מאפשר שחזור מהיר של האתר במקרה של תקלה.
  • ניטור מערכות: Facebook אמורה להטמיע מערכת ניטור מתקדמת שתתריע על כל בעיה פוטנציאלית במערכותיה. ניטור זה היה מאפשר זיהוי מוקדם של תקלות ותיקון שלהן לפני שהן משפיעות על משתמשים.
  • בדיקות עומס: Facebook אמורה לבצע בדיקות עומס קבועות כדי לוודא שהמערכות שלה מסוגלות להתמודד עם עומס גבוה של משתמשים. בדיקות אלה היו מאפשרות זיהוי צווארי בקבוק ותיקון שלהם לפני שהם גורמים לתקלות.
  • תוכנית התאוששות מאסון: Facebook אמורה להכין תוכנית התאוששות מאסון שתפרט את הצעדים שיש לנקוט במקרה של תקלה חמורה. תוכנית זו הייתה מאפשרת שחזור מהיר של האתר והשירותים שלו.
  • מודעות לאיומים: Facebook צריכה להגביר את המודעות לאיומים פוטנציאליים, כגון התקפות סייבר, ולנקוט בצעדים מתאימים להגנה מפניהם.
  • שימוש בארכיטקטורה מבוזרת: אדריכלות מבוזרת יכולה להפחית את הסיכון להשבתה של האתר כולו במקרה של תקלה.
  • שיתוף פעולה עם חברות אבטחה: שיתוף פעולה עם חברות אבטחה יכול לסייע לFacebook לזהות ולטפל באיומים פוטנציאליים.

 

סיבות אפשריות לתקלה מעין זו :

גם אם Facebook הייתה נוקטת בכל הצעדים הנ"ל, אין ערובה מוחלטת שתקלות לא היו מתרחשות. עם זאת, נקיטת צעדים אלה הייתה מפחיתה משמעותית את הסיכון לתקלות ואת ההשפעה שלהן על משתמשים. ננסה בכ"ז לנתח סיבות לתקלה שארעה .

  • תקלות טכניות:
  • א. שגיאה בתוכנה: שגיאה בקוד התוכנה של Facebook גורם לקריסת מערכות קריטיות, מה שמוביל להפסקת פעילות האתר.
  • ב. תקלה בתשתית: תקלת חומרה, כמו תקלה בשרתים או ברשת התקשורת, גורמת להפסקת השירות.
  • ג. עומס יתר: אתר חווה עומס חריג של משתמשים, מה שמוביל לקריסת המערכות.
  • ד. טעות אנוש: שעובד/ים של Facebook ביצע/ו טעות שגרמה לתקלה.

 

 

 

  • מתקפת סייבר:
  • א. מתקפת מניעת שירות (DDos) : האתר מותקף על ידי גורם זדוני באמצעות כמות אדירה של בקשות מזויפות, מה שמוביל להפסקת פעילותו.
  • ב. פריצה למערכות: פצחנים (Hackers) מצליחים לפרוץ למערכות Facebook ולגרום נזק לתשתית או לגנוב נתונים.
  • ג. מתקפת דיוג ((Phishing: פצחנים מתחזים לאתר Facebook ושולחים אלפי הודעות דיוג לגולשים במטרה לגנוב את פרטי הכניסה שלהם.
  • ד. התקנת תוכנות זדוניות: פצחנים (Hackers) מצליחים להתקין תוכנות זדוניות על מחשבים של משתמשים, מה שמאפשר להם לגנוב נתונים או לשבש את פעילות האתר.
  • גורמים חיצוניים:
  • א. תקלות חשמל: תקלת חשמל באזור שבו ממוקמים שרתי Facebook, מה שמוביל להפסקת פעילותם.
  • ב. חבלה: מאן דהוא גורם בזדון נזק מכוון לתשתית של Facebook, מה שמוביל להפסקת פעילות האתר.

 

ניתוח הסיבות במטרה להגדיר פעילות מתקנת

בניתוח אירוע כפי שלומדים הסטודנטים במכללת מסד, צריך לנקוט בתהליך שיטתי וסדור.
ניתן לקבץ את הסיבות לארבעת גורמי התהליך (4M)  ובכך לאפשר פעילות מתקנת.

 

 

מסקנות

בהתבסס על חשיבה מבוססת ניהול סיכונים יש לבצע פעילות של ניהול סיכונים מעבר לסיבות המפורטות לעיל כדי למנוע מראש או למזער היתכנות של תקלות נוספות.

לאור הניתוח הנ"ל עולה המסקנה שיש לבצע פעילות מתקנת טכנולוגית שתדע לטפל במתקפת דיוג, בפריצה למערכות ובעומס יתר ובכך לנסות לתקן את רוב גורמי התקלה שארעה. בהמשך יש לבצע פעילות מתקנת ליתר גורמי התקלה.

זאת לדעת, Facebook לא פרסמה עד כה את הסיבה הרשמית לתקלה וייתכן שהסיבה לתקלה היא שילוב של מספר גורמים. תקלות כאלה הן נדירות יחסית, אך הן עלולות לקרות לכל אתר אינטרנט גדול.

 

הערה: המאמר מתבסס בחלקו על מידע שנאסף דרך יישום GEMINI של GOOGLE

 

 

גלול כלפי מעלה