פורטל ידע

ניהול הנתונים – Data Management - הנושא החם ביותר בתעשייה


 

מאת: קוסטין מרזה | SmartStreams CTO

 





ניהול הנתונים – Data Management הנו הנושא החם ביותר בתעשייה. והסיבה לכך היא ברורה: מספר היישומים רעבי נתונים ומספר צרכני הנתונים גדל במאות אחוזים בזכות הטרנספורמציה הדיגיטלית. מצד שני החברות לא התארגנו להגשת הנתונים בתפיסה הקמעונאית כשהנתונים, מוצר בעל ערך רב, מוגדרים ומבוקרים באופן שוטף לא רק בהגשה אך גם בשימוש.


למרות המודעות הגוברת לצורך בניהול הנתונים, מושג זה על כל משמעויותיו אינו ברור כלל וכלל לארגונים. ניהול הנתונים נשמע יותר קרוב לטכנולוגיית אחסון כאשר בפועל מתייחס בין השאר, להגדרת הסטנדרטים לטיפול בנתונים לאורך מחזור חייהם ולתהליכי הבקרה על העמידה בסטנדרטים שנקבעו (Data Governance).


המתודולוגיה המוצעת הינה הדרך הבטוחה והמוכחת ליישום אסטרטגיית הנתונים של כל ארגון.


המטרה לקביעת אסטרטגיית טיפול בנתונים היא בעיקר לקרב את הדרג העסקי לדרג הטכנולוגי באמצעות ארכיטקטורת נתונים ברורה לשני הגורמים. הנתונים הם השפה המשותפת לשני הדרגים ולכן מידול הנתונים שמתאר את המודל העסקי, ברמה קונספטואלית ותהליכית לפני הרמה הטכנולוגית היא קריטית להצלחת האסטרטגיה. עד אז לא יועילו קטלוגים של נתונים, פלטפורמות לניהול Data Science, Machine Learning או וירטואליזציה של מחסני נתונים בכל פלטפורמה חדשנית ככל שתהיה. קצב השינויים במודלים העסקיים בעידן הטרנספורמציה הדיגיטלית קובעת את תדירות השינויים במודלים האנליטיים וה-DevOps אינו שחקן במגרש הזה. בהקשר זה חשוב להזכיר את

משפטו של Tim Berners-Lee ממציא האינטרנט:

”Data is a precious thing and will last longer than the systems themselves.”


תהליך הגישור בין המשתמשים העסקיים למחלקות הטכנולוגיות כרוך במספר שלבים מקדימים בחלקם קשורים למבנה הארגוני אך רובם קשורים לסטנדרטים של עבודה. חלק מן השלבים לא בוצעו בעבר ברוב הארגונים ומתייחסים ליצירת תשתיות מוחשיות, מתועדות בצד העסקי. למשל:


  1. תרשים המודל העסקי/מבצעי של הארגון. המודל צריך לתאר במדויק, אך ברמת על, לא רק את הפעילויות המתבצעות בתוך הארגון אלה גם את יחסי הגומלין עם כל הגורמים החיצוניים (ecosystem) המעורבים בפעילותו.

  2. בניית מודל נתונים קונספטואלי/לוגי דרוש לא רק לתפעול השוטף של הארגון אלה גם לצורך שילוב אנליטיקה מתקדמת כחלק אינטגרלי מתהליך קבלת ההחלטות. כיום המודלים האנליטיים הם בעיקר דפנסיביים (מנסים לזהות ולהבין מה שכבר קרה) במקום להיות אופנסיביים, להגדיר מראש KPI ו-KBI שיסייעו לארגון להעריך ולצפות את הסיכונים לפני התרחשותם.

  3. בנית מודל תהליכים.

  4. ניהול כל רכיבי המידע/נתונים בהקשר העסקי באמצעות קטלוג נתונים, מילון מונחים עסקיים.

  5. הדרכת משתמשים עסקיים בכל מה שנוגע לנתונים בהיבט העסקי לא טכנולוגי, כדי לסייע להם בהגדרת צרכיהם וסיוע לאפיון תהליכים. כיום המשתמשים העסקיים אינם נחשפים/מודעים לזרימת הנתונים בתוך הארגון ומחוצה לו על כל משמעויותיו. באחד הפרויקטים בחברת ביטוח גדולה בצענו טיוב נתוני מעסיקים עבור ארבע מערכות שונות.

  6. בסופו של דבר מתקבלת ארכיטקטורת נתונים מבוססת על התחומים העסקים השונים (Data Domain) שהיא ברורה גם לגורמים העסקיים וגם לגורמים הטכנולוגיים.



חשיבה זאת צריכה להנחות את הדרג הניהולי הבכיר ביותר בבחירת הדרך למימוש הפוטנציאל הקיים בנתונים. הדרך הנוכחית של בחירת טכנולוגיות לטיפול בנתונים ברמת אחסון, שליפה, מידול אנליטי וויזואליזציה לא הוכיחה את עצמה. אין סטנדרטים, אין שקיפות וגם לא שיתוף. מחקר של MIT מסוף שנה שעברה קובע:


“Algorithm development is getting cheaper anyway, given that automated machine learning programs are doing more of the work. But useful algorithms die on the vine because the work to build processes, train people, address fear of change, and adapt the culture is substantially underfunded. Based on our experience, a good rule of thumb is that you should estimate that for every $1 you spend developing an algorithm, you must spend $100 to deploy and support it. A few of these dollars will go to building algorithms into work processes, and many more to training, building a culture that embraces data, and change management. Most companies aren’t spending this money yet, and it explains their lack of production AI deployments.”


המתודולוגיה שפותחה ע"י החברות הגדולות בעולם במסגרת הארגון Enterprise Data Management Council מספקת תכנית עבודה סדורה, לייזום, תפעול ובקרת תכנית אסטרטגיית הנתונים.

הרוב הגדול של הארגונים אינם מודעים לקיום מתודולוגיה סדורה לייזום תכנית ניהול נתונים ולכן הבחירה בטכנולוגיה לפתרון בעיות עסקיות היא בעצם ברירת המחדל. בהרצאות רבות בהן אני משתתף אני שומע שוב ושוב את השאילות - "איך מתחילים?", "איפה מתחילים?" ובצדק. היוזמה להקמת תכנית ניהול נתונים בארגון דורשת לא רק מנהיגות ואמונה ביכולת הארגון להתגבש סביב מטרה זו אלה גם תכנית עבודה מפורטת ומבוקרת שהוטמעה כבר בארגונים גדולים בעולם. אימוץ המתודולוגיה גם תשפר את שיתוף הפעולה הארגוני הדרוש בכדי לשלוט במשמעות, שימוש והגנה על אחד הנכסים החשובים ביותר של ארגון - הנתונים שלו!

עבור כל אחד מהמודולים, מוגדרים תפקידים –כישורים ותחומי אחריות, תהליכים ותתי תהליכים, תוצרים, שיטות עבודה ודיווח ועוד.

בחודש ספטמבר ישוחרר שלב נוסף העוסק במעבר לענן - Cloud Data Management Capabilities


מודל ה- Cloud Data Management Capabilities (CDMC ™) מגדיר את היכולות הדרושות לניהול ובקרה של נתונים בענן ביעילות. יצירתו מהווה אבן דרך חשובה באימוץ שיטות עבודה מומלצות בתעשייה לניהול נתונים. המודל הופק על ידי קבוצת CDMC Work שהוקמה על ידי מועצת EDM במאי 2020 עם למעלה מ -300 משתתפים ממעל 70 ארגונים, כולל צרכנים גדולים וספקי שירותי ענן וטכנולוגיה בנוסף לחברות ייעוץ מובילות. הדגם המלא פורסם בספטמבר 2021.