top of page

פורטל ידע

שנת 2023 בדאטה ובאנליטיקה - תחזיות


מאת: אינה טוקרב סלע, מנכ"לית, אילומקס טכנולוגיות
 



2023 היא השנה השלישית לטרנספורמציה הדיגיטלית שמואצת בעקבות מגיפת הקורונה. לאחר הזרמת המשאבים הראשונית לכל יוזמת דאטה ואנליטיקה על מנת לאפשר צמיחה, היום אנחנו נמצאים בשלב בוגר יותר ומסוגלים להעריך יעילות: את עלות הבעלות הכוללת (TCO), את מידת האוטומציה, את מידת ההסתגלות של הכלי למציאות משתנה, ואיחוד של פונקציות רבות תחת כלים מעטים.


לדעתי, אלו האתגרים שבהם מובילי דאטה ואנליטיקה צריכים להתמקד, ואלו הטרנדים הנוכחיים לפתרונות של אתגרים אלו.


1. קיימות באמצעות IT ודאטה

מן הידועות היא שמשך חיי חברות S&P ירד מ-60 שנים ל-18 שנים תוך כמה עשרות שנים בלבד, וזאת עוד לפני מגיפת הקורונה והמשבר הכלכלי הנוכחי. כמו כן, הוכח שארגונים ששולטים בדאטה שלהם מקדימים את מתחריהם פי עשרות מונים. השאיפה למנף טכנולוגיה כדי לייצר גדילה עשויה להסביר מדוע ההוצאות הגלובליות על טרנספורמציות דיגיטליות של ארגונים, שיטות עסקיות ומוצרים צפויה להגיע ל-2.8 טריליון דולר ב-2025.


החדשות הרעות הן שהזמן להשלמתן של יותר מחצי היוזמות הדיגיטליות האלו, הוא ארוך מדי, וערכן לארגונים נותר בלתי ממומש. הדאטה של אותן יוזמות מאוחסן, אבל נותר ללא שימוש. בעקבות הביצועים העסקיים הבעייתיים האלו, ארגונים מחליפים את ההוצאה האדירה שלהם על כלים בהוצאה על יוזמות שבהן כלים מאפשרים אוריינות נתונים, שקיפות ונִצְפּוּת (Observability) בנכסי הדאטה ובשימוש בהם.


יתרה מכך, עד 2025 ל-50% מה-CIO יהיו מדדי ביצועים הקשורים לקיימות של ארגון ה-IT.


עכשיו, סוף סוף, אנחנו מקבלים את ההזדמנות לדחוף את יוזמת הקיימות הארגונית כחלק מהחוסן העסקי, שהוא, בתורו, מתופעל על ידי טכנולוגיה מסתגלת, חסכונית ובעלת יכולת נִצְפּוּת.


יתרה על כן, אנו יכולים לחלוק את העומס הזה עם עמיתינו: עד 2027 יותר מ-50% מהארגונים ישתמשו בפלטפורמות ענן כדי להאיץ את היוזמות העסקיות שלהם.


אימוץ פלטפורמות הענן בארגון עשוי לארוך קצת זמן, אבל הפלטפורמות הגדולות כבר מפעילות שווקים דיגיטליים (Marketplace) מזה זמן. הרעיון הוא לאפשר לארגונים לסחור ולהחליף נתונים, אובייקטים, ומוצרים. האינטגרציה והניהול הופכים לקלים יותר אם הארגון עושה שימוש באותה פלטפורמה עבור הנתונים הפנימיים שלו. פלטפורמות ושווקים דיגיטליים מכוונים להעשיר את חווית השימוש ולספק פתרונות הניתנים להרכבה ומותאמים אישית. הם מייצרים הזדמנויות למונטיזציה של נתונים ולסינרגיות הן בשוק הגנרי והן בתעשייה. בעוד ששיתוף נתוני הליבה של הארגון הוא נושא משפטי מסובך, שיתוף פעולה סביב יוזמות קיימות ואקלים עשוי להיות התחלה מצוינת לסינרגיות בתחום הדאטה.


לסיום חלק זה, אנו שואפים לנהל את מאגר הטכנולוגיה הארגונית שלנו באופן מקיים יותר כחלק מהמאמץ הארגוני הכולל. באופן אידיאלי, זה גם משפר את הקיימות הכוללת של בעלי העניין בארגון.


מגמות טכנולוגיות ששווה להכיר:

אם נודה באמת, ארגונים נאבקים ליצור, לנטר ולמשול בצינורות עיבוד הנתונים. ספקי פלטפורמות נתונים הבחינו בכך, ובאופן איטי אך עקבי הם מתכננים לשלב פתרונות אפשריים בהיצע שלהן. זה עשוי להיות רעיון טוב, אבל זה גם יוצר סילו נתונים (data silo) מנותק משאר הארגון, משום שרק חלק מהארגון פועל על CDW (Cloud Data Warehouse).


לעניין זה, רוב הארגונים עדיין מחלקים נתונים למאגרים שונים על פי מקרה השימוש האנליטי: שאלות אד-הוק, דו"חות ומודלים של למידת מכונה. בחמש השנים האחרונות, CDW צמחו בהיקף העיבוד שלהם לכדי 50% מכלל מסת הנתונים האנליטיים ויגיעו לכדי 75% בשנתיים הבאות. עם זאת, מוקדם מדי לוותר על אגמי נתונים ומאגרי מידע in memory.


אנחנו עדיין צריכים להתייחס ל"לולאת המשוב" או Reverse-ETL: תובנות שמגיעות מצינורות נתונים או מניתוחים, נכתבות לאפליקציה, לקובץ או בחזרה למקור הנתונים. מכיוון שהיכולת של ה-CDW להחליף מקורות נתונים תפעוליים או אגמי נתונים, עדיין לא מפותחת דיה, אני ממליצה להימנע מכך. במקום זאת, אני ממליצה על ארכיטקטורה פשוטה יותר של שימוש בממשקי API כדי לתקשר ישירות בין ניתוחי הנתונים לבין האפליקציות התפעוליות.


יותר מ-20% מהון הסיכון שגויס ב-2021 על ידי חברות סטארט-אפ, מעל 60 מיליארד דולר, גויס על ידי סטארטאפים עם מוצרים הקשורים לנתונים. לאור כך, בכל הנוגע לקיימות ויעילות עלות, אפשר למצוא עלות בעלות כוללת, אוטומציה ו-ROI טובים יותר אצל סטארט-אפים וחברות קטנות יותר. שוק פתרונות הנתונים פורח ומציע שפע של מוצרים מספקים מגוונים ובטווחי מחירים שונים.


2. חוסן באמצעות נִצְפּוּת (Observability)

מה היית נותן כדי להפחית את זמן ההשבתה של המערכת שלך ב-80%? אם הארגון שלך משקיע בבניית מערכת חיסון דיגיטלית, אפשר להגיע להפחתה כזו תוך כמה שנים בלבד.


אז איך בונים מערכת חיסון דיגיטלית? פשוט מערבבים נִצְפּוּת דאטה (Observability) עם בדיקות מוגדלות, ניטור ותיקון שגיאות אוטומטי, מוסיפים אבטחה וניהול סיכונים, והנה מערכת דיגיטלית עמידה וסתגלנית!


אני רוצה להתמקד בנִצְפּוּת באופן ספציפי:


עד 2026, 70% מהארגונים שיטמיעו נִצְפּוּת דאטה בהצלחה, יקצרו משמעותית את זמן קבלת ההחלטות שלהם. זה בדיוק הנושא אליו התייחסתי בסעיף הקודם - הטמעת כלים אוטומטיים ביותר על מנת לאפשר קבלת החלטות מהירה ואמינה.


נִצְפּוּת בהקשר של דאטה ואנליטיקה הוא מיפוי נכסי ה-D&A, האפליקציות והתהליכים העסקיים, כלומר - כלל המטאדאטה. זוהי הבנת המשמעויות של נכסים שונים (סמנטיקה) והקשריהם (יחסים). ניטור הדפוסים של ההקשרים ושל השימוש בנכסי ה-D&A יכול להיות הבסיס לאקטיבציה של מטאדאטה לתוך לולאות אוטומטיות של החלטה.


מטאדאטה אקטיבי כמו גם פאסיבי מאפשרים שקיפות והבנה של נכסי הדאטה והאנאליטקה הקיימים, ושל מהות השימוש בהם. זהו הבסיס לצמצום פסולת בדאטה מיושן ושאינו בשימוש, בצינורות עיבוד נתונים שבורים ובמטריקות סותרות (עוד על כך בסעיף הבא).


עד כה, רוב הארגונים המתקדמים יצרו חוזי נתונים עבור נכסים ספציפיים כדי להבין את מוֹצְאוֹת הנְתוּנִים (data lineage), את שימושם, את ישימותם וההשפעה שלהם. באמצעות אקטיבציה של מטאדאטה, אנו יכולים לשאוף למפות את כלל הנכסים שלנו באופן אוטומטי. כך אנו מתקרבים לייצור רווחים מנכסי נתונים (כפי שציינתי בסעיף הקודם).


מגמות טכנולוגיות ששווה להכיר:

הכלים להתמודדות עם אתגרים אלו ולספק את הפתרונות לנִצְפּוּת מפוזרים כיום בין קטגוריות שונות, כגון מוֹצְאוֹת הנְתוּנִים, נִצְפּוּת דאטה, קטלוגים, פלטפורמות לניהול מטאדאטה אקטיבי ומאגרי מטריקות.


מנקודת מבט רחבה יותר, זהו שילוב של Data Mesh ומארג נתונים (Data Fabric). המטרה של Data Mesh היא לייצר מוצרי דאטה מסולמים הניתנים להרכבה. המטרה של מארג נתונים היא למפות את כל נכסי ה-D&A באשר הם, ולמשול בהם בהם על מנת להבטיח את ייחודיותם, לוודא שלא יתנגשו עם נכסים אחרים, ושיהוו מקור אמת יחיד. השילוב שלהם הוא נקודת פתיחה טובה למוצרי דאטה עם יכולות מובנות של Discovery, נִצְפּוּת ומשילות בנתונים, ועם כלים מובנים לשיתוף פעולה בין יצרני דאטה והצרכנים שלו.


3. אמון מחודש באמצעות שקיפות

מוצרים מבוססי בינה מלאכותית ולמידת מכונה מתקשים לחדור לארגונים, בין השאר משום שצרכנים לא סומכים על מה שהם לא מבינים. על מנת להתמודד עם בעיה זו, בשנים האחרונות אנחנו מדברים על בינה מלאכותית הניתנת להסברה, היום אנו קוראים לזה משילות בבינה מלאכותית או בלמידת מכונה (Governed AI/ML).


הבנה ופרשנות של דאטה ואנליטיקה דורשים אוריינות בנתונים. 80% מכוח האדם העסקי הנוכחי אינו מרגיש בטוח בשימוש בדאטה. אם נִצְפּוּת מאפשרת לראות ולהבין את ההקשר של ה-D&A, אוריינות נתונים תתרגם את מה שאנו רואים וכיצד נוכל לפעול לפיו.


עכשיו למשילות: היסטורית, התייחסנו למשילות בנתונים כמנגנון הגנה שייעודו לתת למשתמשים גישה לנתונים ולניתוח על בסיס "הצורך לדעת" בלבד. הזמנים השתנו, וכעת רוב העובדים בתפקידים עסקיים רוצים להחליט החלטות מבוססות-נתונים, אך אינם מסוגלים לכך. לכן התפקיד החדש של משילות נתונים הוא לאפשר שירות עצמי פשוט לעובדים בעלי אוריינות בנתונים.


מגמות טכנולוגיות ששווה להכיר:

  • כאשר מתעדים את צינורות עיבוד הנתונים, את הטרנספורמציות, את המטריקות ואת והשאלות בכלי BI, ב-ETL או במאגר נתונים, נוצרת תמונה נוספת של הארגון - תמונה מנותקת, מקוטעת ומפוצלת שמספקת פרספקטיבה אחת ויחידה של המציאות לבעלי תפקידים שונים.

  • על מנת למנף נכסי דאטה, נִצְפּוּת ומשילות לאבטחה ולניהול סיכונים, הם צריכים להיות זמינים עבור תזרימי העבודה או דרך ממשקים שונים באופן שלא ידרוש צוות Ops נוסף לתפעולם.

  • מאגרי מטריקות / מאגרי מאפיינים / מילוני מונחים עסקיים / תצוגות - כל אלו מכפילים את מאמצי המשילות והנִצְפּוּת של אותו סוג של נכסים. האם לא עדיף לנהל את כל התרחישי האלו באמצעות פלטפורמה יחידה ועל גבי מבנה סמנטי ייחודי המחובר ישירות לדאטה הארגוני?


לסיכום:

דנתי בעלויות, יעילות, שקיפות והתאמה עסקית טובה יותר, אבל השורה התחתונה האמיתית היא קיימות, חוסן, ואמון: היכולת לשגשג בתקופות הקשות באמצעות טרנספורמציה דיגיטלית; היכולת להתאושש במהירות לאחר כישלונות בלתי נמנעים, ללמוד מהם ולהיות חכמים יותר; והיכולת לבנות מערכת תמיכה שיתופית סביב דאטה למען אנשים.


 

אינה טוקרב סלע, מנכ"לית, אילומקס טכנולוגיות

כתובת דוא"ל: inna@illumex.ai

טלפון: 054-227-7564

Comentários


bottom of page