בדיקות והבטחת איכותMenu

Amazon CloudWatch - מעונן חלקית - חלק ג'

כיצד נכון לנטר את יישום האינטרנט של חברות מבוססות תשתיות ענן Amazon כחלק מתהליכי ה DevOps בארגון?

​במאמרים הקודמים, הסברנו על הרמות השונות של השירותים הניתנים לניטור תוך התמקדות במדדי ההשפעה השונים, השימושיים השכיחים ביותר ברמות השונות של התשתיות באמצעות CloudWatch וסקרנו את שלושת הדוחות הראשונים. במאמר זה נסיים עם 2 הדוחות האחרונים וטיפים לסיכום.

הדוח הרביעי ו המומלץ הוא Dynamo

Dynam הינו שירות של אמזון לבסיסי נתונים NoSQL, את הDynamo  יש למדוד ברמת היישום ולא ברמת DB בודד. להלן הפרמטרים שיש לפקח עליהם:

• Read/Write Capacity Units – קיבולת צריכה של יחידות קריאה וכתיבה.

ה Dynamo  מתנהג כמו שרותי SaaS , כאשר הדאגה היחידה של מנהלי האופרציה (Devops) למדוד את יחידת הקיבולת/יכולת של הקריאה והכתיבה לבסיס הנתונים.

בתהליך ההגדרה בכל תקופה מוקצים מספר קריאות של כתיבה וקריאה, באם יש חריגה במספר הקריאות בסיס הנתונים יהיה חנוק כלומר הם (הקריאות) לא ממש התבצעו ולכן יש לפקח על כך בכדי לבצע וויסות נכון של הקריאות על פי הקיבולת המוגדרת.

• Throttled Requests – דו"ח אשר מציג:

-כמה בקשות קריאה וכתיבה בbacklog בכל תקופה

-מאפשר לצפות באמצעות סעיף הקודם את כמות הקריאות והכתיבות וכך להגדיל את הקיבולת של מספר הקריאות והכתיבות לתקופה

-ברמת היישום - כמה בקשות היישום שולח ל Dynamo ובכך לווסת את הכמות בכדי לא לגרום להגרעה בביצועים.

• Successful Request Latency חביון בקשה מוצלח – מודד בפרק זמן מסוים את כמות הבקשות המוצלחות וכמה זמן בממוצע לוקח להם לחזור, מדד זה מעיד על שפיות והמהירות של בסיס הנתונים כאשר הוא לא חנוק כך ה Dynamo  מבקר על העבודה היומית שנעשית ע"י היישום.

הדוח האחרון הוא- Amazon Simple Queue Service (SQS)  – שירות התור SQS

SQS של אמזון הוא שירות הודעות תור, שמאפשר למספר רב של רכיבים לתקשר האחד עם השני במהירות בבטחה וביעילות. הוא חלק חשוב מאוד בכל מערכת הפצה וככזה יש לנטרו מקרוב.

ועל כן יש לפקח על הפרמטרים הבאים:

• Approximate Number of Messages Visible – מספר משוער של הודעות גלויות.

הודעה גלויה – כל הודעה שנוצרה ע"י משאב בסביבה מבוזרת וטרם נקראה ע"י משאב הצרכן נחשב הודעה "גלויה". מתאר את מספר ההודעות  בשלב הראשון של ההודעה בתור בתהליך.

• Approximate Number of Messages Not Visible – מספר משוער של הודעות שאינן גלויות. כל הודעה שנוצרה ע"י משאב בסביבה מבוזרת ונקרא ע"י משאב הצרכן ואושר אך משאב הצרכן אישר אותה אך טרם מחק אותה מהתור.

• Approximate Number of Messages Delayed – מספר משוער של הודעות מושהות. לפעמים אנו מעצבים את המערכת כך שהיא תוכל לעכב הודעות לפרק זמן מסוים לאחר שנשלחו אך לפני שנמסרו למשאב צרכני, ה CloudWatch עוקב אחריהם מגדיר אותם שהודעות מושהות.

בעקרון, כאשר מנטרים תורים של SQS יש לשים דגש בראש ובראשונה על היקף ההודעות בכל שלב בתהליך שליחת הודעות במערכת.


ראינו כי ה AWS CloudWatch היא נקודת זינוק מצוינת להבטיח שהיישום הפרוש בענן אמזון פועל ראוי ומנוטר על פני הרמות השונות ,ובדוחות שניתן להפיק מה Cloudwatch ניתן לגלות בהקדם האפשרי בעיות ביצועים ברמות השונות וזמינות היישום למשתמש ובשילוב של Agents ,של CollectID והCloudWatch  ניתן להפיק דוחות עם מדדים שונים השומרים על שפיות המערכת.

לסיכום - אם החלטתם להשתמש ב CloudWatch על הפרמטרים שפירטתי קודם באתרכם תוכלו בקלות ובצורה מיטבית להבין איך סביבת ה Amazon שלכם פועלת, להגדיל בצורה אלסטית משאבים ובכך לדאוג שחווית המשתמש מיטבית והיישום אינו תקוע.

באמצעות ה Dashboard ניתן להגדיר התראות מובנות עם הודעות מהמערכת המתריעה על בעיה מסוימת וכן להפעיל פעולות מסוימות בהתאם למדדים שבחרתם להגדיר עם סף גבוה או נמוך להתראות.

 

מאת: סנדרין קאלק מנהלת תחום DevOps בחטיבת הבדיקות (V-Ness)  בנס.
פעילות ה-DevOps  בנס, מעניקה פתרונות מקצה לקצה לארגונים גדולים וקטנים משלב הדרישות ועד לייצור במטרה ללוות לכל ארגון לעבור למתודולוגית DevOps הן ברמה המתודולוגית והן ברמת היישום.

 

עוד בנושא...

עוד פרסומים בנושא אשר עשויים לעניין אותך