Ravi Srinivasan
2019-03-25 96d171175638b13537310ace4fc2a9e6145654d8
commit | author | age
697dc8 1 # The Cluster Awakens
43f2f2 2
1173e5 3 > In this exercise; we will monitor the core of the OpenShift Cluster. Watch for spikes in memory usage, hard disk space and other cluster stats.
2576ab 4
D 5 ![monitoring-mayhem](../images/exercise7/monitoring-mayhem.jpg)
6
43f2f2 7 _____
D 8
9 ## Learning Outcomes
10 As a learner you will be able to
1173e5 11 - View vital stats about the clusters health using Prometheus queries
b5dc45 12 - Visualise the data on Grafana dashboards
D 13 - Overlay log messages to the Grafana dashboards creating a very short feedback loop for Ops and Dev teams.
43f2f2 14
D 15 ## Tools and Frameworks
16 > Name of tool - short description and link to docs or website
17
b5dc45 18 1. [Prometheus](https://prometheus.io/) - Features Components Architecture When does it fit? When does it not fit? What is Prometheus? Prometheus is an open-source systems monitoring and alerting toolkit originally built at SoundCloud. Since its inception in 2012, many companies and organizations have adopted Prometheus, and the project has a very active developer and user community. It is now a standalone open source project and maintained independently of any company. To emphasize this, and to clarify the project's governance structure, Prometheus joined the Cloud Native Computing Foundation in 2016 as the second hosted project, after Kubernetes. For more elaborate overviews of Prometheus, see the resources linked from the media section.
D 19 1. [Grafana](https://grafana.com/) - The analytics platform for all your metrics Grafana allows you to query, visualize, alert on and understand your metrics no matter where they are stored. Create, explore, and share dashboards with your team and foster a data driven culture. Trusted and loved by the community.
43f2f2 20
D 21 ## Big Picture
664135 22 > From the previous exercise; we introduced app and jenkins monitoring. This exercise focuses on radiation of cluster statistics using Prometheus to scrape metrics and Grafana to display them.
D 23
14a966 24 ![big-picture](../images/big-picture/big-picture-6.jpg)
43f2f2 25
D 26 _____
27
28 ## 10,000 Ft View
29 > This should contain the goal of the exercise; with enough information that advanced learners could use this to build the exercise without much guidance. The information here
30
b5dc45 31 2. Create a Grafana Dashboard to show key stats of the cluster such as memory usage, remaining disk space etc.
43f2f2 32
b5dc45 33 2. Annotate the graphs by connecting the Elastic Search logs as a datasource in Grafana and running queries through it.
43f2f2 34
D 35 ## Step by Step Instructions
f5f1ff 36 > This is a fairly structured guide with references to exact filenames and sections of text to be added. Include pictures and code snippets where appropriate. Over describe _why_ we're doing things
43f2f2 37
D 38 _____
39
40 ## Extension Tasks
41 > _Ideas for go-getters. Advanced topic for doers to get on with if they finish early. These will usually not have a solution and are provided for additional scope._
42
43
01c4da 44 ## Slide Links
RH 45
46 - [Intro](https://docs.google.com/presentation/d/179Bz9GzHIcDxwb4RxxlQUESfqES4hArU1puGUjkAOoI/)
47 - [Wrap-up](https://docs.google.com/presentation/d/1n6f_A3i5019lZYmCBNhl9O-S3xxjpHDT5I7ZoCqYyHo/)
1173e5 48 - [All Material](https://drive.google.com/drive/folders/13YIiKuzBmr9mGzg4bsEns5yVWx_Zc8Hs)