otto

Otto-von-Guericke-Universität Magdeburg
Fakultät für Informatik
Institut für Verteilte Systeme
AG Softwaretechnik

Proseminar: Web-Performance

Folien zum Vortrag

Sebastian Nusser

Workload-Beschreibung (3)

Skalierungsmethoden zur Arbeitslastberechnung

Da die Messwerte in unterschiedliche Einheiten auftreten und dadurch zu einer unterschiedlichen Bewertung der Arbeitslast führen können, ist es sinnvoll diese zu normalisieren.

Berechnung:

berechnung

Clusteranalyse

"Clusteranalyse wird verstanden als ein zusammenfassender Terminus für eine Reihe unterschiedlicher mathematisch-statistischer und heuristischer Verfahren, deren Ziel darin besteht, eine meist umfangreiche Menge von Elementen durch Konstruktion homogener Klassen, Gruppen oder Cluster optimal zu strukturieren. Die gesuchten Cluster sollen jeweils nur ähnliche Elemente enthalten, während Elemente verschiedener Gruppen möglichst unähnlich sein sollen. Bei dieser Aufteilung der Elemente wird davon ausgegangen, daß die Ähnlichkeit der Elemente untereinander quantifizierbar ist und sich durch (reelle) Zahlenwerte ausdrücken läßt."
(Steinhausen und Langer: "Clusteranalyse - Einführung in Methoden und Verfahren der automatischen Klassifikation" 1977)

Clustering-Algorithmen

clusteranalyse

Diese Algorithmen haben die Funktion Gruppen, die auf ähnlichen Ressourcen beruhen, zusammengefassen. Man unterscheidet folgende Arten von Algorithmen:

  • hierarchisch
    • divisiv ("teilend")
    • agglomerativ ("aufhäufend")
      • z.B.: MST-Algorithmus
  • nicht hierarchisch
      • z.B.: K-Means-Algorithmus

MST-Algorithmus

  • setze die Startanzahl der Cluster gleich der Anzahl der Workload-Komponenten
  • solange die gewünschte Anzahl von Clustern noch nicht erreicht ist:
    • bestimme den Clustermittelpunkt jedes Clusters
    • berechne die Distanz zwischen den Cluster-mittelpunkten
    • kombiniere die Cluster, die die kleinsten Distanz zueinander haben

K-Means-Algorithmus

  • setze die Anzahl der Cluster gleich k
  • wähle k Startpunkte (als Initialwerte für Cluster-mittelpunkte)
  • solange sich die Clusterzuordnung der Punkte ändert:
    • untersuche jeden Punkt und ordne ihn dem Cluster hinzu, dessen Mittelpunkt am nächsten liegt
    • berechne die Position des Clustermittelpunktes neu

Problem des Clustering

Problem:

Anzahl der Cluster die in einem Workload repräsentiert sind, lässt sich nicht immer leicht bestimmen. Es kann im Allgemeinen keine konkrete Aussage gemacht werden wieviel Cluster tatsächlich enthalten sind.

Daher ist es empfehlenswert die Clusteranzahl klein halten.

Beurteilungsfaktoren:

  • Ziel der Studie
  • Anzahl kritischer Applikationen
  • Objektarten
  • Arten der Verarbeitung (transaction, inactiv, batch)

Bursty Workloads

Burstiness:

Burstiness dient als Maßeinheit wie unregelmäßig eine Quelle Daten versendet. Sie kann als Parameterpaar (a,b) in Abhängigkeit einer Zeitperiode dargestellt werden:

  • a: Verhältnis zwischen maximaler Anfrage-Rate und der durchschnittlichen Anfrage-Rate innerhalb der Zeitperiode
  • b: Prozentsatz der sofortigen Ankunftsrate, die die Durchschnittsankunftsrate übersteigt

Die Betrachtung der Burstiness ist insofern von Bedeutung, als dass sie eine wichtige Rolle bei der Dimensionierung des Datendurchsatzes spielt. Die alleinige Betrachtung des durchschnittlichen Datendurchsatzes im Vergleich zum durchschnittlich zu erwartenden Verkehrsvolumen übersieht die Gefahr der Netzüberlastung im Falle von Spitzenbelastungen. Um in diesen Situationen einer Netzüberlastung vorzubeugen, empfiehlt es sich in diesem Zusammenhang, die Burstinessdes Netzwerkverkehr mit zu berücksichtigen.

Workload-Beschreibung

Schritte zur Charakterisierung:

  • Betrachtungsstandpunkt wird analysiert
  • Identifizierung der Basiskomponenten
  • Auswahl der Parametermenge, die die wichtigsten Charakteristika des Workloads abdeckt
  • Systemaufzeichnung zur Rohdatengewinnung
  • Einteilung der Arbeitslast in Klassen gleicher Komponenten
  • Berechnung der Klassenparameter
  • Konstruktion und Validation des Arbeitslastmodel

Literatur