Institut für Rechnerentwurf und 
Fehlertoleranz

Prof. Dr. Th. Ungerer
Jürgen Ruf

4. Übungsblatt zur Vorlesung Rechnerstrukturen

Die Besprechung des Übungsblattes findet am Donnerstag den 25. Juni 1998 statt. Die Musterlösungen ist im WWW zu finden. Eine Sprechstunde zu diesem Übungsblatt findet am Montag 29.6.1998 von 14.00-16.00 Uhr im Raum 266, Geb. 20.20 statt.

1. Leistungsfähigkeit von Multiprozessorsystemen

Gegeben sei ein Multiprozessorsystem mit 30 Prozessoren. Die Leistungssteigerung bezüglich eines Einprozessorsystems sei S(30) = 6. Die Ausführungszeit auf einem Einprozessorsystems sei  T(1) = 300 und die Anzahl der auszuführenden (Einheits-) Operationen auf dem Multiprozessorsystem sei P(30) = 120.

2. Amdahls Gesetz

3. MESI-Protokoll

Gegeben sei ein speichergekoppeltes Multiprozessorsystem mit zwei Prozessoren, die über einen Bus mit einem globalen Speicher verbunden sind. Zur Wahrung der Cache Kohärenz wird das MESI Protokoll verwendet. Die Caches der beiden Prozessoren haben je eine Größe von drei Cache-Lines die genau ein Speicherwort aufnehmen können. Die Caches werden von der niedrigsten Cache-Line aufwärts gefüllt, falls noch freie Lines zur Verfügung stehen. Im Falle eines voll besetzten Caches werden sie nach der Strategie LRU (least recently used) überschrieben. Ergänzen Sie die folgende Tabelle, wobei die Buchstaben die Zustände: M = exclusive modified, E = exclusive unmodified, S = shared unmodified, I = invalid repräsentieren. Die Zahlen hinter den Aktionen und Zuständen bezeichnen Speicheradressen.
 
 
Prozessor 
 
Aktion
Cache1 Line1
Cache1 Line2
Cache1 Line3
Cache2 Line1
Cache2 Line2
Cache2 Line3
-
-
E/8
E/12
I/-
E/6
I/-
I/-
2
read 10
E/8
E/12
I/-
E/6
E/10
I/-
1
write 8
 
 
 
 
 
 
1
read 10
 
 
 
 
 
 
2
read 8
 
 
 
 
 
 
1
write 8
 
 
 
 
 
 
1
write 8
 
 
 
 
 
 
1
read 18
 
 
 
 
 
 
2
write 10
 
 
 
 
 
 
2
write 18
 
 
 
 
 
 
 

4. Verbindungsnetzwerke

Gegeben sei ein Multiprozessor bestehend aus N = 6 Prozessorknoten und einem statischen Verbindungsnetz, das jeden Prozessor mit allen anderen Prozessoren verbindet (vollverbundenes Netzwerk). Jede Verbindung habe die gleiche (Einheits-) Bandbreite und sei bidirektional.

5. Vektorrechner

Zur Konstruktion einer Pipeline stehen drei verschiedene Rechenwerke zur Verfügung:
  1. Ein Multiplizierer der als Pipeline mit 6 Stufen realisiert ist
  2. Ein Addierwerk, das drei Pipelinestufe benötigt
  3. Eine beliebige Anzahl von Verzögerungselementen, die den Eingangswert nach einem Taktzyklus an den Ausgang weiterleiten