Implementierung adaptiver numerischer Verfahren auf komplexen Geometrien mit leichtgewichtigen Prozessen

  • Autor:

    Frank Bellosa

  • Quelle:

    University of Erlangen, Technical Report TR-I4-94-07, May 1994

  • Datum: 05.1994
  • Abstract:

    Bei der Entwicklung effizienter paralleler Verfahren zur Berechnung komplexer Geometrien soll erreicht werden, daß die numerische Effizienz der Algorithmen mit der der besten sequentiellen Verfahren vergleichbar ist und dabei eine hohe parallele Effizienz erreicht werden kann.

    Beim Einsatz von Rechnern mit verteiltem Speicher (NO Remote Memory Access Architekturen wie z.B. IBM SP1, Intel Paragon und Workstation Cluster) haben sich dabei Ansätze bewährt, bei denen das Problemgebiet in Blöcke zerlegt wird und diese Blöcke den verfügbaren Prozessoren zugewiesen werden. Die Kopplung der einzelnen Problemgebiete erfolgt durch einen Datentransfer zwischen den Prozessoren, bei dem die Randbereiche ausgetauscht werden. Kritisch ist bei diesem Ansatz das Partitionierungsproblem. Für das Problemgebiet muß eine Partitionierung in Blöcke gefunden werden, bei der die Rechenlast gleichmäßig verteilt und der Aufwand für die Kopplung der Teilgebiete minimal gehalten wird. Dies ist insbesondere bei sehr komplexen Geometrien, wie sie in realen Anwendungen auftreten, ein schwer lösbares Problem, so daß ein Wissenschaftler aus den Anwendungsgebieten im allgemeinen ohne langjährige Schulung kaum in der Lage ist, eine optimale Partitionierungsstrategie für sein Anwendungsfeld zu entwickeln. Um die Wettbewerbsvorteile durch das numerische Hochleistungrechnen auch kleinen und mittleren Unternehmen ohne große Forschungsabteilung zu eröffnen, muß nach neuen Techniken gesucht werden, damit effiziente numerische Verfahren für komplexe Problemgebiete einfacher auf Hochleistungsrechnern implementiert werden können.

    Ein vielversprechender Ansatz liegt in der Verwendung leichtgewichtiger Prozesse, wie sie auf modernen Parallelrechnerarchitekturen mit einem gemeinsamem Speicher möglich werden. Beispiele hierfür sind die Uniform Memory Access Architekturen wie z.B. SGI Power Challenge oder die Non Uniform Memory Access Architektur der Rechner KSR2 und Convex SPP. Bei dem am Lehrstuhl für Betriebssysteme der Uni Erlangen entwickelten Programmiermodell muß sich der Anwendungswissenschaftler nicht mehr um eine explizite Partitionierung der Daten oder um die Verteilung der Rechenlast kümmern, sondern kann sich ganz auf die Beschreibung des numerischen Verfahrens konzentrieren. Wenn dabei die Beschreibung nach vorgegebenen einfachen Regeln erfolgt, ist ein als Bibliothek zum Programm gebundenes Laufzeitsystem in der Lage, die Aufgabe der Partitionierung und Lastverteilung für beliebige Prozessorzahlen zu übernehmen. Damit wird dem Anwender ein leistungsfähiges Werkzeug in die Hand gegeben, das es ihm ermöglich, eine optimale numerische und parallele Effizienz auf Hochleistungsrechnern mit gemeinsamem Speicher zu erzielen.

    BibTex:

    @techreport{bellosa94implementierungadaptverf,
      author = {Frank Bellosa},
      title = {Implementierung adaptiver Verfahren auf komplexen Geometrien mit leichtgewichtigen Prozessen},
      booktitle = {Technical Report},
      number = {TR-I4-94-07},
      month = may,
      year = 1994,
      affiliation = {University of Erlangen, Germany},
      url = {http://i30www.ira.uka.de/}
    }