
|

|
 |
Die Einbindung der
Sprachtechnologie des IAI in ein bestehendes
Web-basiertes Groupware-System, wie dem Shared
Workspace System BSCW, stellt eine besondere
Herausforderung dar, da hierdurch erstmalig ein
Groupware-System befähigt würde, die Leistung der
existierenden Sprachtechnologie voll auszuschöpfen.
Die folgenden Sprachtechnologie-Komponenten werden den spezifischen "int.unity"-Anforderungen angepaßt:
 |
Term Mining (TM) / Terminologieermittlung: Terminologie ist für den Aufbau einer gemeinschaftlichen
Kommunikation und einer
Shared-Workspace-System-Umgebung von zentraler
Bedeutung, da hiermit fachspezifische Begriffe und die
verschiedenen sprachspezifischen Umsetzungen dieser
Begrifflichkeiten definiert werden, einschließlich möglicher
Synonyme und Antonyme. TM basiert auf einem Modul zur
Analyse der menschlichen Sprache (Morphologie und
einfache syntaktische/semantische Analyse; d.h. IAI
Kern-Sprachtechnologie) und liefert mögliche
Begriffsoptionen einschließlich einer Häufigkeitsangabe und
Kontextinformationen. Das XML-Output eignet sich zur
weiteren Bearbeitung in XML-fähigen Umgebungen.
|
 |
Language Proofing (LP) / Sprachüberprüfung: Rechtschreibung und grammatikalische Korrektheit sind zur
Übermittlung von Informationen in unterschiedlichen
Formen
unerlässlich. Die Einhaltung eines vorgegebenen
Fachwortschatzes (Terminologie) und bestimmter den
Stilrichtlinien entsprechender Schreibregeln verbessern den
Einsatz der Language Technology und ermöglichen
die
Kommunikation in verschiedenen Sprachen.
|
 |
Bi-lingual Glossary (BG) / Zweisprachiges Glossar: Die Wahl der richtigen Formulierung gewährleistet eine
reibungslose Kommunikation und Übersetzung zwischen
den Mitgliedern der "int.unity"-Community. Die Erzeugung
einer zweisprachigen Wörterliste unterstützt diese Auswahl.
|
 |
Bi-lingual Search (BS) / Zweisprachige Suche: Die Suche nach spezifischen Informationen in
verschiedenen Sprachen ist zur Vermeidung unnötiger
Übersetzungen sinnvoll. BS unterstützt diese Erfordernis der
sprachübergreifenden Informationsabfrage.
|
 |
Information Gisting (IG) / Informationsextrakt: Die Rohübersetzung eines bestimmten Informationsobjektes
aus der Fremdsprache in die Muttersprache und umgekehrt
ermöglicht die Beurteilung der Relevanz dieses Objektes für
einen vorgegebenen Satz an Informationssuchparametern.
Die Übereinstimmung mit einer vorgegebenen multilingualen
Terminologie gewährleistet, daß beim Übersetzungsprozeß
die richtigen Informationen erhalten bleiben.
|
 |
Summarisation (SUM) / Zusammenfassung: Das Extrahieren der wichtigen Fakten eines bestimmten
Informationsobjektes, ein- und mehrsprachig, ermöglicht
eine bessere und einfachere Navigation innerhalb eines
bestimmten Informationsraumes sowie das Herausfiltern von
Informationen nach bestimmten persönlichen
Anforderungen.
|
Für die Anpassung der Sprachtechnologie
(Language Technology) des IAI sind folgende Schritte
durchzuführen:
 |
Sprachtechnologie Resource Building /
Ressourcenaufbau: Die Terminologieermittlung gewährleistet die Auswahl und den Aufbau einer
geeigneten bilingualen "int.unity"-Terminologiedatenbank
und erstellt die Wortschatzbasis für die Anpassung der anderen Sprachtechnologie-Komponenten. Hierzu werden
"int.unity"-Informationsobjekte verarbeitet, und die
Gemeinschaft der Anwender (Community) ist für die Auswahl
der relevanten Terminologie verantwortlich. Das Ergebnis
dieser Terminologieauswahl wird in das
Sprachtechnologie-interne Format der
Kern-Sprachtechnologie des IAI konvertiert und in einer
Terminologiedatenbank mit einem "int.unity"-spezifischen
User Interface gespeichert.
|
 |
Sprachtechnologie Rule Base Building / Aufbau
von Regelsätzen: Die Sprachüberprüfung gewährleistet, daß die Kommunikation unter Einhaltung
eines Satzes gut definierter "Sprachregeln" erfolgt. Der Satz
der englischen und deutschen Kernregeln muß
entsprechend dem in den Informationsobjekten des
"int.unity"-Konsortiums verwendeten Stils erweitert werden.
Für die Erprobung kann nur eine Untergruppe dieser
Informationsobjekte geprüft und beurteilt werden. Die
ermittelten "int.unity"-spezifischen Grammatik- und Stilregeln
werden auf ihre Umsetzbarkeit geprüft (Formalisierung) und
dann in die bestehenden Software- und
Lingware-Komponenten eingebunden. Da dies Schritt für
Schritt durchgeführt wird, erfolgen mehrere Testphasen
durch die Anwender, bis eine stabile
"int.unity"-Konfiguration der Sprachüberprüfung umgesetzt ist.
|
 |
Sprachtechnologie-Integration: Um die Leistungsfähigkeit der adaptierten
Sprachtechnologie voll auszuschöpfen, müssen
die neuen
Sprachtechnologie-Komponenten in die
übergeordnete
"int.unity"-Umgebung integriert werden.
|
|
|