Projekte 2006

Unsere Kernkompetenzen spiegeln sich in den durchgeführten Projekten der letzten Jahre
('01 , '02 , '03 , '04 , '05 , '06, '07, '08, '09) wider, wo Themen wie Information Retrieval, Clustering und Klassifikation sowie der Einsatz von multimedialen Daten und verschiedenen Metadatenformate behandelt wurden.

Projects 2006

(only german)

Brockhaus Planetarium
Medienportal Plus
Pressespiegel Neu
Magna EDB Retrieval Plus
Semantische Erschließung und Retrieval in hybriden Datenbeständen
MISTRAL - Measurable Intelligent and Reliable Semantic Extraction and Retrieval of Multimedia Data
DYONIPOS - Dynamic Ontology based Integrated Process Optimisation
Service Orientierte Knowledge Discovery Architektur

Brockhaus Planetarium

Kooperationspartner: Brockhaus Duden Neue Medien

Der Brockhaus Multimedial zeichnet sich vor allem durch die reichhaltige Anzahl an multimedialen Darstellungselementen aus (z.B. Visualisierung von Zusammenhängen durch 2D- und 3D-Wissensnetze). Um die multimedialen und visuellen Komponenten des Brockhaus Multimedial zu erweitern, sind spezielle Rahmenbedingungen zu berücksichtigen: So ist es unmöglich für jede Informationseinheit ein bezogen auf diese Einheit einzigartiges multimediales Darstellungselement zuzuordnen. Der Aufwand zur Erstellung dieser Elemente würde sich in keinem Fall in einem vertretbaren Verhältnis zum generierten Nutzen bewegen. Die Idee ist es daher, Darstellungselemente zu definieren, die allgemeiner einsetzbar sind und dennoch im Kontext jeder Informationseinheit einzigartig sind.

Ein „interaktive Planetarium“ erfüllt genau diese Anforderung. Mit diesem Planetarium ist es beispielsweise möglich für jede Informationseinheit in der eine geografische Region über einen geografischen Namen (z.B. Graz) vorkommt, einen Sternenhimmel anzubieten, der zu einem bestimmten Zeitpunkt (z.B. 1875) über der Stadt Graz zu sehen war. Umgekehrt ist soll es möglich sein, von einem bestimmten Planeten (z.B.) Mars auf die Stadt Graz zu blicken.

Für die Umsetzung dieser Idee, sollen die Möglichkeiten einer dreidimensionalen, optisch ansprechenden Darstellung des Weltraums inkl. Planeten mit deren detaillierten Oberflächen von einem beliebigen Punkt des Sonnensystems oder der Erdoberfläche, untersucht werden. Zusätzlich zur reinen Darstellung erfolgt die Untersuchung verschiedener Interaktionskonzepte zur dreidimensionalen Navigation des Wissensraumes als auch die automatische Berechnung von verschiedenen Kamerafahrten.

Auf technischer Ebene ist die Integrationsmöglichkeit von 3D Rendering Engines zu klären. Als Technologien stehen dabei Java 3D und Shockwave zur Auswahl. Eine prototypische Umsetzung soll die Realisierbarkeit sowohl des 3D Konzeptes, als auch der technischen Realisierung zeigen.

top

Medienportal Plus

Kooperationspartner: Apa DeFacto

 

In Vorgängerprojekten zwischen der APA und dem Know-Center wurden effiziente Technologien im Umgang mit textuellen Datenbeständen entwickelt, welche nun in Form eines interaktiven Medienportals angeboten werden sollen. Neben der Entwicklung einer durchgängigen Visualisierungsmetapher soll der Zugang zu relevanter Information so einfach wie möglich erfolgen.

Im Projekt sollen verschiedene Möglichkeiten von Web-Zugängen zu diesem Wissensportal untersucht werden, wobei hoher Wert auf einfache Navigationsmöglichkeiten gelegt wird. Um dies gewährleisten zu können, wird auf verschiedene Visualisierungsmethoden zurückgegriffen. Angedacht ist unter anderem die geografische Darstellung von tagesaktuellen Themen oder die Darstellung der Beziehung zwischen verschiedenen Themen und Personen/Akteuren. Um dies zu erreichen sind verschiedene semantische Bezugsformen, wie Raum-, Zeit- und Sachbezug, der betroffenen Inhalte miteinander in Beziehung zu setzen.

In Verbindung mit verschiedenen Interaktionskonzepten wird so eine einfache Exploration des komplexen Wissensraumes möglich. Ideengeber für diese Darstellungen können z.B. der Webatlas von Brockhaus bzw. existierende Systeme wie GoogleEarth, NASA World Wind in dem z.B. die Entwicklung jüngster Hurrikane im Zeitraffer und im Kontext zugehöriger medialer Berichterstattungen betrachtet werden kann.

top

Pressespiegel Neu

Kooperationspartner: Kooperationspartner: Apa DeFacto

Zur täglichen Arbeit der APA DeFacto gehört auch das Erstellen von Pressespiegeln, welche themenrelevante bzw. akteursrelevante Meldungen tagesaktuell beinhalten. Die Produktion erfolgt derzeit manuell mit geringfügiger maschineller Unterstützung.

Im Projekt sollen Verbesserungsmöglichkeiten bei der Erstellung des Pressespiegels untersucht werden, wobei eine heterogene Benutzerbasis und schon vorhandene Technologien wie z.B. die APA Powersearch zu berücksichtigen sind.

Im Projekt sollen der Einsatz von verschiedenen maschinellen Textanalyseverfahren, sowie mögliche User Interface Verbesserungen untersucht werden. Mögliche Analyseverfahren sind das Erstellen von automatischen Zusammenfassungen, themenorientierte Gruppierung von Pressespiegeln sowie der Vorschlag zur automatischen Zuordnung von Dokumenten zu Pressespiegeln. Ausgewählte Verfahren werden prototypisch umgesetzt und unter Verwendung von schon vorhandenen Testdaten evaluiert.

top

Magna EDB Retrieval Plus

Kooperationspartner: MAGNA STEYR Fahrzeugtechnik AG & Co KG

Magna Steyr Fahrzeugtechnik (MSF) verfügt im Engineering- und Konstruktionsbereich über umfangreiche Datenbanken von Spezifikationen, Definitionen und anderen, projektbezogenen Dokumenten. Entsprechende Informationen liegen beispielsweise in Form von Textdateien, Kalkulationsblättern oder 3D-Modelle vor und sind mit zahlreichen, teilweise strukturierten Metadaten annotiert. Der Zugriff auf Dokumente ist über ein Berechtigungssystem auf Benutzer- und Gruppenebene geregelt.

Für die aktuell vorhandene Suchtechnologie sollen mögliche Erweiterungen dieser Technologien wie z.B. Faceted Metadata und die Möglichkeiten zur Anbindung von weiteren MSF internen Daten-quellen untersucht und prototypisch implementiert werden. Dabei sollen Möglichkeiten der Homogenisierung der unterschiedlichen Datenquellen mittels Kombination von innovativen, inhaltsbasierten und semantischen Verfahren betrachtet werden. Zusätzlich bietet die Engineering Datenbank bei MSF ein reichhaltiges Angebot an multimedialen Elementen wie z.B. 3D Zeichnungen. Problematisch hierbei ist die fehlende Verschlagwortung dieser Elemente und die damit verbundenen ungenügen-den Findmöglichkeiten mittels textueller Suchen. Weiteres Ziel im Projekt ist daher auch die Entwicklung eines Ähnlichkeitsmaßes zwischen 3D Objekten welches als Ausgangsbasis für Ähnlichkeitssuchen dient.

Den letzten wichtigen Punkt stellt die Optimierung des Suchinterface auf die entsprechenden Benutzergruppen dar, womit eine optimale Nutzung der Technologie möglich ist. Durch Benutzertests werden Vor- bzw. Nachteile der umgesetzten Technologie untersucht und die Benutzerschnittstellen für MSF Benutzer unter Berücksichtigung von HCI Aspekten optimiert.

top

Semantische Erschließung und Retrieval in hybriden Datenbeständen

Kooperationspartner: m2n - consulting and development gmbh

Unter hybriden Datenbeständen werden im Rahmen dieses Projekts Datenbestände verstanden, die nicht nur in elektronischer Form sondern auch noch in Papierform und dort z.T. handschriftlich vorliegen. Ziel dieses Projekts ist es, zu untersuchen, welche Möglichkeiten existieren, um solche Datenbestände semantisch zu erschließen und damit strukturiert durchsuchbar zu machen. Eine Möglichkeit besteht sicher in der Harmonisierung der Datenmedien etwa über Digitalisierung. Für ein strukturiertes Retrieval ist es dann aber immer noch erforderlich, entsprechende semantische Annotationen, wie etwa zeitbezogene oder geografische Gegebenheiten zu berücksichtigen. Dies trifft insbesondere dann zu, wenn es nicht nur um das Auffinden eines Dokuments geht sondern um das Auffinden eines Dokuments in einem bestimmten Kontext, wobei der Kontext etwa durch andere themenverwandte Dokumente definiert sein kann.

Ziel im Projekt ist die Entwicklung von Techniken zur automatischen Erschließung von hybriden Datenbeständen sowie deren semantischen Strukturierung. Dabei müssen vor allem Orts- und Zeitbezüge mit berücksichtigt werden. Aus hybriden Daten werden unter Anwendung von Methoden der Wissenserschließung, im Speziellen der Informationsextraktion, Clustering und Klassifikation, Fakten und deren Beziehungen extrahiert und in eine semantische Struktur überführt. Auffinden von Wissen erfolgt über Information Retrieval Methoden, welche neben inhaltlichen Ähnlichkeiten auch semantische Zusammenhänge berücksichtigen.

Zu berücksichtigen ist unter anderem, das textbasiertes Retrieval Aufgrund fehlender OCR (Optical Character Recognition) Methoden für den gesamten Datenbestand nicht möglich ist. So können z.B. handschriftliche Dokumente nur schwer in eine sinnvolle textuelle Form überführt werden. Um dennoch inhaltsbasiertes Retrieval zu ermöglichen sollen Methoden aus dem Bereich des Bildretrievals in Kombination mit semantischen Technologien untersucht werden. Grundidee ist dabei die Überführung einer textuellen Suchanfrage in eine Bildrepräsentation (z.B. in einen handschriftlichen Linienzug) und anschließender Suche nach ähnlichen Bildern unter Berücksichtigung semantisch modellierter Beschränkungen.

top

DYONIPOS - Dynamic Ontologybased Integrated Process Optimisation

Partner: Fit-IT Semantic Systems

The DYONIPOS mission is to develop context sensitive, intelligent, and agile semantic technologies which provide the basis for significant productivity improvement of knowledge intensive organizations. Agile semantic technologies will enable the uniform handling of structured as well as unstructured business process parts and data, thus supporting two crucial roles a knowledge worker has to fill in a business process oriented environment: Support for process executers in the efficient, standardized but still flexible execution of business processes and support for process engineers in the definition of such standardized processes based on existing work practice.

The process-oriented goal of DYONIPOS is to resolve the dilemma of flexibility for knowledge workers versus organizational needs for standardization and control by supporting the grass roots development and evolution of workflows from ad hoc processes without relinquishing the needed organizational control.Ad hoc processes provide the link between the business process executer and the business process engineer. They consist of defined in- and outputs, but leave the way to accomplish the defined outputs up to the knowledge worker and her specific context.

The technology-oriented goal of DYONIPOS is to develop sophisticated agile semantic technologies which have the power to deal with the multitude of technological challenges involved in the handling of ad hoc processes. The task of process executors will be supported by intelligent proposals of succeeding processes, intelligent information delivery and contextual information extraction facilities. The tasks for process engineers will be supported in semantic analysis and visualisation methods for ad hoc process analysis and the automatic optimization of ad hoc processes based on new optimization algorithms.

DYONIPOS will develop new technology suitable to cope with dynamic and agile organizational environments while still allowing a high level of standardisation and control.

top

MISTRAL- Measurable Intelligent and Reliable Semantic Extraction and Retrieval of Multimedia Data

Partner: TU-Graz

 

 

Multimedia data has a rich and complex structure in terms of inter- and intra-document references and can be an extremely valuable source of information. However, this potential is severely limited until and unless effective methods for semantic extraction and semantic-based cross-media exploration and retrieval can be devised. Today’s leading-edge techniques in this area are working well for low-level feature extraction (e.g. colour histograms), are focussing on narrow aspects of isolated collections of multimedia data, and are dealing only with single media types. MISTRAL follows the following lines of radically new research: MISTRAL will extract a large variety of semantically relevant metadata from one media type and integrate it closely with semantic concepts derived from other media types. Eventually, the results from this cross-media semantic integration will also be fed back to the semantic extraction processes of the different media types so as to enhance the quality of the results of these processes. MISTRAL will focus on most innovative, semantic-based cross-media exploration and retrieval techniques employing concepts at different semantic levels. MISTRAL addresses the specifics of multimedia data in the global, networked context employing semantic web technologies. The MISTRAL results for semantic-based multimedia retrieval will contribute to a significant improvement of today’s human-computer interaction in multimedia retrieval and exploration applications (see http://www.mistral-project.at/).

top

   
 

Service Orientierte Knowledge Discovery Architektur

 

Aktuell zeigt sich ein wachsender Trend hin zu Service Orientierten Architekturen und semantische angereicherten Web Services. Auch im Bereich der Wissenserschließung zeigt sich ein Mehrwert beim Trennen von datenorientierten (z.B. Spider, Gathering) und funktionsorientierten Services (e.g. Clustering, Klassifikation) sowie deren Wiederverwendbarkeit in verschiedenen anwendungsorientierten Szenarien. Abhängig von der Datenbasis kann Clustering somit z.B. im Retrieval, als auch zur Konzeptextraktion im Bereich Ontology Learning verwendet werden.

Ziel im Projekt ist die Definition exakter Schnittstellen für die unterschiedlichen Aufgaben der Wissenserschließung sowie deren Implementierung. Im Speziellen erfolgt die Betrachtung der unterschiedlichen Daten u. Informationsflüsse (z.B. Inhalte, Metadaten, beschreibende Merkmale etc.)sowie deren mögliche anwendungsorientierte Gruppierung. Zusätzlich wird zwischen funktionalen Services, Datenservices und Workflow-Services unterschieden.

Durch die Implementierung der definierten Schnittstellen sowie deren anwendungsorientierter Einsatz soll die Machbarkeit und Anwendbarkeit der SOA demonstriert werden. Bei der Implementierung wird schon auf bestehende Funktionalität zurückgegriffen.

Als Proof of Concept ist die Implementierung von personalisierten Ähnlichkeitssuchen in multimedialen Daten geplant. Dabei soll die Möglichkeit der Kombination aus Metadaten-, Volltext- und inhaltsbasierter Ähnlichkeitssuche (Low-Level Features) untersucht werden, um Benutzern eine möglichst optimale Ergebnismenge präsentieren zu können. Da eine solche Kombination der Parameter nicht ad-hoc vom Benutzer bestimmt werden kann, soll das Suchverhalten des Benutzers analysiert und die entsprechenden Parameter daraus abgeleitet werden. Möglichkeiten dazu bieten verschiedene, teilweise im Vorjahr entwickelte Visualisierungs- und Knowledge Discovery Techniken sowie auf Relevanzfeedback basierende Verfahren. Unter Einsatz niedrig dimensionaler Visualisierungsverfahren (1-D, 2-D, 3-D) soll dem Benutzer die Möglichkeit eines interaktiven Feedbacks gegeben werden, durch welches die Ähnlichkeiten zwischen Objekten automatisch adaptiert und der Parameterraum entsprechend skaliert wird.

top