Preprints als Informationsquelle besser nutzbar machen
TH Köln und ZB MED entwickeln im DFG-Projekt eine Information Extraction Pipeline für Preprints.
Im Projekt PIXLS – Preprint Information eXtraction for Life Sciences werden die TH Köln und ZB MED – Informationszentrum Lebenswissenschaften in den kommenden drei Jahren eine Anwendung entwickeln, die Preprint Server automatisiert erschließt. Damit kann die Forschungscommunity die aktuellen Informationen, die auf Preprint Servern veröffentlicht wurden – und daher in klassischen Nachweis- und Suchsystemen kaum auftauchen – besser nutzen. Die Deutsche Forschungsgemeinschaft (DFG) fördert das Projekt im Rahmenprogramm e-Research Technologien.
Preprints stellen eine relativ neue Art dar, wissenschaftliche Ergebnisse noch vor dem Peer Review und der Veröffentlichung in einem Fachjournal für die Forschung bereitzustellen. So können aktuelle Erkenntnisse schnellstmöglich verbreitet und nachgenutzt werden. Mittlerweile gibt es verschiedene Server, die Preprints für unterschiedliche Forschungscommunitys bereitstellen. Sie unterscheiden sich technisch oder inhaltlich. Preprints.org ist beispielsweise multidisziplinär ausgerichtet, während bioRxiv ausschließlich Preprints aus den Lebenswissenschaften enthält.
Die Arbeitsgruppen aus der TH Köln – unter Leitung von Prof. Dr. Philipp Schaer – und von ZB MED – unter Leitung von Prof. Dr. Konrad Förstner – werden in PIXLS ein System entwickeln, das die bisher noch vernachlässigten Informationsquellen auf den Preprint Servern systematisch erschließt und durch Mehrwertdienste besser zugänglich macht. So können sowohl die Volltexte als auch die Metadaten einfacher nachgenutzt werden. Das PIXLS-Team setzt dabei auf eine sogenannte Information Extraction Pipeline, eine Anwendung, die aus den unstrukturierten Daten der Preprints – also Fließtexte oder Zahlen – strukturierte Informationen extrahiert. Solche strukturierten Informationen können von Datenbanken besser verarbeitet werden. Sie können dadurch auf vielfältige Weise nachgenutzt werden und sind darüber hinaus einfacher auffindbar.
Die extrahierten Daten werden im ZB MED Knowledge Environment – eine von ZB MED bereits entwickelte Datenbank – zusammengeführt und vereinheitlicht. Diese Datenbasis macht es dann möglich, Mehrwertdienste zu entwickeln und für die Forschung bereit zu stellen. Das können zum Beispiel Linked-Open-Data-Schnittstellen oder innovative Reputations- und Trendindikatoren sein. Die Daten werden auch über LIVIVO, den Discovery Service von ZB MED, verfügbar sein. Im Sinne von Open Science werden sowohl die Daten als auch die Technologie der Bibliotheks- und Wissenschaftscommunity zur Nachnutzung zur Verfügung gestellt.
Ulrike Ostrzinski
Pressesprecherin ZB MED
Fon: +49 (0) 221 478 5687
Fax: +49 (0) 221 478 7124
pressestelle@zbmed.de
Media Contact
Alle Nachrichten aus der Kategorie: Kommunikation Medien
Technische und kommunikationswissenschaftliche Neuerungen, aber auch wirtschaftliche Entwicklungen auf dem Gebiet der medienübergreifenden Kommunikation.
Der innovations-report bietet Ihnen hierzu interessante Berichte und Artikel, unter anderem zu den Teilbereichen: Interaktive Medien, Medienwirtschaft, Digitales Fernsehen, E-Business, Online-Werbung, Informations- und Kommunikationstechnik.
Neueste Beiträge
Sensoren für „Ladezustand“ biologischer Zellen
Ein Team um den Pflanzenbiotechnologen Prof. Dr. Markus Schwarzländer von der Universität Münster und den Biochemiker Prof. Dr. Bruce Morgan von der Universität des Saarlandes hat Biosensoren entwickelt, mit denen…
Organoide, Innovation und Hoffnung
Transformation der Therapie von Bauchspeicheldrüsenkrebs. Bauchspeicheldrüsenkrebs (Pankreaskarzinom) bleibt eine der schwierigsten Krebsarten, die es zu behandeln gilt, was weltweite Bemühungen zur Erforschung neuer therapeutischer Ansätze anspornt. Eine solche bahnbrechende Initiative…
Leuchtende Zellkerne geben Schlüsselgene preis
Bonner Forscher zeigen, wie Gene, die für Krankheiten relevant sind, leichter identifiziert werden können. Die Identifizierung von Genen, die an der Entstehung von Krankheiten beteiligt sind, ist eine der großen…