„Es gibt Standards für Biobanking“

Interview mit Dr. Sara Y. Nußbeck, Universitätsmedizin Göttingen, zu Biobanken-IT

„Es gibt Standards für Biobanking“

November 2014. „Je mehr die Probendokumentation und die Anfragen standardisiert sind, desto besser können sie mit IT unterstützt automatisiert werden,“ erklärt Dr. Sara Y. Nußbeck (Universitätsmedizin Göttingen), die sich schwerpunktmäßig mit dem Thema IT für Biobanken beschäftigt und ihre Expertise in der TMF sowohl in der AG Biomaterialbanken als auch im IT-Reviewing-Board einbringt.

Frau Dr. Nußbeck, Biobanken spielen in der medizinischen Forschung eine immer größere Rolle. Ohne eine professionelle IT-Unterstützung können sie heute kaum noch betrieben werden. Warum ist das so?

Ohne IT-Unterstützung geht es nicht, weil man in einer Biobank – neben den Proben – eine riesige Menge an Datensätzen hat. Das sind zum einen Daten, die die Probe beschreiben, zum anderen auch klinische Informationen des Spenders. Das gilt sowohl für populationsbasierte Biobanken wie die UK Biobank oder künftig auch bei der Nationalen Kohorte als auch bei einer Biobank im Krankenhausumfeld. Gerade wenn eine Biobank wirklich große Mengen an Proben hat und ich als Forscher gezielt nach etwas suchen möchte, dann möchte ich natürlich nicht Karteikarten oder Exceltabellen durchblättern, sondern möchte mit einem Suchbefehl eine gute Trefferliste bekommen, möglichst mit einer genauen Charakterisierung der Proben und Hinweisen oder Möglichkeiten, wie ich an die Proben herankomme.
  

Wissen Sie, welche Software-Produkte hier eingesetzt werden?

Aufgrund einer Umfrage, die wir im vergangenen Jahr im Rahmen des IT-Reports der TMF gemacht haben und die wir gerade aktualisieren, wissen wir, dass sich in Deutschland das Gros der Biobanken zwischen den Systemen Starlims und Centraxx teilt. Wir schätzen, dass aktuell bereits etwa 65 Prozent der Biobanken eine kommerzielle Verwaltungssoftware einsetzen. Von denjenigen, die momentan noch eine Eigenlösung verwenden, plant etwa die Hälfte ebenfalls, auf eine kommerzielle Software umzuschwenken. Das ist auch klar, wenn man bedenkt, wie unterschiedlich und komplex die Anforderungen an die Funktionalitäten einer solchen Software sind, so dass Eigenimplementierungen das gar nicht komplett abdecken können.
  

Wie erklären Sie sich diesen Trend zur kommerziellen Biobanksoftware?

Man muss ja den kompletten Workflow abbilden von der Probengewinnung über die Registrierung, Verarbeitung, Einlagerung und Charakterisierung für die Suche, die Arbeitsschritte für die Ethik-Freigabe bis hin zur Abrechnung der Leistungen, die in der Biobank erbracht werden, und den Versand der Proben. Jemand, der sich mit der Materie nicht sehr genau auskennt, kann das gar nicht alles von Anfang an überblicken. Die Produkte, die wir mittlerweile am Markt haben, sind in den unterschiedlichen Bereichen eigentlich schon sehr ausgereift, so dass die höheren Investitionskosten sicher gut eingesetzt sind. Letztendlich hängt die Entscheidung aber immer auch daran, wie viel IT-Support an einem Standort vorhanden ist und wie sehr die Biobank in vorhandene IT-Infrastrukturen eingebunden werden soll.
  

Welche Komponenten gehören denn zu einer IT-Architektur für Biobanken?

Eine Probe wird ja umso wertvoller, je mehr Informationen zum jeweiligen Spender verfügbar sind. Das können klinische Informationen über die Grunderkrankung des Spenders sein, Bildinformationen wie MRTs aus einem PACS oder auch Blutwerte aus dem Laborinformationssystem. Gerade wenn es sich um Gewebeproben handelt, können auch die Daten aus einem Pathologiesystem aufschlussreich sein, zum Beispiel der TNM-Status von Tumorproben. Das ist sehr breit gefächert, und alle diese Systeme muss ich in die Biobank IT-Architektur einbinden. Die Frage ist dann, wie die ganze Systemlandschaft aufgebaut ist, um beispielsweise den Abfrage-Workflow zu organisieren. Wie die jeweilige Architektur aussehen muss, hängt natürlich immer auch vom Konzept der jeweiligen Biobank ab.
  

Haben Sie einen Überblick darüber, wer diese Management-Software an den wissenschaftlichen Einrichtungen pflegt und betreibt?

Das ist eine gute Frage. Eine richtige Übersicht habe ich nicht. Ich weiß, dass an den Biobank-Standorten teilweise IT-Personal extra eingestellt wurde, mindestens einer, meist zwei Mitarbeiter, die sich speziell um die IT kümmern. Es gibt aber auch Standorte wie Erlangen oder Göttingen, bei denen ein großes Medizininformatik-Institut dahintersteht. Dort setzen sich dann mehr Leute mit der kompletten Studieninfrastruktur auseinander; die Biobank ist dann eine Komponente davon. Wie ein Projekt das anlegt, hängt immer auch davon ab, wie sehr die Leitungsebene sozusagen „IT-durchdrungen“ ist: Macht sich da jemand wirklich Gedanken über die Infrastruktur? Sonst muss man im Endeffekt häufig mit den Konsequenzen leben und sehen, wie man die Daten dann später irgendwie zusammenführen kann. Je früher IT-Kompetenz eingebunden wird, desto einfacher ist letztendlich die Integration.
  

Die Nutzer der Systeme sind aber eher keine IT-Leute...

Genau. Ich sehe drei Hauptgruppen:

Das Biobank-Personal, das mit den Proben direkt arbeitet und für deren Lagerung und Aufbereitung zuständig ist. Die sollten auf jeden Fall Schulungen erhalten, um mit der Software umgehen zu können. Hier können gerade auch die zentralen Biobanken, die derzeit an den Universitätsstandorten aufgebaut werden, Unterstützung leisten und die Abteilungen und Institute beraten – zum sinnvollsten Vorgehen, zur Dokumentation oder dazu, wie man die Lagerstruktur eines Kühlschranks in einem IT-System abbildet.

Die zweite Gruppe ist das Pflegepersonal: Die flüssigen Proben werden beispielsweise im Krankenhaus auf einer Station gewonnen, und das Pflegepersonal dort muss die Dokumentation im System zumindest irgendwie anstoßen.

Und dann gibt es natürlich die anfragenden Forscher, die eine bestimmte Forschungsfragestellung haben und dafür Proben mit einer bestimmten Charakterisierung benötigen. Die brauchen eine gute Suchfunktion, wobei sie nach den TMF-Datenschutzkonzepten gar nicht direkt in der Biomaterialverwaltung suchen würden, sondern eher in einem übergeordneten System, in dem die Informationen aus den einzelnen Subsystemen – also beispielsweise klinische Annotationen, Bildinformationen und Probeninformationen – zusammenlaufen. Je nach Berechtigung gemäß Datenschutzkonzept dürfte der Forscher dann entweder nur ganz abstrakt in den Metadaten suchen oder bis auf die Probenebene hinunter gehen.
  

Welche Standards sind nötig, damit die IT-Systeme interoperabel sind?

Es wäre natürlich schön, wenn alle Daten, die irgendwie im Zusammenhang mit Biobanken stehen genau einen Standard hätten. Denn wenn ich mehrere Standards habe, muss ich natürlich zwischen diesen unterschiedlichen Standards mappen.

Für die präanalytischen Faktoren gibt es  den sogenannten SPREC, den ‚Sample Preanalytical Code‘, der 2010 von der ISBER-Arbeitsgruppe Biospecimen Science um Fay Betsou entwickelt wurde. Dieser Code beschreibt, wie zum Beispiel Zentrifugationszeiten, Geschwindigkeit, Temperatur oder Lagerzeiten zwischen Zentrifugationsschritten dokumentiert werden sollten, um später eine Aussage über die Qualität der einzelnen Proben machen zu können.

Darüber hinaus gibt es BRISQ. Dieses ‚Biospecimen Reporting for Improved Study Quality‘ wird in einem Paper beschrieben, das 2011 von Moore et al. vom National Cancer Institute publiziert wurde. Ich würde das schon als Standard bezeichnen, auch wenn nicht genau vorgegeben ist, wie man die einzelnen Felder dokumentieren soll. Hier wird vorgeschlagen, dass man beim Einreichen eines Manuskriptes, in dem Forschungsergebnisse enthalten sind, die auf Biomaterialien beruhen, bei einer Fachzeitschrift bestimmte Angaben zu den Proben und den Spendern macht. Durch diese grobe Klassifizierung und Charakterisierung erhalten andere Forscher und die Gutachter des Manuskripts zumindest einen groben Anhaltspunkt dazu, was als Forschungsgrundlage verwendet wurde. Ein Problem hierbei ist allerdings noch, dass nicht genau vorgegeben ist, wie die klinischen Informationen kodiert werden sollen.

In der europäischen Biobanken-Infrastruktur BBMRI gibt es außerdem noch den Ansatz von MIABIS, bei dem es mehr darum geht, unterschiedliche Kohorten oder Studiengruppen zu beschreiben. Wenn ein anderer Forscher das interessant findet, kann er die jeweilige Biobank kontaktieren und nachfragen, welche Proben hier konkret vorhanden sind. Das liegt also auf einem sehr abstrahierten Level.

Je mehr die Probendokumentation und die Anfragen standardisiert sind, desto besser können sie natürlich mit IT unterstützt und der Suchvorgang wirklich automatisiert werden. Und das ist einfacher, wenn man sich von vornherein auf Standards einigt, die dann alle einhalten. Wenn erst mal alle zehn Jahre lang gemacht haben, was sie für richtig halten, wird es nachher sehr aufwändig sein, das eine auf das andere zu übertragen.
  

Wie ist Ihre Einschätzung für den Einsatz der Standardisierung derzeit in den Biobanken?

Wir haben diese Frage letztes Jahr auch auf der europäischen Biobanken-Konferenz gestellt, wo 200 Leute im Publikum waren. Ich kann nicht einschätzen, wie viele davon Kliniker und wie viele Biobanker waren. Ich habe aber den Eindruck, dass viele Wissenschaftler überhaupt noch nicht wissen, dass es entsprechende Standards bereits gibt. Das reicht von der Probenentnahme über die Standards, die ich eben genannt habe, bis zur Analyse. Es gibt zum Beispiel Standards dafür, wie man eine DNA-Sequenzierung mit Metadaten beschreibt, aber im Labor haben viele Leute davon noch nie etwas gehört, weil sie sich nicht unbedingt mit dem Management ihrer Daten auseinandersetzen. Hier müssten Kliniker und Medizininformatiker näher zusammenrücken und sich mehr austauschen. Es sollten auch entsprechende Fortbildungsmaßnahmen angeboten werden, um die Standards publik zu machen. Denn nur wenn sie bekannt sind, können sie auch verwendet werden.
  

Sie planen auch eine IT-Session auf dem Nationalen Biobanken-Symposium im Dezember in Berlin...

Richtig. Im Programmkomitee haben wir hierfür einerseits Beiträge ausgewählt, die meinungsbildend sind: also ein Vorreiter, der vorstellt, wie bei einer funktionierenden Biobank die IT-Unterstützung aussehen kann. Andere Beiträge werden aber auch denen, die mit ihrer IT für die Biobank eher am Anfang stehen, Hilfestellung beispielsweise für den Auswahlprozess für eine Biobank-Software geben. Wir hatten viele sehr interessante Einreichungen, und es ist uns sehr schwer gefallen, davon vier Beiträge für die etwa einstündige Session auszuwählen. Ich bin schon sehr gespannt, was wir da noch lernen werden!
  

Frau Dr. Nußbeck, wir bedanken uns für das Gespräch
 

Dr. Sara Y. Nußbeck ist Leiterin der AG CIOffice Forschungsnetze im Institut für Medizinische Informatik der Universitätsmedizin Göttingen.

Das Interview führte Antje Schütt.