Topic: | In der pharmazeutischen und biotechnologischen Forschung werden heute automatisiert große Mengen von Molekülen auf spezielle Eigenschaften experimentell getestet. Beispielsweise werden im High‐Throughput‐Screening Moleküle auf ihre Fähigkeit zur Inhibition spezieller Proteine untersucht. Die Auswertung dieser Daten erfolgt computergestützt. Häufig ist zunächst das Ziel, Gemeinsamkeiten und Unterschiede zwischen aktiven, d.h. positiv getesteten Molekülen zu identifizieren. In diesem Prozess ist Kreativität und Erfahrung von Wissenschaftlern ein ganz zentraler Baustein. Es gibt keine einfachen Schemata, in der Regel bedarf es der richtigen Intuition, um ein Modell zu erhalten, welches Aktivität durch die Struktur der Moleküle erklären kann. Für die computergestützte Analyse steht heute eine Vielzahl von Deskriptoren zur Beschreibung der Molekülstruktur zur Verfügung. Diese stellen die strukturelle und auch biologisch‐pharmakologische Ähnlichkeit der Moleküle bereits sehr gut dar. In der Regel sind es aber nur wenige ausgezeichnete Eigenschaften, deren Zusammenwirken Aktivität erklären kann. Aus diesem Grund werden bereits seit vielen Jahren maschinelle Lernverfahren zur Ableitung von Modellen eingesetzt. Dem Wissenschaftler kommt in diesem Prozess eine eher passive Rolle zu: Er kann mittels weiterer Testdaten die Qualität des Modells prüfen, aber nur in sehr geringem Maße konstruktiv in den Modellbildungsprozess eingreifen. Im Rahmen dieses Projektes möchten wir neue computergestützte Methoden entwickeln, um das intuitive Wissen des Anwenders mit maschinellen Lernverfahren in optimaler Weise zu koppeln. Der Grundgedanke ist, einen fließenden Übergang zwischen der händischen und maschinellen Klassifikation von Daten technisch zu ermöglichen. Dazu möchten wir neue, innovative, inkrementelle Lernverfahren wie beispielsweise Active Learning einsetzen. Bei diesen Verfahren werden die Daten schrittweise durch den Benutzer klassifiziert. Währenddessen können maschinelle Lernverfahren das Verhalten des Nutzers analysieren und Vorschläge zur Klassifikation unterbreiten. Der Nutzer kann anhand der Fehlerrate jederzeit entscheiden, zu einer dann automatischen Klassifikation überzugehen. Wichtig ist uns, den Ansatz so in Software umzusetzen, dass er sich für den täglichen Einsatz durch Naturwissenschaftler, nicht durch Informatiker, eignet. Die Software soll dazu graphischinteraktiv nach dem Vorbild von Mind Maps agieren. |