Chemoinformatik

Erweiterte Suche

(Weitergeleitet von Computerchemie)

Chemoinformatik, Cheminformatik oder Chemieinformatik (englisch: Chemoinformatics, Cheminformatics, Chemical Informatics oder Chemiinformatics) bezeichnet einen Wissenschaftszweig, der das Gebiet der Chemie mit Methoden der Informatik verbindet mit dem Ziel, Methoden zur Berechnung von Moleküleigenschaften zu entwickeln und anzuwenden. Zu den Urvätern gehören unter anderem Paul deMain, Johann Gasteiger, Jure Zupan und Ivar Ugi.

Der Begriff „Chemoinformatik“ ist relativ jung, während die älteren Termini Computerchemie (abgeleitet von englisch: Computational Chemistry) und chemische Graphentheorie das gleiche Gebiet bezeichnen (Lit.: Bonchev/Rouvray, 1990). Computerchemie wird heutzutage eher als ein Teilgebiet der Theoretischen Chemie und der Quantenchemie begriffen.

Grundlagen

Chemoinformatik beschäftigt sich mit Berechnungen an digitalen Repräsentationen von Molekülstrukturen. Molekülstrukturen können als Grafen aufgefasst werden. Als ihre Repräsentation ist für viele Anwendungen bereits die sog. Bindungstabelle (englisch: connection table) ausreichend, in der die Art der Verknüpfungen (Bindungen) zwischen den einzelnen Atomen eines Moleküls abgelegt ist. Erst für weitergehende Betrachtungen kann die Einbeziehung von zweidimensionalen (2-D-) bzw. dreidimensionalen (3-D-)Koordinaten notwendig werden. Letztere werden insbesondere benötigt, wenn, etwa im Bereich der Medizinischen Chemie, Wechselwirkungen mit Biomolekülen wie Proteinen untersucht werden sollen.

Die Größe des gesamten theoretischen chemischen Raumes, welcher aus allen denkbaren (virtuellen) Molekülstrukturen besteht, wird auf etwa 1062 Moleküle geschätzt und ist damit weit größer als die Menge der bisher real synthetisierten Moleküle (Lit.: Lahana, 1999). Mithilfe von computerbasierten Methoden lassen sich aber unter Umständen viele Millionen Moleküle bereits theoretisch (in silico) analysieren, ohne diese zunächst für Messungen im Labor synthetisieren zu müssen.

Repräsentation chemischer Strukturen

Die Repräsentation chemischer Strukturen ist eine der grundlegenden Fragestellungen. Für einen Großteil der Anwendungen hat sich die Darstellung als Bindungstabelle (Connection-Table) basierend auf der Valenzstrukturtheorie durchgesetzt. Als Beispiel einer Bindungstabelle sei hier Acesulfam im Standardformat Molfile der Firma MDL angegeben. Die Zeilen 5–14 enthalten die x-, y- und z-Koordinaten und Elementbezeichner der Atome, die Zeilen 15–24 die Bindungstabelle mit den Ausgangs- und Endatomen jeder Bindung sowie dem Bindungstyp. Die Null-Spalten enthalten mögliche weitere Bezeichner.

Acesulfame
  -ISIS-  05070815372D

 10 10  0  0  0  0  0  0  0  0999 V2000
    3.2283   -1.4806    0.0000 S   0  0  3  0  0  0  0  0  0  0  0  0
    2.5154   -1.8944    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
    3.2283   -0.6538    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    4.0544   -1.4806    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    3.6448   -2.1935    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    1.7990   -1.4806    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.5154   -0.2406    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.7990   -0.6538    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.0826   -1.8944    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    2.5154    0.5855    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  1  0  0  0  0
  1  3  1  0  0  0  0
  1  4  2  0  0  0  0
  1  5  2  0  0  0  0
  2  6  1  0  0  0  0
  3  7  1  0  0  0  0
  6  8  1  0  0  0  0
  6  9  2  0  0  0  0
  7 10  1  0  0  0  0
  7  8  2  0  0  0  0
 M  END

Zusätzlich zur Bindungstabelle können 3-D-Koordinaten für real existierende Moleküle über Röntgenstrukturanalyse ermittelt werden. Wo dies nicht möglich ist oder ein Molekül physisch nicht existent ist, können 3-D-Koordinaten zumindest näherungsweise auch unmittelbar aus der Bindungstabelle durch iterative Energie-Minimierungsrechnungen für verschiedene Konformationen eines Moleküls erzeugt werden. 2-D-Koordinaten dienen in der Regel allein der Veranschaulichung eines Moleküls und müssen daher hauptsächlich ästhetischen Ansprüchen genügen. Sie werden ebenfalls unmittelbar aus der Bindungstabelle nach allgemein anerkannten chemischen Zeichenregeln errechnet, geben jedoch nur in den seltensten Fällen die tatsächlichen räumlichen Gegebenheiten in einem Molekül wieder.

Methoden

Verfahren, die keine empirischen Parameter benötigen, werden als Ab-initio-Methoden bezeichnet. Semiempirische Verfahren enthalten empirische Größen und weitere semiempirische Parameter, die durch theoretische Vorgehensweisen bestimmt wurden, jedoch keinen Bezug zu messbaren Größen mehr haben. Prinzipiell sind Ab-initio-Verfahren für kleinere Moleküle geeignet. Semiempirische Verfahren spielen ihre Stärke bei mittelgroßen (100 Atome) Molekülen aus. Beispiele für semiempirische Methoden sind MNDO und AM1.

Ab-initio-Methoden

Die Güte, mit denen Ab-initio-Verfahren die Eigenschaften von Molekülen berechnen können, hängt im Wesentlichen vom Basissatz der Atome ab, das heißt, wie gut und mit wie vielen einzelnen Funktionen die Atomorbitale dargestellt werden. Ab-initio-Verfahren, die auch die Elektronenkorrelation berücksichtigen, sind deutlich aufwändiger, liefern jedoch die besten Resultate. Man behilft sich mit einem Kompromiss und bezieht die Elektronenkorrelation näherungsweise ein. Beispiele für solche Verfahren sind: Møller-Plesset-Störungstheorie, CI (Configuration-Interaction), CC (Coupled Cluster), MCSCF (Multi-Configuration-self-consistent-Field).

Semiempirische Verfahren

Bei semiempirischen Verfahren wird ein Großteil der Integrale des Hartree-Fock-Formalismus vernachlässigt, andere werden durch spektroskopische Werte, Parameter oder parametrisierte Funktionen angenähert. Grund für diese Approximation war die geringe Rechenkapazität früherer Zeiten. Um die theoretischen Erkenntnisse dennoch auf chemische Fragestellungen anwenden zu können, musste der vorhandene Formalismus vereinfacht werden.

Die Hückel-Näherung ist der einfachste semiempirische Ansatz, da sie gar keine Integrale berechnet. Allerdings ist sie auch nur auf $ \pi $-Elektronensysteme anwendbar. Die Theorie wurde später auch auf $ \sigma $-Systeme erweitert (Extended-Hückel-Theory, EHT).

Etablierte Methoden, die auch heutzutage noch häufig angewendet werden, gehören zur Klasse der NDDO-Näherung (Neglect of Diatomic Differential Overlap): MNDO (Modified Neglect of Differential Overlap), AM1 (Austin-Model 1), PM3 (Parametrised Method 3). Für kritische Berechnungen sind semiempirische Methoden mit CI und MCSCF kombiniert worden. Mit solchen Verfahren sind dann beispielsweise Reaktionsbarrieren und ganze Energieprofile komplexer Reaktionen berechenbar (MNDO/CI, MNDO/MCSCF).

Die Grenzen semiempirischer Methoden liegen in ihrer Parametrisierung: Eigentlich können mit der fertigen Methoden nur Systeme gerechnet werden, die in ähnlicher Weise im Parametrisierungsdatensatz vorhanden waren.

Molekularmechanische Verfahren

Kraftfeldprogramme verwenden einen klassisch-mechanischen Ansatz: Bindungen zwischen zwei Atomen A und B werden dabei einfach als Sprungfeder angenähert und mit einem harmonischen Potenzial beschrieben (Hookesches Gesetz):

$ E_{AB}=k_{AB}(r_{AB}^{0}-r)^{2} $

Da eine Doppelbindung zwischen zwei Kohlenstoffatomen eine andere Stärke und Gleichgewichtslänge als eine Einfachbindung besitzt, werden unterschiedliche Parametersätze benötigt (Kraftkonstante $ k_{AB} $ und Ruhelage $ r_{AB}^{0} $). Man verwendet daher zur Kennzeichnung der Atome keine einfachen Elemente mehr, sondern Atomtypen. Ähnliche Ansätze gibt es für Bindungs- und Torsionswinkel. Elektrostatische (Coulomb) und Van-der-Waals-Wechselwirkungen bezeichnet man als nicht-bindende Wechselwirkungen. Kraftfeldmethoden müssen an empirische Daten parametrisiert werden, so dass ein Kraftfeld durch zweierlei charakterisiert ist, seine Energiefunktion und den Parametersatz.

Kraftfelder ermöglichen die Geometrieoptimierung sehr großer (Bio-)Moleküle (zum Beispiel: Proteine) und werden hauptsächlich für Moleküldynamik- oder Monte-Carlo-Simulationen verwendet.

Anwendungen

Es gibt verschiedene wichtige Themen innerhalb des Gebiets – eine Auswahl:

  • Die computergestützte Darstellung von Molekülen und die quantenmechanische Berechnung ihrer Eigenschaften.
  • Anwendungen, die Chemikalien strukturiert speichern und finden können (Datenbanken)
  • Methoden, um die Systematiken in der Wechselwirkung zwischen Molekularstruktur und Eigenschaften der Stoffe zu verstehen (QSPR).
  • Kraftfeldrechnungen zur Geometrieoptimierung großer Moleküle
  • Moleküldynamik zur Berechnung von Bindungsthermodynamik der Enzyme
  • Computergestützte Syntheseplanung
  • Computergestützte Prognose der Wirksamkeit von Arzneimitteln

Im Folgenden werden ausgewählte Anwendungsbeispiele genauer dargestellt.

Quantitative Struktur-Wirkungs-Beziehung

Mithilfe geeigneter Algorithmen werden Kodierungen für Moleküle entwickelt. Durch Induktion können neue Hypothesen über molekulare Eigenschaften erstellt werden, wie zum Beispiel die Bioverfügbarkeit oder die Fähigkeit einer Substanz, die Funktion eines bestimmten Proteins im Organismus zu hemmen oder zu verstärken (siehe auch: QSAR).

Leitstrukturoptimierung

Durch geeignete chemische und biologische Hypothesen lässt sich dieser chemische Raum auf wenige Kandidaten reduzieren, die dann im Labor synthetisiert und klinisch getestet werden. Aus diesem Grund spielt die Cheminformatik im Bereich der pharmazeutischen Chemie und der Medizinalchemie eine große Rolle zur Optimierung von Leitstrukturen.

Thermodynamik

In der technischen Chemie werden Gruppenbeitragsmethoden verwendet, um Stoffeigenschaften wie Normalsiedepunkte, kritische Daten, Oberflächenspannungen und anderes mehr abzuschätzen.

Molekulare Modellierung

Die Molekulare Modellierung beschäftigt sich beispielsweise mit der Schaffung von Modellen unbekannter Makromoleküle anhand der Vorlage (Template) ähnlicher, bekannter Moleküle (Homologiemodeling), der Wechselwirkung zwischen kleinen und großen Molekülen (Rezeptordocking), wodurch QSAR möglich wird, der Moleküldynamik sowie die Entwicklung energitisch minimierter 3-D-Strukturen von Molekülen (Bergsteigeralgorithmus, Simulierte Abkühlung, Molekülmechanik etc.). Es geht also darum, aufgrund bekannter Strukturen Modelle von unbekannten Strukturen zu entwickeln, um so eine QSAR zu ermöglichen.

Verwandte Gebiete

Es gibt einen starken Bezug zur Analytischen Chemie und zur Chemometrie. Die Struktur-Eigenschafts-Beziehungen (beispielsweise: Spektrenkorrelation) spielen eine zentrale Rolle. Aufgrund vergleichbarer Arbeitsweise existiert eine enge Beziehung zur Computerphysik, wodurch eine klare Trennung häufig nicht eindeutig gegeben ist.

Softwarepakete

Die Programme der Computerchemie basieren auf verschiedenen quantenchemischen Methoden zur Lösung der molekularen Schrödingergleichung. Grundsätzlich lassen sich zwei Ansätze unterscheiden: Semiempirische Verfahren und Ab-initio-Verfahren.

Alle beschriebenen Verfahren und Methoden sind in gängigen Softwarepaketen verfügbar. Beispiele hierfür: ACES, GAUSSIAN, GAMESS, MOLPRO, Spartan, TURBOMOLE, Cerius2 und Jaguar. ArgusLab eignet sich als frei verfügbares Programm zum Einstieg in der Computerchemie.

Die Herausforderung für den Anwender dieser Software ist es, das am besten geeignete Modell für seine Problemstellung zu finden und die Ergebnisse im Gültigkeitsbereich der Modelle zu interpretieren.

Siehe auch

Literatur

  • D. Bonchev, D. H. Rouvray: Chemical Graph Theory: Introduction and Fundamentals. Gordon and Breach Science Publishers, 1990, ISBN 0-85626-454-7.
  • R. Lahana: How many leads from HTS? Drug Discovery Today, 1999, 4, 447–448. doi:10.1016/S1359-6446(99)01393-8.
  • A. R. Leach, V. J. Gillet: An Introduction to Chemoinformatics. Kluwer Academic Publishers, 2003, ISBN 1-40201-347-7.
  • J. Gasteiger, T. Engel (Hg.): Chemoinformatics: A Textbook. John Wiley & Sons, 2003, ISBN 3-52730-681-1.
  • Theoretische Chemie#Literatur
  • Journal of Molecular Modeling, eine 2-monatlich erscheinende Fachzeitschrift

Weblinks

Die cosmos-indirekt.de:News der letzten Tage

29.05.2023
Elektrodynamik | Festkörperphysik | Quantenoptik
Informationen schneller fließen lassen – mit Licht statt Strom
Entweder 1 oder 0: Entweder es fließt Strom oder eben nicht, in der Elektronik wird bisher alles über das Binärsystem gesteuert.
25.05.2023
Kometen und Asteroiden | Biophysik
Meteoritisches Eisen: Starthilfe bei der Entstehung des Lebens auf der Erde?
Forscher haben ein neues Szenario für die Entstehung der ersten Bausteine des Lebens auf der Erde vor rund 4 Milliarden Jahren vorgeschlagen.
24.05.2023
Festkörperphysik | Astrophysik
Das Verhalten von Sternmaterie unter extremem Druck
Einem internationalen Team von Forscher*innen ist es in Laborexperimenten gelungen, Materie unter solch extremen Bedingungen zu untersuchen, wie sie sonst nur im Inneren von Sternen oder Riesenplaneten vorkommt.
23.05.2023
Quantenphysik | Quantencomputer
Turbo für das Quanteninternet
Vor einem Vierteljahrhundert machten Innsbrucker Physiker den ersten Vorschlag, wie Quanteninformation mit Hilfe von Quantenrepeatern über große Distanzen übertragen werden kann, und legten damit den Grundstein für den Aufbau eines weltweiten Quanteninformationsnetzes.
18.05.2023
Teilchenphysik | Quantencomputer
Quantenschaltkreise mit Licht verbinden
Die Anzahl von Qubits in supraleitenden Quantencomputern ist in den letzten Jahren rasch gestiegen, ein weiteres Wachstum ist aber durch die notwendige extrem kalte Betriebstemperatur begrenzt.
17.05.2023
Relativitätstheorie | Quantenphysik
Gekrümmte Raumzeit im Quanten-Simulator
Mit neuen Techniken kann man Fragen beantworten, die bisher experimentell nicht zugänglich waren – darunter auch Fragen nach dem Zusammenhang von Quanten und Relativitätstheorie.
16.05.2023
Sonnensysteme | Planeten | Geophysik
Die Kruste des Mars ist richtig dick
Dank eines starken Bebens auf dem Mars konnten Forschende der ETH Zürich die globale Dicke der Kruste des Planeten bestimmen.
11.05.2023
Sterne | Teleskope
Einblicke in riesige, verborgene Kinderstuben von Sternen
Mit dem Visible and Infrared Survey Telescope for Astronomy (VISTA) der ESO haben Astronomen einen riesigen Infrarot-Atlas von fünf nahe gelegenen Sternentstehungsgebieten geschaffen.
10.05.2023
Festkörperphysik | Quantenphysik | Quantencomputer
Verschränkte Quantenschaltkreise
ETH-Forschenden gelang der Nachweis, dass weit entfernte, quantenmechanische Objekte viel stärker miteinander korreliert sein können als dies bei klassischen Systemen möglich ist.
10.05.2023
Exoplaneten | Geophysik
Widerspenstiger Exoplanet lüftet seinen Schleier (ein bisschen)
Einem internationalen Forschungsteam, an dem das Max-Planck-Institut für Astronomie beteiligt ist, ist es nach fast 15 Jahren vergeblicher Anstrengungen gelungen, einige Eigenschaften der Atmosphäre des Exoplaneten GJ 1214 b zu ermitteln.
10.05.2023
Atomphysik
Forschende beschreiben flüssigen Quasikristall mit zwölf Ecken
Einen ungewöhnlichen Quasikristall hat ein Team der Martin-Luther-Universität Halle-Wittenberg (MLU), der Universität Sheffield und der Jiaotong-Universität Xi'an gefunden.
08.05.2023
Quantenphysik
Künstliche Intelligenz lernt Quantenteilchen zu kontrollieren
In der Quantenforschung braucht man maßgeschneiderte elektromagnetische Felder, um Teilchen präzise zu kontrollieren - An der TU Wien zeigte man: maschinelles Lernen lässt sich dafür hervorragend nutzen.
06.05.2023
Teilchenphysik | Kernphysik
Elektronen-Rekollision in Echtzeit auf einen Schlag verfolgt
Eine neue Methode erlaubt, die Bewegung eines Elektrons in einem starken Infrarot-Laserfeld in Echtzeit zu verfolgen, und wurde am MPI-PKS in Kooperation zur Bestätigung theoretischer Quantendynamik angewandt.
05.05.2023
Satelliten und Sonden | Quantenoptik
GALACTIC: Alexandrit-Laserkristalle aus Europa für Anwendungen im Weltraum
Alexandrit-Laserkristalle eignen sich gut für den Einsatz in Satelliten zur Erdbeobachtung.
04.05.2023
Festkörperphysik | Quantenphysik
Nanophysik: Wo die Löcher im Flickenteppich herkommen
Patchwork mit Anwendungspotenzial: Setzt man extrem dünne Halbleiternanoschichten aus Flächen zusammen, die aus unterschiedlichen Materialien bestehen, so finden sich darin Quasiteilchen mit vielversprechenden Eigenschaften für eine technische Nutzung.
03.05.2023
Sterne | Teleskope
Astronomen finden weit entfernte Gaswolken mit Resten der ersten Sterne
Durch den Einsatz des Very Large Telescope (VLT) der ESO haben Forscher zum ersten Mal die Fingerabdrücke gefunden, die die Explosion der ersten Sterne im Universum hinterlassen hat.