Shotgun-Sequenzierung

Shotgun Metagenomics ist eine Gen-basierte Methode zur Analyse von Umweltproben, z.B. von Wasser-, Sediment- und Bodenproben. Hierbei wird eine Mischung genomischer DNA von diversen Organismen in einer Umweltprobe, meist Mikroorganismen, sequenziert und untersucht. Die möglichen Ziele dieser Vorgehensweise können z.B. die taxonomische Klassifizierung, die funktionelle Analyse sowie die Zusammenstellung des gesamten Genoms einer Art sein.

Zunächst beginnt der Arbeitsablauf mit der Probennahme. Diese hängt immer stark von dem betreffenden Milieu ab, eine Bodenprobe kann z.B. mit einem Bohrstock und eine Wasserprobe schon mit einer einfachen sterilen Flasche entnommen werde. Wichtig hierbei ist das standardisierte Vorgehen, die Sorgfältige Auswahl der Probenahme-Gebiete sowie die Integration von Feld-Negativkontrollen und Proben-Replikaten. Da man mit dieser Methode zumeist die Mikrobielle Gemeinschaft untersuchen möchte, und diese auch in der Probe selbst, weiterhin Stoffwechsel betreiben und sich verändern können, wird die Probe direkt nach der Entnahme konserviert oder weiterverarbeitet. Konservierungsmöglichkeiten zum Stoppen der biologischen Aktivität sowie Degradation der Probe sind u.a. einfrieren (z.B. in Flüssigstickstoff, dieser kühlt bis -196°C) oder Pufferung in einer Lösung, die die DNA stabilisiert (z.B. Ethanol für ganze Organismen).

Daraufhin wird unter möglichst sterilen Bedingungen die DNA extrahiert und mithilfe weiterer Verarbeitungsschritte für die Sequenzierung vorbereitet: die Fragmentlängen sowie DNA-Konzentrationen zwischen den Proben werden gemessen und aneinander angepasst. Da hier die Sequenzenden unbekannt sind (im Gegensatz zur Metabarcoding-Methode), werden Adaptoren mit bekannten Sequenzenden hinzugefügt, an denen dann Indexe angeknüpft werden. Die Indexe bestehen aus sieben spezifischen Basen, welche innerhalb einer Probe gleich und zwischen den Proben unterschiedlich sind. Dadurch können verschiedene Proben am Ende für die Sequenzierung zusammengefügt werden („poolen“), ohne ihren Probenursprung zu verlieren. Zusammengefasst werden diese Schritte als „Library Präparation“. Anschließend wird eine Illumina-Sequenzierung mithilfe der Next-Generation Sequencers durchgeführt, hier auch, aufgrund der vielen Genfragmente, Shotgun Sequenzierung genannt. Man erhält eine lange Tabelle mit vielen DNA-Sequenzen.

Nun beginnt die bioinformatische Verarbeitung der Datensätze. Vorerst werden die jeweiligen Sequenzen ihren Proben mithilfe ihrer Indexe zugeordnet („Demultiplexing“) und die nun nicht mehr notwendigen Indexe sowie Primer abgeschnitten („Primer trimming“). Es folgt eine Qualitätskontrolle, in denen z.B. zu kurze Fragmente aus dem Datensatz entfernt werden. Daraufhin werden die verarbeiteten Sequenzen mithilfe einer Referenzdatenbank taxonomisch einer Art oder auch funktionell (z.B. Stickstoff-verarbeitende Gene) zugeordnet. Referenzdatenbanken umfassen bereits bekannte Sequenzen von bestimmten Arten, sodass hier die unbekannten Sequenzen der Probe gesucht und bestmöglich zugeordnet werden können. Möchte man das Genom einer Art analysieren, werden die einzelnen DNA-Fragmente wieder zu einem langen DNA-Strang assembliert. Hat man seine Arten,- oder Funktionstabelle, können diese statistisch analysiert und biologisch interpretiert werden.

Schwierig bei dieser Methode ist zum einen der hohe Kostenfaktor sowie der noch herrschende Mangel an Referenzdatenbanken. Dadurch ist die Zuordnung der Arten sowie Funktionen mitunter schwierig. Vorteilhaft ist jedoch die Möglichkeit, aufgrund der 1:1 Übersetzung der Fragmente, Rückschlüsse auf die Biomasse zu ziehen sowie die Untersuchungsmöglichkeit ganzer Gemeinschaften und deren Funktionsvermögen. Insgesamt ist Metagenomik-Methode eine sehr vielversprechende Analysemöglichkeit von Umweltproben und wird zukünftig immer mehr Relevanz erlangen.