E-mail | SIS | Moodle | Helpdesk | Knihovny | cuni.cz | CIS Více

česky | english Přihlášení



AFLP III. - analýza dat pomocí programu GeneScan Analysis v3.7

Analýzou dat z fragmentační analýzy se rozumí identifikace jednotlivých peaků markeru (GS-500 ROX) a následné přiřazení délky (bp) všem identifikovaným peakům v jednotlivých barvách. Teprve zanalyzovaná data je možno dále načíst do programu Genographer.

Data ve formátu *.fsa jsou na serveru (botany.natur.cuni.cz)uložena v adresáři "fragmentace" a dále podle data analýzy (ve formátu rr-mm-dd) a jsou automaticky analyzována již na počítači sekvenátoru. Výsledky analýzy jsou shrnuty v *.log souboru. Abychom se mohli přesvědčit o správnosti analýzy a případně zpracovat vzorky, které nebyly automaticky zanalyzovány, je třeba použít program GeneScan Analysis v3.7. Následující text shrnuje nejdůležitější kroky při analýze, podrobnější údaje lze nalézt v manuálu k tomuto programu.

A. Vytvoření projektu, analýza

  • File → New → Project
  • Project → Add Sample Files → nalistovat příslušné vzorky, označit → Add (případně Add All) → Finish
  • zobrazí okno „Analysis Control“ se seznamem vzorků s příslušnými „Size Standard“ a „Parameters“ – typicky se používá GS500-250.szs a GS500Analysis.gsp (GS500.szs použije všechny peaky standardu GS-500 ROX, GS500-250.szs znamená vynechání peaku o délce 250 bazí, který údajně nemigruje konzistentně v kapilárních sekvenátorech)
  • pro všechny vzorky najednou můžeme určit standard nebo parametry vybráním příslušného typu po kliknutí na šipku v záhlaví nebo můžeme pro každý vzorek určit standard a parametry zvlášť
  • na primární data se můžeme podívat přes Sample → Raw Data
  • vzorky, které chceme analyzovat označíme kliknutím na jejich číslo (ve sloupci úplně vlevo), u vzorku se vybarví sloupce B,G,Y,R. Všechny vzorky najednou můžeme označit kliknutím na záhlaví sloupce s čísly
  • klikneme na Analyze – program začne analyzovat jednotlivé vzorky, úspěšná analýza je indikována odbarvením políček
  • po skončení analýzy vyskočí okno s informací o jejím průběhu (Analysis Log) – je zde uvedeno, u kterých vzorků analýza proběhla (ne)úspěšně a v jakém rozsahu se podařilo identifikovat marker a přiřadit peakům jejich správnou délku
  • vzorky, které se nepodařilo analyzovat předvoleným standardem a parametry bude třeba zanalyzovat s jiným nastavením, tj. definovat jiný „Size Standard“ a „Parameters“ (nejlépe přímo podle vzorku, který chceme analyzovat – viz dále část „b“ a „c“)
  • po úspěšné analýze všech vzorků je možno se přesvědčit, jestli analýza proběhla správně, tj. jestli byly peaky standardů správně přiřazeny (viz dále – část „d“)
  • po kontrole analýzy uložíme celý projekt (File → Save Project As…) a zavřeme
  • do všech vzorků je zanesena informace o délkách jednotlivých peaků ve všech barvách a jsou připraveny k dalšímu hodnocení např. v programu Genographer

B. Definování nového standardu („Size Standard“)

  • kliknutím na šipku ve sloupci „Size Standard“ u příslušného vzorku vybereme volbu „Define New
  • otevře se okno, kde jsou zobrazeny peaky standardu (červená barva) v příslušném vzorku a dole v tabulce potom jejich definované délky
  • všechny peaky standardu mají typický tvar („Gaussovská křivka“) a zhruba stejnou intenzitu (výšku), ostatní peaky (šum, nespecifity…) jsou většinou „ostřejší“ a jsou vyšší nebo nižší než správné peaky
  • peaky standardu GS-500 ROX jsou (zleva doprava): 35, 50, 75, 100, 139, 150, 160, 200, 250, 300, 340, 350, 400, 450, 490, 500 bazí

ROX-500 standard peaks

  • kliknutím na ikonku lupy a posléze do obrázku je možno horizontálně zoomovat
  • kliknutím na ikonku kříže a poté na jednotlivé peaky (vyplní se barvou) přiřadíme všem peakům standardu správnou délku, případným ostatním peakům dáme „0“, stejně tak peaku o velikosti 250 bazí (viz poznámka výše)

 Výběr peaku v programu GeneScan v3.7  

  • nově definovaný standard uložíme (File → Save As…) do adresáře „\AppliedBio\Shared\Analysis\Sizecaller\SizeStandards“
  • nově definovaný standard je nyní k dispozici při výběru

C. Definování nových parametrů analýzy („Analysis Parameter“)

  • kliknutím na šipku ve sloupci „Parameters“ u příslušného vzorku vybereme volbu „Define New
  • otevře se okno, kde je možno definovat různé parametry analýzy, zde jsou zmíněny jen některé (blíže viz tato příručka)
  • Analysis Range – možno specifikovat jen určitou část vzorku (např. s vynecháním úvodní části s nespecifickými peaky), ve které budou hledány peaky standardu; zadává se v tzv. Data Points, požadovaný rozsah je možné zjistit při zobrazení RawData
  • Peak Amplitude Thresholds – pokud jsou peaky standardu příliš malé, je možné snížit práh jejich detekce uvedením menšího čísla u R:
  • Min. Peak Half Width – zvýšením tohoto čísla eliminujeme detekci příliš úzkých peaků
  • nově definovaný soubor parametrů uložíme (File → Save As…) do adresáře „\AppliedBio\Shared\Analysis\Sizecaller\Params“
  • nově definovaný parametr je nyní k dispozici při výběru

D. Kontrola správnosti analýzy

  • kontrolou analýzy se rozumí ověřit si, zda byly peakům standardu přiřazeny správné délky a jestli se tak stalo stejně u všech analyzovaných vzorků
  • pokud si tedy zobrazíme peaky standardu z několika vzorků do jednoho grafu, měly by se překrývat
  • to lze udělat pomocí Windows → Results Control
  • zobrazí se okno, kde je v levé části seznam vzorků a v pravé jejich rozdělení do tzv. panelů, jejich počet lze zvolit (max. 8)
  • nejjednodušeji a nejrychleji zobrazíme peaky standardu z různých vzorků přes sebe zaškrtnutím volby „Quick Tile“ na „On“ a kliknutím na písmeno R v červeném poli – program automaticky rozdělí všechny vzorky pravidelně do zvoleného počtu panelů
  • klikneme na „Display“, zobrazí se několik řádků peaků standardu (v každém řádku je několik vzorků, podle toho, kolik jsme zvolili panelů)
  • View → Align By Size – zarovná peaky podle jejich délky v bazích
  • vizuálně zkontrolujeme, jestli se všechny peaky standardů ze všech vzorků překrývají (alespoň v úseku 75-500 bazí)
  • pokud je peakům u některého vzorku přiřazena evidentně špatná délka (evidentně správný peak se nepřekrývá s peaky téže délky jiných vzorků), můžeme vzorek identifikovat kliknutím na peak – v tabulce (ve spodní části okna) jsou vysvíceny údaje o něm, včetně jména vzorku; tento vzorek bude pravděpodobně nutné znovu zanalyzovat
  • pokud byly všem peakům přiřazeny správné délky, tj. jednotlivé vzorky se překrývají, je možné projekt uložit, zavřít a pokračovat v analýze vzorků např. v programu Genographer

Akce dokumentů