Genetika v jednotné státní zkoušce je jednou z nejobtížnějších částí. Číslo 28 s podrobnou odpovědí vyvolává zvláště mnoho otázek. Ale neměli byste to při skládání zkoušky přeskočit, protože za úkol můžete získat až 3 primární body! V článku budeme analyzovat symboliku a termíny vyskytující se v problematice genetiky Jednotné státní zkoušky.
Některé teoretické principy
Chcete-li vyřešit problémy USE na téma „Genetika“ z biologie, musíte vědět, jaká symbolika se používá. Základní označení:
- ♀ – žena;
- ♂ – mužský;
- x – proces křížení;
- P – rodiče;
- G – gamety vzniklé z původní buňky;
- F1 – potomci první generace;
- F2 – potomci druhé generace;
- A, B, C – dominantní geny (projevující se ve fenotypu organismu);
- a, b, c – recesivní geny (ve fenotypu se objevují pouze u homozygotů).
Záznam řešení může vypadat takto:
G AB, Ab, aB, ab ab
F1 AaBb Aabb aaBb aabb
Genetika v jednotné státní zkoušce v biologii má určité pojmy:
- zygota – oplodněné vajíčko;
- homozygot – organismus, který má stejné geny. Nezpůsobuje štěpení u potomků. Opce – AA, aa;
- heterozygot – jedinec, v jehož genotypu jsou pozorovány různé varianty genetického materiálu. Dává štěpení u potomků. Psáno jako Aa;
- genotyp – souhrn všech genů v organismu;
- fenotyp je soubor vnějších a vnitřních vlastností organismu. Závisí na genotypu;
- zákon čistoty gamety – když se vytvoří gameta, dostane se do ní jedna z dvojice vlastností;
- monohybridní křížení – jedná se o organismy, které se liší jedním párem znaků;
- dihybridní křížení – jedná se o organismy, které se liší dvěma páry znaků;
- První Mendelův zákon – hybridy první generace jsou jednotné v genotypu a fenotypu;
- Druhý Mendelův zákon – při rozmnožování hybridů první generace se tvoří potomci s různými fenotypy, poměr je 3:1 ve prospěch vzniku dominanta;
- Třetí Mendelův zákon – existuje-li více párů znaků, dědí se nezávisle na sobě;
- zákon spojené dědičnosti (zákon Thomase Morgana) – vlastnosti umístěné na stejném chromozomu se dědí spojené;
- alelické geny jsou geny, které mají pár, například Aa nebo Bb. Když se tvoří gamety, oddělují se;
- analytické křížení – umožňuje určit genotyp jednoho z rodičů. K tomu je křížen s homozygotním recesivním (aa, bb nebo aabb);
- neúplná dominance (intermediální dědičnost) je jev vedoucí ke vzniku intermediálních charakteristik v důsledku neúplného překrytí recesivního dominantou. Genotyp výsledného potomka je Aa. Například bílé a červené květy někdy tvoří růžové květy.
Algoritmus řešení
Řešení genetických problémů na jednotné státní zkoušce se řídí následujícím algoritmem:
- Přečtěte si prohlášení o problému.
- Určete, které dědičné vlastnosti jsou označeny.
- Napište alelické geny zadáním označení písmen. Používejte symboly známé biologii.
- Určete typ prezentovaného problému.
- Napište krátkou podmínku uvedením genů.
- Určete, co chcete najít.
- Určete genotypy a fenotypy rodičů. Pokud jsou uvedeni potomci, analyzujte je.
- Začněte řešení s rodiči nebo potomky s recesivními rysy.
- U jedinců s dominantními rysy analyzujte segregaci.
- Po určení genotypů zapište vzor reprodukce.
- Přidejte výsledné gamety do diagramu.
- Zaznamenejte genotypy a fenotypy všech možných potomků.
- Analyzujte křížení, určete poměr fenotypů u potomstva.
- Výsledek zapište zodpovězením otázek v problému.
Nyní znáte zásady přípravy na Jednotnou státní zkoušku v sekci genetika. Studium podmínek však nestačí. Chcete-li získat vysoké skóre, musíte hodně trénovat. To lze provést na kurzech Unicum na Univerzitě přátelství národů Ruska. Zkušení učitelé vám řeknou pravidla pro řešení problémů a naučí vás je provádět.
Materiál v tomto článku slouží pouze pro informační účely. K přípravě na jednotnou státní zkoušku použijte další zdroje informací!
Genetické algoritmy jsou navrženy tak, aby řešily problémy optimalizace a modelování postupným výběrem, kombinováním a obměnou požadovaných parametrů pomocí mechanismů připomínajících biologickou evoluci.
Genetické algoritmy jsou navrženy pro řešení optimalizačních problémů. Příkladem takového úkolu je trénování neuronové sítě, tedy výběr takových hodnot hmotnosti, které dosahují minimální chyby. Genetický algoritmus je přitom založen na metodě náhodného vyhledávání. Hlavní nevýhodou náhodného vyhledávání je, že nevíme, jak dlouho bude trvat vyřešení problému.
Aby se předešlo takovému vynaložení času při řešení problému, používají se metody objevené při studiu evoluce a původu druhů. Jak je známo, v procesu evoluce přežívají nejzdatnější jedinci. To způsobuje zvýšení zdatnosti populace, což jí umožňuje lépe přežít měnící se podmínky.
Podobný algoritmus byl poprvé navržen v roce 1975 Johnem Hollandem na University of Michigan. Říkalo se mu „Hollandský reprodukční plán“ a tvořilo základ pro téměř všechny varianty genetických algoritmů. Než se na to však podíváme podrobněji, je nutné se podívat na to, jak lze objekty reálného světa kódovat pro použití v genetických algoritmech.
Objektová reprezentace
Z biologie víme, že každý organismus může být reprezentován svým fenotyp, který ve skutečnosti definuje, co je objekt v reálném světě, a genotyp, která obsahuje všechny informace o objektu na úrovni chromozomové sady. Navíc každý gen, tedy prvek genotypové informace, se odráží ve fenotypu.
K vyřešení problémů tedy potřebujeme reprezentovat každou vlastnost objektu ve formě vhodné pro použití v genetickém algoritmu. Veškeré další fungování mechanismů genetického algoritmu se provádí na úrovni genotypu, což umožňuje obejít se bez informací o vnitřní struktuře objektu, což určuje jeho široké použití v různých úkolech.
Nejběžnější typ genetického algoritmu používá bitové řetězce k reprezentaci genotypu objektu. V tomto případě každý atribut objektu ve fenotypu odpovídá jednomu gen v genotypu objektu. Gen je bitová struna, nejčastěji pevné délky, která představuje hodnotu této vlastnosti.
Kódování funkcí (celá čísla)
Pro zakódování takových funkcí můžete použít nejjednodušší možnost – bitovou hodnotu této funkce. Pak pro nás bude docela jednoduché použít gen určité délky, dostatečné k reprezentaci všech možných hodnot takové vlastnosti. Ale bohužel takové kódování není bez nevýhod.
Hlavní nevýhodou je, že sousední čísla se liší v hodnotách několika bitů, například čísla 7 a 8 v bitové reprezentaci se liší ve 4 pozicích, což komplikuje fungování genetického algoritmu a prodlužuje dobu potřebnou pro jeho konvergenci. . Aby se tomuto problému předešlo, je lepší použít kódování, ve kterém se sousední čísla liší v menším počtu pozic, ideálně o hodnotu jednoho bitu.
Takovým kódem je Grayův kód, který je vhodné použít při implementaci genetického algoritmu. Významy Grayových kódů jsou popsány v tabulce níže:
Desetinný kód | Binární hodnota | Hexadecimální hodnota | Desetinný kód | Binární hodnota | Hexadecimální hodnota |
---|---|---|---|---|---|
0000 | 0h | 0000 | 0h | ||
1 | 0001 | 1h | 1 | 0001 | 1h |
2 | 0010 | 2h | 3 | 0011 | 3h |
3 | 0011 | 3h | 2 | 0010 | 2h |
4 | 0100 | 4h | 6 | 0110 | 6h |
5 | 0101 | 5h | 7 | 0111 | 7h |
6 | 0110 | 6h | 5 | 0101 | 5h |
7 | 0111 | 7h | 4 | 0100 | 4h |
8 | 1000 | 8h | 12 | 1100 | Ch |
9 | 1001 | 9h | 13 | 1101 | Dh |
10 | 1010 | Ah | 15 | 1111 | Fh |
11 | 1011 | Bh | 14 | 1110 | Eh |
12 | 1100 | Ch | 10 | 1010 | Ah |
13 | 1101 | Dh | 11 | 1011 | Bh |
14 | 1110 | Eh | 9 | 1001 | 9h |
15 | 1111 | Fh | 8 | 1000 | 8h |
Tabulka 1. Shoda mezi desetinnými kódy (vlevo) a šedými kódy (vpravo)
Při kódování celočíselného atributu jej tedy rozdělíme na tetrády a každou tetrádu transformujeme pomocí Grayova kódu.
Při praktických implementacích genetických algoritmů obvykle není potřeba převádět hodnoty vlastností na hodnoty genů. V praxi nastává inverzní problém, když je na základě hodnoty genu nutné určit hodnotu odpovídajícího znaku.
Úkol dekódovat význam genů, kterým odpovídají celočíselné znaky, je tedy triviální.
Kódování funkcí (reálná čísla)
Nejjednodušší metodou kódování, která leží na povrchu, je použití bitové reprezentace, i když tato možnost má stejné nevýhody jako u celých čísel. V praxi se proto obvykle používá následující sekvence akcí:
- Celý interval přípustných hodnot charakteristiky je rozdělen do sekcí s požadovanou přesností.
- Vezměte hodnotu genu jako celé číslo určující číslo intervalu (pomocí Grayova kódu).
- Hodnota parametru je číslo, které je uprostřed tohoto intervalu.
Podívejme se na výše uvedenou sekvenci akcí na příkladu.
Předpokládejme, že hodnoty atributu leží v intervalu [0, 1]. Při kódování byl úsek rozdělen na 256 intervalů. K zakódování jejich počtu tedy potřebujeme 8 bitů. Řekněme, že hodnota genu je: 00100101bG (velké G označuje, že je použito kódování Gray). Nejprve pomocí Grayova kódu najdeme odpovídající číslo intervalu:
Nyní se podívejme, jaký interval tomu odpovídá. Po jednoduchých výpočtech dostaneme interval [0.20703125, 0.2109375]. To znamená, že hodnota našeho parametru bude (0.20703125+0.2109375)/2=0.208984375.
Kódování nečíselných dat
Při kódování nečíselných dat je musíte nejprve převést na čísla.
Stanovení fenotypu podle genotypu
Abychom mohli určit fenotyp objektu (to znamená hodnoty vlastností, které objekt popisují), potřebujeme znát pouze hodnoty genů odpovídajících těmto charakteristikám, tedy genotyp objektu. objekt. V tomto případě je soubor genů, které popisují genotyp objektu chromozóm. V některých implementacích se také nazývá jednotlivec.
Při implementaci genetického algoritmu je tedy chromozom bitový řetězec pevné délky. V tomto případě každý úsek linie odpovídá genu. Délka genů v chromozomu může být stejná nebo různá. Nejčastěji se používají geny stejné délky.
Podívejme se na příklad chromozomu a výklad jeho významu. Řekněme, že objekt má 5 vlastností, z nichž každá je kódována genem o délce 4 prvků. Pak bude délka chromozomu 5*4=20 bitů:
0010 | 1010 | 1001 | 0100 | 1101 |
---|
Nyní můžeme určit hodnoty funkcí:
znamení | Význam genu | Binární hodnota atributu | Desetinná hodnota charakteristiky |
---|---|---|---|
1 | 0010 | 0011 | 3 |
2 | 1010 | 1100 | 12 |
3 | 1001 | 1110 | 14 |
4 | 0100 | 0111 | 7 |
5 | 1101 | 1001 | 9 |
Základní genetické operátory
Jak víte, v evoluční teorii hraje důležitou roli to, jak se vlastnosti rodičů přenášejí na potomky. V genetických algoritmech operátor volal přechod (také zvaný crossover nebo překračující). Tento operátor určuje přenos vlastností rodičů na potomky.
- z populace jsou vybráni dva jedinci, kteří se stanou rodiči;
- bod zlomu je určen (obvykle náhodně);
- dítě je definováno jako zřetězení částí prvního a druhého rodiče.
Podívejme se, jak tento operátor funguje:
Chromozom_1 | 0000000000 |
Chromozom_2 | 1111111111 |
Řekněme, že ke zlomu dojde po 3. bitu chromozomu, pak:
Chromozom_1 | 0000000000 | >> | 000 | 1111111 | Výsledný_chromozom_1 |
Chromozom_2 | 1111111111 | >> | 111 | 0000000 | Výsledný_chromozom_2 |
Poté je s pravděpodobností 0.5 jeden z výsledných chromozomů určen jako potomek.
Následující genetický operátor je navržen tak, aby zachoval rozmanitost jedinců v populaci. Říká se tomu operátor mutace. Při použití tohoto operátoru je každý bit v chromozomu s určitou pravděpodobností invertován.
Kromě toho se používá i tzv. operátor inverze, která spočívá v tom, že se chromozom rozdělí na dvě části a ty si pak vymění místa. Schematicky to lze znázornit takto:
000 | 1111111 | >> | 1111111 | 000 |
V zásadě tyto dva genetické operátory pro fungování genetického algoritmu postačují, ale v praxi se používají i některé další operátory nebo modifikace těchto operátorů.
Například křížení nemusí být jednobodové (jak je popsáno výše), ale vícebodové, když se vytvoří několik zlomových bodů (nejčastěji dva). Navíc v některých implementacích algoritmu je operátor mutace inverzí pouze jednoho náhodně vybraného bitu chromozomu.
Funkční schéma
Nyní, když víme, jak interpretovat hodnoty genů, přejděme k popisu fungování genetického algoritmu. Podívejme se na funkční schéma genetického algoritmu v jeho klasické verzi:
- Iniciujte počáteční čas t=0 . Náhodně vygenerujte počáteční populaci skládající se z k jedinců B_0=
- Vypočítat zdatnost každý jednotlivec F_=fit(A_i), i=1. k a populace jako celek F_t=fit(B_t) (někdy také nazývaný termín fitness). Hodnota této funkce určuje, jak dobře je jedinec popsaný tímto chromozomem vhodný pro řešení problému.
- Vyberte jednotlivé A_c z populace A_c=Get(B_t) .
- S určitou pravděpodobností (pravděpodobnost křížení P_c) vyberte druhého jedince z populace A_=Get(B_t) a vytvořte operátor křížení A_c=crossing(A_c,A_) .
- S určitou pravděpodobností (pravděpodobnost mutace P_m) proveďte mutační operátor A_c=mutation(A_c) .
- S určitou pravděpodobností (pravděpodobnost inverze P_i) proveďte inverzní operátor A_c=inversion(A_c) .
- Umístěte výsledný chromozom do nové populační vložky (B_,A_c) .
- Proveďte operace počínaje krokem 3 kkrát.
- Zvyšte číslo aktuální epochy t=t+1 .
- Pokud je splněna podmínka zastavení, dokončete práci, jinak přejděte ke kroku 2.
Nyní se podívejme blíže na jednotlivé fáze algoritmu.
Největší roli v úspěšném fungování algoritmu hraje fáze výběru rodičovských chromozomů v krocích 3 a 4. V tomto případě jsou možné různé možnosti. Nejčastěji používaná metoda výběru je tzv ruleta. Při použití této metody je pravděpodobnost výběru chromozomu určena jeho zdatností, tedy P_>=Fit(A_i)/Fit(B_t) . Použití této metody vede k tomu, že se zvyšuje pravděpodobnost přenosu vlastností adaptovanějšími jedinci na potomstvo.
Další běžně používanou metodou je turnajový výběr. Skládá se z náhodného výběru několika jedinců z populace (obvykle 2) a výběru jedince s největší zdatností jako vítěze.
Některé implementace algoritmu navíc využívají tzv. strategii elitářství, která spočívá v tom, že jedinci s největší kondicí se zaručeně přesunou do nové populace. Použití elitářství obvykle urychluje konvergenci genetického algoritmu. Nevýhodou použití elitářské strategie je, že zvyšuje pravděpodobnost pádu algoritmu do lokálního minima.
Dalším důležitým bodem je definice kritérií pro zastavení. Typicky mezi ně patří buď omezení maximálního počtu epoch fungování algoritmu, nebo určení jeho konvergence, obvykle porovnáním zdatnosti populace v několika epochách a zastavením, když se tento parametr stabilizuje.
Další materiály k tomuto tématu: