Как рассчитать коэффициент сцепления генов: Пошаговая инструкция

Как рассчитать коэффициент сцепления генов: Пошаговая инструкция

Сцепление генов – это явление, когда гены, расположенные близко друг к другу на одной хромосоме, наследуются вместе чаще, чем если бы они располагались на разных хромосомах или очень далеко друг от друга на одной хромосоме. Количественная оценка степени сцепления генов играет важную роль в генетическом анализе, картировании генов и понимании механизмов наследственности. Данная статья представляет собой подробное руководство по расчету количественного показателя сцепления генов, а именно – коэффициента сцепления.

Основные понятия и определения

Прежде чем перейти к расчетам, необходимо четко понимать следующие термины:

  • Ген: Единица наследственной информации, участок ДНК, кодирующий определенный признак.
  • Аллель: Один из вариантов гена (например, аллель, определяющий цвет глаз: голубой или карий).
  • Хромосома: Структура, содержащая ДНК, в которой располагаются гены.
  • Сцепленные гены: Гены, расположенные на одной хромосоме и, следовательно, наследуемые вместе.
  • Кроссинговер: Обмен генетическим материалом между гомологичными хромосомами в процессе мейоза. Кроссинговер может нарушать сцепление генов.
  • Рекомбинация: Образование новых комбинаций аллелей в потомстве, отличных от комбинаций в родительских организмах. Рекомбинация является следствием кроссинговера.
  • Коэффициент рекомбинации (r): Мера частоты рекомбинации между двумя генами. Он представляет собой долю потомства, у которых комбинация аллелей между двумя генами отличается от комбинации в родительских организмах.
  • Коэффициент сцепления (LOOD Score, Logarithm of the Odds): Логарифмическое отношение вероятности получения наблюдаемых данных при условии сцепления генов к вероятности получения тех же данных при условии независимого наследования генов. Используется для статистической оценки вероятности сцепления.
  • Родительский тип: Генотип, который идентичен генотипу одного из родителей.
  • Рекомбинантный тип: Генотип, который отличается от генотипа обоих родителей из-за кроссинговера.

Необходимые данные для расчета

Для расчета коэффициента сцепления вам потребуются данные, полученные в результате скрещивания (скрещиваний) и анализа потомства. В идеале, необходимо выполнить следующее:

  1. Скрещивание: Провести скрещивание между двумя организмами, гетерозиготными по рассматриваемым генам. Например, скрестить организм с генотипом AaBb с организмом с генотипом aabb (анализирующее скрещивание) или скрестить два организма с генотипом AaBb между собой (дигибридное скрещивание).
  2. Подсчет потомства: Подсчитать количество потомков с каждым возможным фенотипом (и, следовательно, генотипом). Важно получить достаточно большую выборку потомства (чем больше, тем лучше), чтобы результаты были статистически значимыми.
  3. Идентификация родительских и рекомбинантных типов: Определить, какие генотипы соответствуют родительским, а какие – рекомбинантным. Родительские генотипы – это те, которые соответствуют комбинации аллелей у родителей. Рекомбинантные генотипы – это те, которые отличаются от родительских из-за кроссинговера.

Пошаговая инструкция по расчету коэффициента рекомбинации (r)

Коэффициент рекомбинации (r) является основой для дальнейшего расчета коэффициента сцепления. Вот как его рассчитать:

  1. Определите общее количество потомства (N). Это сумма всех потомков с каждым возможным генотипом.
  2. Определите количество рекомбинантных потомков (n_rec). Это сумма потомков с рекомбинантными генотипами.
  3. Рассчитайте коэффициент рекомбинации (r). Формула проста: r = n_rec / N. Коэффициент рекомбинации выражается в виде десятичной дроби (например, 0,2) или в процентах (20%). Коэффициент рекомбинации варьируется от 0 до 0.5 (или от 0% до 50%). Значение 0 означает полное сцепление, а значение 0.5 – независимое наследование.

Пример:

Предположим, вы скрестили мух дрозофил с генотипами AaBb и aabb и получили следующее потомство:

  • AABB: 45
  • AAbb: 5
  • aaBB: 5
  • aabb: 45

В этом случае:

  • Общее количество потомства (N) = 45 + 5 + 5 + 45 = 100
  • Родительские типы: AaBb и aabb (45 + 45 = 90)
  • Рекомбинантные типы: AAbb и aaBB (5 + 5 = 10)
  • Количество рекомбинантных потомков (n_rec) = 10
  • Коэффициент рекомбинации (r) = 10 / 100 = 0.1 или 10%

Расчет коэффициента сцепления (LOOD Score)

Коэффициент сцепления (LOOD score) – это статистическая мера, используемая для оценки вероятности сцепления генов. Он представляет собой логарифм отношения вероятности получения наблюдаемых данных при условии сцепления генов (с определенным значением коэффициента рекомбинации) к вероятности получения тех же данных при условии независимого наследования генов (r = 0.5). Расчет LOOD score требует более сложных математических вычислений, но он предоставляет более надежную оценку сцепления, чем просто коэффициент рекомбинации.

Формула для расчета LOOD Score

LOOD Score (Z) рассчитывается по следующей формуле:

Z = log10 (LOD) = log10 [ P(данные | сцепление) / P(данные | независимое наследование) ]

Где:

  • P(данные | сцепление) – вероятность получения наблюдаемых данных (количества потомков с каждым генотипом) при условии, что гены сцеплены с определенным коэффициентом рекомбинации (r).
  • P(данные | независимое наследование) – вероятность получения наблюдаемых данных при условии, что гены наследуются независимо (r = 0.5).

Пошаговая инструкция по расчету LOOD Score

  1. Определите вероятности генотипов потомства для каждого значения r. Для каждой комбинации генотипов (родительских и рекомбинантных) рассчитайте вероятность ее появления при различных значениях коэффициента рекомбинации (r). Поскольку вероятность независимого наследования соответствует r=0.5, вам нужно будет рассмотреть значения r < 0.5 (например, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4). Эти вероятности зависят от типа скрещивания (анализирующее, дигибридное и т.д.).
  2. Рассчитайте вероятность наблюдаемых данных для каждого значения r. Для каждого значения r рассчитайте вероятность получения именно тех данных, которые вы наблюдали в эксперименте (то есть, вероятность получить именно такое количество потомков с каждым генотипом). Это можно сделать, используя мультиномиальное распределение. Вероятность будет равна: P(данные | r) = (N! / (n1! * n2! * … * nk!)) * (p1n1 * p2n2 * … * pknk), где N – общее число потомков, n1, n2, …, nk – число потомков каждого генотипа, а p1, p2, …, pk – вероятности соответствующих генотипов при данном значении r.
  3. Рассчитайте вероятность наблюдаемых данных при независимом наследовании (r = 0.5). Повторите шаг 2, используя значение r = 0.5. Это даст вам P(данные | независимое наследование).
  4. Рассчитайте отношение вероятностей (LOD) для каждого значения r. Для каждого значения r рассчитайте LOD score как отношение вероятности наблюдаемых данных при данном r к вероятности наблюдаемых данных при независимом наследовании: LOD(r) = P(данные | r) / P(данные | независимое наследование).
  5. Возьмите логарифм по основанию 10 от LOD. Для каждого значения r рассчитайте LOOD score (Z) как логарифм по основанию 10 от LOD: Z(r) = log10(LOD(r)).
  6. Найдите максимальный LOOD score. Определите максимальное значение LOOD score (Z_max) среди всех рассчитанных значений для разных r. Значение r, при котором достигается Z_max, является наилучшей оценкой коэффициента рекомбинации между рассматриваемыми генами.
  7. Интерпретируйте результаты.

Интерпретация LOOD Score

LOOD score интерпретируется следующим образом:

  • Z ≥ 3 (или LOD ≥ 1000): Свидетельство сцепления. Предполагается, что гены сцеплены.
  • -2 ≤ Z < 3 (или 0.01 ≤ LOD < 1000): Неопределенный результат. Требуются дополнительные данные для подтверждения или опровержения сцепления.
  • Z ≤ -2 (или LOD ≤ 0.01): Свидетельство против сцепления. Предполагается, что гены не сцеплены.

Пример расчета LOOD Score (упрощенный)

Рассмотрим упрощенный пример с анализирующим скрещиванием (AaBb x aabb) и предположим, что мы получили следующие данные:

  • AaBb: 400
  • Aabb: 100
  • aaBb: 100
  • aabb: 400

Общее количество потомства (N) = 1000.

Мы рассчитали коэффициент рекомбинации (r) = (100 + 100) / 1000 = 0.2.

Теперь предположим, что мы хотим рассчитать LOOD score для r = 0.2. Для этого нам нужно рассчитать P(данные | r = 0.2) и P(данные | r = 0.5).

Для анализирующего скрещивания:

  • P(AaBb | r) = (1 – r) / 2
  • P(Aabb | r) = r / 2
  • P(aaBb | r) = r / 2
  • P(aabb | r) = (1 – r) / 2

При r = 0.2:

  • P(AaBb | 0.2) = (1 – 0.2) / 2 = 0.4
  • P(Aabb | 0.2) = 0.2 / 2 = 0.1
  • P(aaBb | 0.2) = 0.2 / 2 = 0.1
  • P(aabb | 0.2) = (1 – 0.2) / 2 = 0.4

При r = 0.5:

  • P(AaBb | 0.5) = (1 – 0.5) / 2 = 0.25
  • P(Aabb | 0.5) = 0.5 / 2 = 0.25
  • P(aaBb | 0.5) = 0.5 / 2 = 0.25
  • P(aabb | 0.5) = (1 – 0.5) / 2 = 0.25

Используя мультиномиальное распределение (или, в данном случае, приближение к нему, поскольку N достаточно велико):

P(данные | r = 0.2) ≈ C * 0.4400 * 0.1100 * 0.1100 * 0.4400

P(данные | r = 0.5) ≈ C * 0.25400 * 0.25100 * 0.25100 * 0.25400

Где C – постоянный коэффициент, который не влияет на отношение вероятностей.

LOD(0.2) = P(данные | r = 0.2) / P(данные | r = 0.5) ≈ (0.4400 * 0.1100 * 0.1100 * 0.4400) / (0.25400 * 0.25100 * 0.25100 * 0.25400)

Z(0.2) = log10(LOD(0.2)) ≈ log10[ (0.4800 * 0.1200) / 0.251000 ] ≈ 47.7

В этом примере, LOOD score (Z(0.2)) составляет примерно 47.7, что значительно больше 3. Это указывает на очень сильное свидетельство в пользу сцепления генов.

Важно: Этот пример очень упрощен и не учитывает все тонкости расчета LOOD score. В реальных исследованиях генетики используют специализированное программное обеспечение, которое автоматически выполняет расчеты LOOD score для различных значений r и определяет максимальное значение LOOD score.

Факторы, влияющие на точность расчетов

Точность расчетов коэффициента сцепления зависит от нескольких факторов:

  • Размер выборки: Чем больше размер выборки потомства, тем более точными будут результаты. Небольшие выборки могут привести к ложным выводам о сцеплении или его отсутствии.
  • Точность фенотипирования: Важно точно определить фенотип каждого потомка. Ошибки в фенотипировании могут привести к неправильному подсчету родительских и рекомбинантных типов и, следовательно, к неверным расчетам.
  • Вид скрещивания: Различные типы скрещиваний (например, анализирующее скрещивание, дигибридное скрещивание) имеют различные статистические свойства и требуют различных подходов к анализу данных.
  • Вмешательство других генов: Наследие рассматриваемых признаков может быть осложнено влиянием других генов, которые не были учтены в эксперименте.

Программное обеспечение для расчета LOOD Score

Расчет LOOD score вручную может быть очень трудоемким, особенно для сложных генетических моделей. К счастью, существует множество специализированных программных пакетов, которые позволяют автоматизировать расчеты LOOD score и проводить анализ сцепления. Некоторые из наиболее популярных программ:

  • LINKAGE: Один из старейших и наиболее широко используемых пакетов для анализа сцепления.
  • MERLIN: Более современный пакет, предлагающий более гибкие возможности для анализа генетических данных.
  • PLINK: Пакет для анализа данных геномных ассоциаций, который также может быть использован для анализа сцепления.
  • R: Язык программирования и статистическая среда, позволяющая разрабатывать собственные инструменты для анализа сцепления.

Применение анализа сцепления генов

Анализ сцепления генов имеет широкий спектр применений в различных областях биологии и медицины:

  • Генетическое картирование: Определение относительного расположения генов на хромосомах. Коэффициент рекомбинации между двумя генами пропорционален расстоянию между ними на хромосоме.
  • Идентификация генов, связанных с заболеваниями: Поиск генов, ответственных за развитие наследственных заболеваний. Анализ сцепления позволяет определить участки генома, которые наследуются вместе с заболеванием.
  • Селекция растений и животных: Улучшение характеристик сельскохозяйственных культур и домашних животных путем отбора организмов с желаемыми комбинациями генов.
  • Эволюционная биология: Изучение эволюции геномов и механизмов рекомбинации.

Заключение

Расчет коэффициента сцепления генов – важный инструмент для понимания механизмов наследственности и картирования генов. Хотя расчет LOOD score может показаться сложным, он предоставляет более надежную оценку сцепления, чем просто коэффициент рекомбинации. Использование специализированного программного обеспечения упрощает этот процесс и позволяет проводить анализ сцепления для сложных генетических моделей. Знание принципов и методов анализа сцепления необходимо для генетиков, селекционеров и других специалистов, работающих с наследственной информацией.

0 0 votes
Article Rating
Subscribe
Notify of
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments