Все это можно узнать из ДНК, прочитав определенные участки генов. Ген — это отдельный смысловой фрагмент ДНК, который в самом простом случае кодирует отдельный признак. Под словом «фенотип», кстати, следует понимать совокупность всех признаков наблюдаемого состояния (например, цвет глаз, форму мочки, склонность к диабету, усваиваемость лактозы). И тогда возникает тот же вопрос, что и в школьные годы: что именно нужно читать, можно ли читать не все и как разобраться с прочитанным.
Чтобы сделать из технологии прогностических ДНК-тестов массовую медицинскую услугу, нужно обратить внимание на несколько тонких моментов в анализе данных. Во-первых, это проблема персонализации: отбирать маркеры необходимо тщательно. Большинство исследований, направленных на установление ассоциации «генотип — фенотип», проводятся на больших выборках. Выборки (анализируемые группы людей), как правило,
не очень разнородны: они могут быть объемными, но состоять из представителей одной этнической группы. С одной стороны, это упрощает статистический анализ в рамках исследования, с другой — ставит вопрос о релевантности обнаруженной ассоциации по отношению к другим группам людей.
Вторая проблема заключается в количестве маркеров — тот самый случай, когда необходимо найти золотую середину. И тут не обойтись без вечного балансирования между двумя параметрами теста: чувствительностью и специфичностью. Увеличение числа генетических маркеров, несомненно, повышает чувствительность анализа к определенным заболеваниям. И вместе с тем специфичность теста может падать. Так как речь идет о, например, выявлении предрасположенности к серьезным заболеваниям, ложноположительная ошибка при выявлении страшного диагноза будет опаснее, чем уточнение вероятности развития заболевания. Помимо этого, увеличение числа маркеров ведет к повышению себестоимости тест-системы, что также затрудняет выход на масс-маркет.
Универсального решения для этих проблем не существует. На начальном этапе работы исследователь сталкивается с ситуацией, когда «есть много статей, и их все нужно прочитать». По этой причине научный отдел Genotek предложил алгоритм отбора, который значительно упрощает выбор полиморфизмов для анализа признака. Важно, что речь идет именно о полиморфизмах, а не о генах целиком: у двух мужчин на каждой из X хромосом есть один и тот же ген андрогенового рецептора, но у первого мужчины в
локусе rs6152находятся аденины (AA), а у второго — гуанины (GG). Вероятность того, что у последнего шевелюра к 40 годам останется такой же пышной,
составляет около 30%. В данном случае чтобы понять это, не нужно прочитывать последовательность гена целиком — достаточно найти и прочитать всего одну точку на ДНК, а затем сравнить ее с той, что лежит напротив.