И я упоминал это, на каждый анализ надо тучу времени и денег. Мы не берем гены с полочки, образец расшифровывают долгое время, если бы все люди сделали бы себе полный генетический паспорт - может повезло бы случайно выделить довольно много разных паттернов. Но до этого еще далеко, ряд ли даже следующее десятилетие.
Так в том и сложность, что будь это явный доминантный/рецессивный признак, как например умение сворачивать язык трубочкой - можно было б искать дата майнингом. Какие взаимосвязи кроме самого факта !в одном поколении! гей/не гей есть? Нужны или распределения в потомках или взаимосвязи с другими признаками/генами. А их нет.
Причем мы упрощаем, кроме самих генов есть пространство между ними, которое раньше считали мусором, а теперь полагают - оно выполняет регуляторную функцию, активируя те или иные гены в определенных обстоятельствах, а еще есть гены с несколькими посадочными и остановочными площадками, т.е. они могут кодировать сразу несколько белков/рнк, да и еще раз повторю - 20к это не общее количество, это часть степенной формулы.
Опять-таки аналогия, у нас есть два шестигранных игральных кубика-гена, красный и зеленый (два!), на каждом цифры от 1 до 6, вместе они кодируют признак, сколько всего сочетаний может быть? Не два, а целых 36. А у нас 20к игральных кубика, и да, играет только малая часть, ибо мы одного вида и большинство кубов именно это кодирует, но посчитай исходы 2к (10%) генов, в каждом из которых хотя бы 3-4 аллели.
Хорошо, сдаюсь. Если все так легко, почему мы еле-еле составили карту генома, а к расшифровке еще только приступаем? Просто ответь на этот вопрос.
Если 20к строк базы данных, с каждым элементом которой связаны еще таблицы и у таблиц есть неочевидные связи между собой, а основной способ изучения - наблюдение готового собранного по этой базе организма это мало...
Уже даже не знаю какие аналогии приводить. Конструкторское бюро с 20к ящиками, из каждого ящика взяли по чертежу, на выходе "Миг", в каком ящике третья и пятая заклепка элерона? Так может будет понятнее? Короче ответь просто на вопрос, почему же это малое количество так фигово расшифровано, еле-еле установили количество ящиков и подписали лишь малую часть?
Вижу. Для начала не одну аллель, а их комбинацию. И если бы мы не знали конкретный ген, то у нас было бы сколько вариантов? Несколько чего-лионов? Если один ген имеет несколько аллелей, генов 20 000, при этом две аллели могут усиливать признак, одна может полностью подавлять другу или, даже, определенное сочетание даст новый признак, не "A" и не "a" (дом-ый/рец-ый), а некий "b". Повторю снова, эти 100 геев и 100 натуралов будут отличаться не одним геном, не двумя, у них будет хренова туча разных аллелей, даже без учета влияния на признак сразу нескольких. Настолько хренова туча, что нет никакой возможности выделить один конкретный ген. Посмотри карту генома, почитай про количество генов, их МНОГО. Много 72 полужирным шрифтом. Ты утверждаешь, что расшифровка египетской письменности плевая задача, вот разные гробницы, вот разные надписи, сравни, найди отличия, профит. Когда-нибудь мы по миллиметру подберемся к полному пониманию генома, и чем меньше останется пробелов, тем легче сложить мозаику. Но это метод от обратного, вычеркивать по одному признаку, который удалось связать с тем или иным геном. Понимаш?
Ох. Ну давай тогда от генов все же перейдем к аллелям. Ты вот знаешь, что у человека может быть 4 группы крови, в популяции есть 3 аллели, попарное комбинирование которых дает нужную группу крови. Есть доминантные, рецессивные, неполно доминантные, кодоминантные и сверхдоминантные аллели. Понимаешь к чему клоню? Кодирование признака - это не булевая переменная. Это не вкл-выкл, это генетика, мендель, распределения, поколения и прочее и прочее. У этих 100 геев и 100 натуралов будет цифра с хреновой тучей нулей отличающихся АТГЦ, и даже если мы знаем определенные последовательности - мы все равно получаем войну и мир на суахили, где из суахили мы знаем слова "яблоко, китай, реформа, булочник". Чего сложного? Взял да перевел остальные (а точнее нашел фразу "Княгиня вошла. Пассаж оборвался на середине"), вон есть война и мир на иврите, лишнее зачеркнуть, если что есть еще японская версия.
При этом у разных рас будет еще больше отличающихся генов, в разной местности - еще больше отличий.
Я про то, что посмотрев какие гены есть, и каких нет мы увидим 10 в n степени отличающихся генов. Как впрочем у любой выборки людей. И однозначно указать на конкретный ген/набор генов нет никакой возможности. Впрочем и всех вычислительных мощностей не хватит для перебора, да и генетический анализ всех и вся - это время, деньги и оборудование. "Карандашик" пока коротковат для решения таких задач в лоб.
Этот эксперимент пока самая конструктивная идея в данном вопросе. Найдя хотя бы несколько сот генов кандидатов уже можно конкретно по этим генам проходиться в более широкой выборке геев/натуралов. Очевидно же.
Ха-ха. берем выборку из 1000 хотя бы геев и натуралов. У нас 2000 разных сочетаний 20к генов (часть неизменяемая, часть уже однозначно расшифрованная), комбинаторика нам даст всего-то 10 в несколькотысячной степени сочетаний (упрощаю, утрирую, но там их оооочень много будет, а уж если брать AB CD и тд - то еще степеней насыпет). Карандашиком все не повычеркать. Смысл эксперимента с монозиготными близнецами как раз в том, что у них почти все гены совпадают.
А как можно найти корелляции генетические?) Из 20 с гаком тысяч генов, многие из которых отвечают за целые комплексы признаков, взаимодействуя еще и друг с другом не удалось выявить некий признак - так это не удивительно. Опять же с выборкой проблемы, я писал, самое известное исследование строилось на монозиготных близнецах (сколько их от общей популяции?), да еще чтоб один был геем. Про социальные факторы я читал обратное, например что подавляющее большинство детей в гомосексуальных парах - гетеросексуальны, и наоборот, большинство гомосексуальных детей воспитывалось гетересексуальными родителями. Табу есть, просто не такое жесткое, как например у нас или в исламских странах.
Будет третьей концепцией. "Точно не" чрезвычайно трудно доказать. Как и "точно да", слишком много социальных факторов, воспитание и т.д. Опять же это может быть сочетанием в любой пропорции раннего детства/генов/гормонов. Ученые не могут сделать пару сотен клонов и провести эксперимент в лабораторных условиях, поэтому все эти выводы на основе статистики. Опять же социальное давление и табуирование не дает оценить реальные цифры (а какая статистика без реальных цифр?).