О генетическом сходстве при межвидовой передаче

Этот пост - сокращенная версия моего профессионального поста.

Во время моего путешествия в мир генетических исследований я обнаружил, что вирусы увлекательны, даже в каком-то смысле обнадеживают. Это связано с тем, что их внутренняя структура изощренно приспособлена к генерации новых мутаций по мере их распространения на живые существа (хозяева) множеством различных путей: воздушно-капельным путем, через воду, миграцию птиц, фекалии и т. Д. так далее. Что удивительно, суть эволюции раскрывается, когда мутации в генетике вирусов дают им возможность усложняться, изменяя свои навыки выживания с годами. Я узнал, что вирусы - это не просто набор молекул, а на самом деле уникальный тип частиц под названием вирусология, который можно по-настоящему понять только в многопрофильном контексте биологии, физики, географии и даже климатологии. »И экономики (подумайте, насколько мощны вирусы, которые могут вызывать общую блокировку).

Вирусный переход - это путь, по которому вирус проходит между разными видами хозяев. Передача вируса от животного человеку называется зоонозом. Зоонозы могут передаваться в любом контексте, в котором есть контакт или потребление животных, продуктов животного происхождения или производных животных. Следующие режимы могут дать вам ключ к разгадке: еда и вода, сельское хозяйство, скотоводство, разведение, домашние животные, охота, рынок живых животных и т. Д. И это только малая часть того, что происходит на самом деле…

В рамках этого исследования я сосредоточился на четырех вирусах двух семейств: Coronaviridae (вирусы MERS и SARS-CoV-2) и Orthomyxoviridae (грипп A: H1N1 и H3N2), и обнаружил, что следующие темы лучше всего соответствуют тем вопросам, с которыми я имел дело:

  1. Отображение разнообразия хозяев с диагнозом грипп типа А и коронавируса
  2. Изучение генетического сходства между хозяевами - людьми и нечеловеческими животными с точки зрения вирусной ДНК и последовательностей белков.
  3. Изучение динамического поведения передачи вируса

Прежде чем погрузиться в арифметику (а это простая часть…), я хотел бы поделиться своим личным беспокойством: я беспокоюсь о нас как нации и нашей реакции на чрезвычайные медицинские ситуации, вызванные всемирными эпидемиями. Почему общественность до сих пор страдает от эпидемий, подобных продолжающейся SARS-CoV-2, даже если это не совершенно новый вирус (просто мутация предыдущего вируса в семействе коронавирусов)? Это потому, что нам еще предстоит найти способ предотвратить передачу? Напомню следующие предыдущие эпидемические события. Крупная эпидемия произошла в 1918 году, когда грипп А был эндемичен для Homo sapiens (первый случай был обнаружен в 1902 году у Галла). Более того, вирусы семейства коронавирусов тоже старые: сначала были собраны у птиц 1 941, свиней - 1 952, а совсем недавно у Homo sapiens в 2003 году (в Китае). Этот вирус хорошо известен как S ARS (и до сих пор активен). Аналогичная структура вируса была собрана в 2008 году в Саудовской Аравии, известной как M ERS, что предполагает наличие болезни у большого количества верблюдов.

С одной стороны, кажется, что человечество в 21 веке разработало технологии во всех мыслимых областях, чтобы решать практически все задачи: от металлических инструментов до посадки на Луну и искусственного интеллекта. Иногда кажется, что человеческая изобретательность безгранична. Однако, с другой стороны, мы по-прежнему полагаемся на консервативные, даже крайние методы, такие как общее закрытие и принуждение к ношению душных масок (кто-нибудь думал о разработке маски, с которой можно свободно дышать?…). В итоге эти «готовые» решения неадекватны и, на мой взгляд, нелепы. Это означает, что мы не были готовы, несмотря на все четкие красные сигналы и знаки.

В эти самые трудные времена группы ученых из разных слоев общества собрались, чтобы «дать отпор» и «спасти мир», разрабатывая такие решения, как вакцины, лекарства и крупномасштабные проекты по науке о данных, оценивающие «след» эпидемии. Однако я сомневаюсь, что эти герои думают о жизни каждого. Говоря «все», я также имею в виду нечеловеческих животных, таких как: верблюды, свиньи, птицы и все живые существа, которых мы, люди, держим, ухаживаем и разводим для наших собственных нужд (еда, одежда, труд, развлечения и скоро). Мое личное желание, чтобы все животные были свободными. А пока мы должны хотя бы узнать, как избежать передачи вирусов между себе подобными и себе подобными.

Является ли генетический «механизм» всех живых существ в совокупности ОДНОЙ вирусной системой? Каковы инварианты между хозяевами с точки зрения воссоздания структуры вируса и генерации белков? Все эти вопросы привели меня к исследованию генетического сходства между несколькими видами хозяев.

Оказывается, эта статья не о новой технике машинного обучения, а об уникальном исследовании и перспективе. Тем не менее, я предполагаю, что у вас есть некоторые базовые знания о нейронных сетях, уменьшении размерности, аналитике больших данных и биологии. Если биологическая часть вам непонятна, рекомендую прочитать раздел обзора литературы в моем блоге: Изучение генетики COVID-19, а если вы не знакомы с нейронными сетями на генетических данных, посетите мой блог: Bridging Разрыв между генетикой и нейронными сетями будет для вас хорошим началом.

Представление данных

Чтобы провести крупномасштабный эксперимент по машинному обучению, я собрал общедоступные данные о вирусах, состоящих из максимально возможного разнообразия видов-хозяев, в Национальном центре биотехнологической информации NCBI (если вы не знаком с NCBI, прочтите мой блог: Взлом генетики вирусов).

Прежде чем проводить какие-либо вычисления с данными, я выбрал несколько информативных сведений о вирусах. Я построил масштаб и пропорции эпидемии без каких-либо манипуляций с данными в соответствии с дополнительными разделами, которые собираются вместе с каждым генетическим образцом. Графики представляют географическое положение каждого вируса и распространенность видов-хозяев, нормализованные и умноженные на 100. Как видно, Homo sapiens является первым вирусом, диагностированным среди всех вирусов, за исключением вируса H1N1, который впервые был получен от свиней. Летучие мыши - вторые из семейства коронавирусов, у которых диагностировали заболевание. Верблюды были наиболее пострадавшими видами от вируса MERS в 2016 году, в то время как виверриды заняли первое место в 2006 году, а европейские норки сравняли количество Homo sapiens с диагнозом SARS-CoV-2 в 2020 году. Что касается географических мест, то впервые был собран H3N2. в Азии и второй в Южной Африке, в то время как H1N1 был вовлечен во все исследованные регионы в 2009 году. Пятый график сфокусирован на Азии, чтобы различить места, в которых вирусы были впервые изолированы. Обратите внимание, что вклад птиц и свиней в человечество с точки зрения коллективного иммунитета, поскольку они страдают от гриппа А, хорошо продемонстрирован для любого вируса.

Результаты

Для каждого семейства вирусов было проведено два эксперимента с последовательностями типа ДНК или белков. При рассмотрении образцов ДНК модель достигает 98,4% точности для гриппа A, 92,2% для коронавируса, а при работе с белками почти 100% точность достигается для любого вируса. Обратите внимание, что я исследовал два размера наборов тестовых данных. Результаты показывают, что более высокая производительность достигается с большим количеством выборок, возможно, потому, что в этом случае больше разнообразия данных.

Поведение потерь при обучении и проверке правильное, без переобучения или недостаточного подгонки, это означает, что во время сеанса обучения потеря проверки ниже, чем потеря при обучении. Еще одно наблюдение в этой связи - поведение скорости обучения в эксперименте с белками коронавируса, в котором требуется небольшое количество эпох для обобщения данных (примерно через 250 эпох валидация перестает снижаться и достигает максимальной точности).

Обсуждение

Выводы, которые, как мне кажется, стоит упомянуть в этой структуре, относятся, прежде всего, к техническому аспекту: высокая точность, которая была достигнута, означает, что различия в последовательностях ДНК и белков между видами хозяев схожи с ошибочной классификацией до 8%. Кроме того, использование инструментов выравнивания не требуется при использовании нейронных сетей и примерно одинаковой длины последовательностей (что справедливо для большинства вирусных семейств). Это отличная новость, поскольку во многих случаях «лучше меньше, да лучше». Во-вторых, в этом исследовании изучаются факторы передачи и подчеркивается необходимость осторожности и санитарии, когда (и если) мы имеем дело с нечеловеческими животными. Возможно, потребуется пересмотреть высокую плотность и плохие санитарные условия, которые являются обычным явлением в животноводстве. Более того, ненужные контакты, такие как использование животных в развлекательных целях, таких как борьба верблюдов (широко распространена в арабской культуре), и в «образовательных» целях, например, в контактных зоопарках (нет ничего образовательного в том, чтобы показывать публике, как заставить живое существо жить в клетке без Свобода).

Изменение нашего взаимодействия с нечеловеческими животными может принести существенные моральные и экологические выгоды, помимо передачи вирусных заболеваний, как обсуждается в этом посте.

В любом случае, мои рекомендации по дальнейшим исследованиям заключаются в том, чтобы изучить, как потребление продуктов от животных с диагнозом коронавирус может повлиять на человеческий организм, например: непастеризованное молоко или сырое мясо. Другой вопрос, который может возникнуть, заключается в том, как перестроить то, как мы обращаемся с сельскохозяйственными животными, и заново изучить, как с животными содержатся и обращаются в коровниках, загонах для свиней или курятниках.

Закрытие

Мир стал лучше благодаря технологиям. В настоящее время счастье разделяется между большим количеством людей, чем когда-либо - пора позволить другим видам испытать счастье или, по крайней мере, что-то подобное. Как говорится в буддийской молитве: «Пусть все живые существа будут свободны от страдания и его причин».

Конец

Уважаемые читатели, мне очень приятно, что вы все это читаете (или слышите). Мы будем очень признательны за любые ваши мысли, вы можете связаться со мной через Linkedin или по электронной почте (miritrope @ gmail).