Так же, как трудно понять разговор, не зная его контекста, биологам может быть трудно понять значение экспрессии генов, не зная окружения клетки. Чтобы решить эту проблему, исследователи из Princeton Engineering разработали метод изучения окружения клетки, чтобы биологи могли лучше понять информацию об экспрессии генов.
Исследователи во главе с профессором компьютерных наук Беном Рафаэлем надеются, что новая система откроет двери для выявления редких типов клеток и выбора вариантов лечения рака с новой точностью. Рафаэль является старшим автором статьи с описанием метода, опубликованной 16 мая в журнале Nature Methods .
Базовый метод связывания экспрессии генов с клеточным окружением, называемый пространственной транскриптомикой (ST), существует уже несколько лет. Ученые разбивают образцы тканей на микромасштабную сетку и связывают каждое пятно на сетке с информацией об экспрессии генов. Проблема в том, что современные вычислительные инструменты могут анализировать пространственные паттерны экспрессии генов только в двух измерениях. Эксперименты, в которых используется несколько срезов одного образца ткани, например области мозга, сердца или опухоли, трудно синтезировать в полную картину типов клеток в ткани.
Метод исследователей Принстона, называемый PASTE (для вероятностного выравнивания экспериментов ST), объединяет информацию из нескольких срезов, взятых из одного и того же образца ткани, обеспечивая трехмерное представление экспрессии генов в опухоли или развивающемся органе. Когда покрытие последовательностей в эксперименте ограничено из-за технических или стоимостных проблем, PASTE также может объединить информацию из нескольких срезов ткани в один двумерный согласованный срез с более подробной информацией об экспрессии генов.
«Наш метод был мотивирован наблюдением, что биологи часто проводят несколько экспериментов с одной и той же тканью», — сказал Рафаэль. «Теперь эти повторные эксперименты не совсем одни и те же клетки, но они из одной и той же ткани и, следовательно, должны быть очень похожи».
Метод команды может выравнивать несколько срезов из одного образца ткани, классифицируя клетки на основе их профилей экспрессии генов, сохраняя при этом физическое расположение клеток в ткани.
Проект начался летом 2020 года после того, как Макс Лэнд, математический концентратор из Принстонского университета 2021 года, прошел курс Рафаэля «Алгоритмы в вычислительной биологии». Взволнованный быстро развивающейся областью и возможностью улучшить понимание здоровья и болезней человека, Лэнд обратился к Рафаэлю с предложением принять участие в исследованиях и начал работать над кодом для разработки того, что стало методом PASTE. Ему посоветовали Рафаэль и ведущий автор исследования Рон Зейра, бывший исследователь с докторской степенью в Принстоне, который сейчас работает ученым-исследователем в компании точного здравоохранения Verily.
Работа была в центре внимания старшей диссертации Лэнда, и он написал статью вместе с Зейрой, Рафаэлем и Александром Стржалковски, доктором компьютерных наук. ученик. Сейчас Лэнд работает вычислительным биологом в Мемориальном онкологическом центре имени Слоуна-Кеттеринга в Нью-Йорке. Он сказал, что наставничество Зейры и Рафаэля сыграло важную роль в его исследовательской карьере.
Команда разработала свой метод, используя смоделированные данные экспрессии генов из исследования пространственной транскриптомики опухоли молочной железы, где ранее было установлено соответствие между срезами ткани. Затем они оценили метод на данных, собранных из образцов префронтальной коры головного мозга , которая имеет известную структуру, состоящую из слоев различных типов клеток с уникальными сигнатурами экспрессии генов.
Исследователи также применили PASTE к данным, собранным из биопсий четырех разных пациентов с раком кожи. Предыдущий анализ этих данных предполагал сложное лоскутное одеяло типов клеток с высокой степенью смешения раковых и здоровых клеток. Однако метод PASTE показал, что кажущаяся низкая пространственная когерентность в образцах трех пациентов, вероятно, была связана с низким охватом последовательностей в экспериментах. Новый анализ показал, что клетки были сгруппированы в более смежные кластеры, что является более правдоподобным с биологической точки зрения сценарием.
«После того, как мы объединим несколько таких срезов и эффективно увеличим охват данных, мы получим более пространственно согласованные группы клеток, что более разумно, чем случайный выбор каждого типа клеток в ткани», — сказал Зейра.
До сих пор самым большим набором данных, который проанализировала команда, был образец сердечной ткани с девятью срезами, но они нацелились на эксперименты с эмбрионами мышей, которые включают более 30 срезов. По словам Рафаэля, помимо вычислительных соображений, эксперименты по пространственной транскриптомике такого масштаба остаются дорогостоящими для многих лабораторий.
Тем не менее, добавил он, «мы надеемся, что наличие такого инструмента, как PASTE, побудит больше исследователей проводить повторные эксперименты, потому что теперь они действительно могут использовать информацию из дополнительных срезов так, как раньше они не могли это делать».
Теги: биотехнологии