По секрету всему свету
Работа ученых часто ассоциируется с вереницей захватывающих экспериментов и научных открытий, возникающих благодаря блестящим идеям исследователей. Конечно, это все имеет место, но каждый серьезный ученый также проводит внушительное количество времени за чтением и написанием научных статей. Научный эксперимент нельзя считать завершенным, пока не опубликованы его результаты. Только опубликованные результаты могут быть проверены, воспроизведены и определены как научное знание. Многие научные задачи рождаются из полученных ранее результатов, порой опубликованных другими группами ученых. Таким образом, чтение и написание научных статей — важная часть работы исследователей.
Каждая рукопись перед публикацией проходит процедуру рецензирования. Это нужно, чтобы убедиться, что автор следует определенным принятым стандартам (и, если необходимо, добиться этого от него). Издатели используют рецензирование для отбора и оценки предоставленных рукописей. Как правило, чем авторитетнее научный журнал, тем серьезнее требования к работам и их проверка. Рецензирование — довольно сложный и длительный процесс, в который вовлечено большое число специалистов. Разумеется, их работа должна оплачиваться. Чтение научной статьи в большинстве случаев стоит денег, а иногда платить приходится даже за публикацию. Например, в случае публикации в open access журналах автор самостоятельно оплачивает все расходы по изданию статьи.
В результате складывается парадоксальная ситуация. С одной стороны, авторитетные издания способствуют распространению научных данных, так как в теории любой интересующийся читатель может получить доступ к результатам даже самых свежих научных работ. С другой стороны, платное чтение и публикации статей, а также их длительное рецензирование в какой-то мере препятствуют распространению научных данных. Наука развивается стремительно, и задержки в распространении результатов исследований препятствуют появлению актуальной информации.
В глобализации науки принимают участие крупные общественные организации, которые могут раскрывать данные своих исследований. Pfizer, одна из крупнейших биофармацевтических компаний в мире, сформировала открытую библиотеку медицинских данных для представителей здравоохранения. Novartis — транснациональная фармацевтическая корпорация, которая открыто проводит свои исследования, а также делится разработанным программным обеспечением, вплоть до исходных кодов, опубликованных на GitHub.
Данными и результатами исследований широко делится компания Philip Morris International (PMI). Практически каждая индустрия, имеющая риск причинения вреда здоровью, со временем приходит к пониманию необходимости снижения риска. Поэтому в рамках работы PMI проводятся научные исследования, направленные на создание и научное обоснование альтернативных бездымных продуктов, которые существенно снижают риски при потреблении.
Также компания PMI создала онлайн-платформу INTERVALS — открытый ресурс, предназначенный для совместной работы и анализа данных со стороны третьих лиц. Платформа открывает ученым и работникам индустрии доступ к данным исследований (в том числе сырым) и протоколам, по которым они проводились. Такие платформы позволяют проверять исследования на воспроизводимость, а также использовать данные для проверки новых научных гипотез. В совокупности это делает научный процесс прозрачнее и ускоряет проведение новых научных исследований.
При поддержке PMI в 2011 году с использованием платформы INTERVALS был запущен проект sbv IMPROVER. В нем происходит верификация результатов лабораторных исследований, проведенных компанией. Весь массив полученных компанией данных передается независимым экспертам, которые могут проанализировать их и сделать свои выводы.
Недавно на платформе sbv IMPROVER группа ученых провела краудсорсинговое исследование диагностического потенциала метагеномных данных. Краудсорсинг в условиях биомедицины и системной биологии подразумевает, что абсолютно любой специалист, относящийся к биологии, медицине, химии или любой другой смежной области, может принять участие в исследовании и внести свой вклад. Цель исследования заключалась в разработке и проверке моделей классификации метагеномных образцов биоматериалов. Первоначально весь анализ базировался на результатах, полученных победителями научного испытания.
Изучались данные пациентов, больных язвенным колитом, а также страдающих болезнью Крона. В данном случае применение краудсорсинга позволило собрать значительный массив данных, а также снизить влияние субъективных факторов на полученные результаты. Данные платформы sbv IMPROVER были доступны для международного научного сообщества с сентября 2019 года по март 2020 года.
О краудсорсинговых исследованиях в области биомедицины и проблемах открытости научных данных рассказала Стефани Бу, PhD, менеджер по обеспечению научной прозрачности и верификации данных PMI:
«Существует множество примеров краудсорсинга в биомедицинских исследованиях. Один из самых известных заключается в определении участниками структуры белка (CASP, Critical Assessment of protein Structure Prediction). Также есть много других, где используются методы сравнительного анализа в биологических системах и в целом в области биоинформатики.
В основном в этой области и проводятся испытания в рамках sbv IMPROVER. У нас есть два основных вида испытаний. Есть вычислительные задачи, в которых у нас уже имеются контрольные данные. Мы знаем конечный результат и хотим найти лучший вычислительный метод, с помощью которого можно получить этот результат, чтобы в дальнейшем использовать такой метод, когда контрольные данные неизвестны. Это может быть определение того, получена ли информация от больного пациента, на какой стадии болезни он находится и так далее. Этим мы занимались в ходе первого испытания, Disease Signature Challenge.
Нас также интересуют некоторые биологические вопросы, например, насколько схожим могут быть разные виды. Это также очень важно для фармацевтической индустрии, где приходится проводить много тестов с участием животных. Необходима уверенность в том, что полученные результаты будут актуальны и для людей. Это мы проверяли во втором испытании, Species Translation Challenge. Также мы получили в наших лабораториях большой объем данных, подвергая клетки человека и крысы воздействию одинаковых химикатов и затем измеряя профили экспрессии генов и фосфорилирования белков. Мы попросили участников определить, основываясь на результатах, полученных для одного вида, что произойдет с другим.
Подобные анализы данных очень часто основываются на машинном обучении. Один из вопросов, на которые мы ищем ответ, — насколько обнаруженный вами метод способен к обобщению. Для нас очень важно, чтобы набор данных для обучения и тестовые данные были взяты из двух различных исследований, чтобы можно было убедиться, что полученный результат не свойственен лишь одному исследованию.
В последнее время мы также изучали микробиом, так как он связан со многими заболеваниями и в целом ответственен за состояние здоровья. Для нас было важно убедиться в том, что методы, разработанные в ходе испытаний, точно определяют структуру микробиома. В последнем из проведенных испытаний нужно было определить, являются ли предоставленные данные информацией о состоянии пациента, страдающего воспалительным заболеванием кишечника, или здорового человека.
Нас также интересуют и более «биологические» испытания, цель которых — извлечь информацию из научной литературы. Важно, чтобы подобная информация могла быть смоделирована и затем использована для вычислений. Для этого мы создали модели причинно-следственных сетей, которые строятся на основе литературных данных, но затем они могут быть использованы, чтобы показать результаты в объеме данных, например, по экспрессии генов. Работа была построена по принципу соревновательного сотрудничества, предполагающего, что участники будут проявлять активность, добавлять информацию или судить, насколько точна добавленная другими информация. В зависимости от того, насколько остальные будут соглашаться или не соглашаться с их экспертной оценкой, участники могли получить больше баллов.
INTERVALS — платформа для проверки обоснованности научных исследований, благодаря которой стало возможным поделиться информацией и многочисленными деталями, которые мы получили в результате исследований, проведенных совместно с компанией PMI и приглашенными сторонними экспертами.
Мы расширили платформу, вывели ее полностью в открытый доступ, а затем добавили возможность другим пользователям публиковать их данные. Мы все время расширяем наши интересы и также изучаем научные работы, посвященные заболеваниям, вызываемым табакокурением. В дальнейшем мы надеемся, что платформа получит еще большую известность как ресурс, где можно найти результаты исследований, связанных со снижением вреда от потребления табака, и даже на более общие темы.
Полученные результаты исследований — это также доконкурентная область, это результаты, которыми мы можем поделиться с нашими конкурентами, а они, в свою очередь, могут добавить свои данные, ведь это способствует развитию всей области. На платформе INTERVALS у нас хранится много результатов исследований, самое важное мы уже запатентовали и теперь можем поделиться этим.
Я думаю, что сами ученые не хотят или не могут делиться информацией по многим причинам. В компаниях или крупных университетах, где могут быть созданы стартапы, есть необходимость в интеллектуальной собственности, и это честно. Также довольно сложно упорядочить информацию так, что она станет полезна другим. Информационная открытость предполагает большие, но необходимые усилия, которые мы прилагаем уже сегодня».
Несмотря на тенденцию к глобализации, широко распространены патентование и сокрытие данных, которые в той или иной степени препятствуют получению достоверного научного знания. Дело в том, что патентование базовых лабораторных методов и необходимых для них реактивов приводит к сильному удорожанию работы с технологиями, а также накладывает ограничения или запреты, например, на самостоятельное изготовление необходимых реактивов. Существует немало примеров того, как крупные компании относительно дешево массово скупали патенты у ученых-патентообладателей, а затем завышали патентные отчисления либо перепродавали право на патент за намного большие деньги.
Существуют позитивные примеры победы глобализации науки, например, над сокрытием данных. Открытие и разработка методов с использованием флуоресцентных белков — хороший пример объединения ученых ради научного прогресса. Первый флуоресцентный белок, GFP (green fluorescent protein), был найден в морской медузе Aequorea victoria в 1960-х годах. К белку никто не проявлял интереса, пока спустя 30 лет Дуглас Прэшер совместно с коллегами не установил последовательность гена GFP. Недостаток финансирования не позволил Прэшеру продолжить свои исследования. Осознавая потенциальную важность и пользу GFP для науки, Прэшер не спрятал «в стол» свои наработки, а поделился промежуточными результатами с коллегами из других лабораторий.
Таким образом ген GFP попал к Мартину Чалфи и Роджеру Цянь, которые в итоге нашли для него применение. Оказалось, что GFP очень удобно «сшивать» с другими белками. Это позволяет прижизненно, то есть в живом, а не фиксированном объекте, наблюдать за динамикой и локализацией интересующих ученых белков. Решение Прэшера отдать свои результаты другим ученым лишило его возможности получить Нобелевскую премию вместе с Осаму Симомурой, выделившим этот белок из медузы. Однако, возможно, благодаря этому мир узнал о GFP, и теперь применение флуоресцентных белков – неотъемлемый метод любой лаборатории, занимающейся молекулярной или клеточной биологией.
О современном и повсеместном применении флуоресцентных белков в научных исследованиях рассказал Константин Лукьянов, доктор биологических наук, заведующий отделом биофотоники Института биоорганической химии им. академиков М. М. Шемякина и Ю. А. Овчинникова РАН:
«GFP — генетически кодируемая флуоресцентная метка, поэтому для работы с ней необходимо создавать некую трансгенную модель, когда в организм вводится ген GFP или другого флуоресцентного белка. Это может быть простая трансфекция клеток в культуре или, например, получение линий трансгенных мышей. В месте экспрессии гена GFP белок становится зеленым флуоресцентным, что можно наблюдать в микроскоп. Это очень удобно, поскольку такая метка прижизненная. Конечно, получается трансгенная живая система, незначительно теряется нативность целевого белка, но это все равно очень помогает.
GFP открыл клеточную биологию в динамике — все динамические процессы, которые происходят в клетке, были в большой степени визуализированы с помощью GFP. Флуоресцентные белки очень широко используются, на сегодняшний день это стандартный метод.
В любой технологии интересно использование нескольких различных инструментов. Применение нескольких цветов, например, позволяет различить структуры клетки. На основе GFP получалось небольшое цветовое разнообразие, поэтому ученые начали активно создавать и искать GFP-подобные белки. В России, в Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова в сотрудничестве с несколькими другими институтами РАН, мои коллеги открыли флуоресцентные белки кораллов, из которых получились все используемые сейчас красные флуоресцентные белки.
Еще интересный случай – переключаемые флуоресцентные белки, которые бывают двух типов – первые самопроизвольно меняют цвет в зависимости от времени (таймеры), они довольно удобные, но редко используемые на практике. Глядя на такую клетку, можно сказать, когда именно она синтезировала белок. Второй тип, фотоактивируемые белки, очень широко используются в исследованиях. В темноте они, например, одного цвета, а после облучения светом определенной длины волны они изменяют цвет.
Самое простое их применение — трекинг динамики белка. Например, если вам интересно, куда движется белок внутри нейрона, вы активируете лазером белок и следите за его перемещениями. Точно также можно следить за клетками целого организма — такой подход применяется в эмбриологии.
Фотоактивируемые флуоресцентные белки стали применяться в сверхразрешающей микроскопии для решения проблемы преодоления дифракционного барьера, из-за которого в оптических микроскопах не получается достичь серьезного разрешения. Была разработана группа методов, построенных на фотопереключениях флуоресцентных белков. Так достигается разрешение вплоть до 10 нанометров. За это впоследствии тоже дали Нобелевскую премию».
Наука и научный прогресс во всех своих проявлениях — глобальный процесс, развитие которого невозможно без тесного сотрудничества и коллаборации научных институтов, лабораторий и даже индустриальных компаний. Коммерциализация науки и плодов труда ученых не только неизбежна, но и важна для науки, поскольку способствует привлечению финансирования. Однако важно, чтобы научный прогресс осуществлялся планомерно, а не вопреки дополнительным трудностям.
Ответственность за содержание материала несет автор публикации. Точка зрения автора может не совпадать с позицией редакции.