Fake news – в медицине? – ANTIFAKE: what's the news?

…Просматривая газеты за несколько последних лет, я убедился,

что некоторые методы уголовного мира, причем самые грязные

методы, стали безнаказанно применяться в политике…

«Двадцатый век начинается» (1987),

по мотивам «Записок о Шерлоке Холмсе» А.К. Дойла

Англоязычные базы данных Pubmed [1] и Embase [2] представляют собой исключительно ценные источники информации по исследованиям из области фундаментальной и клинической медицины. Наличие более 30 млн публикаций, зарегистрированных в Pubmed и более 40 млн публикаций в Embase указывает на насущную необходимость использования адекватных алгоритмов для поиска и отбора публикаций, необходимых для того или иного исследования. Такого рода алгоритмы особенно важны для масштабного планирования научных исследований и для разработки соответствующих национальных программ в области здравоохранения.

Существующие алгоритмы поиска баз данных научных публикаций по ключевым словам позволяют достаточно точно выделять подмножества публикаций, релевантных той или иной теме исследований. Однако ни одна из имеющихся поисковых систем не позволяет оценивать качество многих тысяч находимых таким образом публикаций. А ведь решение проблемы оценки научного качества статьи по ее тексту принципиально важно для нахождения объективной научной информации.

В ходе работы над рядом монографий [3,4], мы столкнулись с феноменом, который можно описать как “некоторые методы политического мира, причем самые грязные методы, стали безнаказанно применяться в медицине”. Например, экспертный анализ делает очевидным присуствие существенного процента публикаций, носящих ярко выраженный негативный характер: в них не представлено вообще никаких положительных клинических эффектов от того или иного подхода к терапии (т.н. «безрезультатные исследования»). Эти «безрезультатные» исследования отличаются особым стилем изложения, преобладанием определенной лексики и грамматических конструкций: избытком конструкций отрицания («did not», «no significant effect» и др.), излишней формализацией языковых конструкций (пациенты могут называться не «пациентами» или «пациентками», а некими бесполыми «участниками», англ. «participants»), навязчивым употреблением квазинаучных терминов наподобие «основная точка» («primary outcome») вместо указания четких клинических диагнозов по МКБ-10. То есть, «безрезультатные» исследования написаны, что называется, «по шаблону».

Еще более интересен тот факт, что некоторые публикации, индексируемые в Pubmed, характеризуются преобладанием штампов манипулятивного характера, которые в англоязычной литературе широко известны как «spin words» («слова для накручивания сознания») или «weasel words» (дословно − «хорьковые слова», то если слова, используемые для подмены обсуждения по существу на психологическое давление на читателя). Сам термин «weasel words» восходит к шекспировской фразе «I can suck melancholy out of a song, as a weasel sucks eggs» («Я могу высосать меланхолию из песни как хорек высасывает яйца» − В. Шекспир, комедия «Как вам это понравится», 2-й акт) и подразумевает cлова, которые «высасывают смысл из слов рядом с ними и оставляют только треск пустой скорлупы» [5].

Например, словосочетание «adverse outcomes» (что можно перевести как «неблагоприятные исходы») является «хорьковым словом», типичным не только для безрезультатных исследований, но и для бульварной прессы [6]. Многочисленные примеры, приводимые в монографиях [6,7], наглядно показывают, что данное словосочетание повсеместно используется в желтой прессе исключительно для запугивания читателя, а не для представления какой-либо важной информации. К сожалению, как показывают результаты настоящего исследования, лексика англоязычных таблоидов (то есть бульварных листков, см. полный список на сайте www.earthnewspapers.com) весьма широко используется и во многих англоязычных медицинских журналах, в т.ч. в журналах с “высоким индексом цитирования”.

Существование упоминаемых выше и многих других языковых «шаблонов» и «штампов» позволяет предположить, что процесс отделения манипулятивных публикаций от нормальных публикаций может быть автоматизирован посредством использования современных методов машинного обучения и интеллектуального анализа данных. Что и было сделано в недавно опубликованной работе российских исследователей, результаты которой и представлены на данном ресурсе…

Canese K., Weis S. PubMed: The Bibliographic Database. 2002 Oct 9 [Updated 2013 Mar 20]. In: The NCBI Handbook. 2nd edition. Bethesda (MD): National Center for Biotechnology Information (US); [Электронный ресурс] URL: https://www.ncbi.nlm.nih.gov/books/NBK153385/. Дата обращения: 12.12.2019.
Li L., Smith H.E., Atun R., Tudor Car L. Search strategies to identify observational studies in MEDLINE and Embase. Cochrane Database Syst Rev. 2019; MR000041. doi: https://dx.doi.org/10.1002/14651858.MR000041.pub2.
Громова О.А., Торшин И. Ю. Витамин D. Смена парадигмы; под ред. Е. И. Гусева, И. Н. Захаровой. — Москва : ГЭОТАР-Медиа, 2017. — 568 с. : ил. ; 25 см. — Библиогр. в конце гл. — 3000 (1-й з-д 500) экз. — ISBN 978-5-9704-4058-2.
Громова О.А., Торшин И.Ю. Микронутриенты и репродуктивное здоровье. Руководство. ГЭОТАР-Медиа, 2019, 672 c., ISBN 978-5-9704-5149-6.
Stewart Chaplin. The Stained Glass Political Platform. The Century Magazine. USA. 1900.
Summers E. Weasel Words: 200 Words You Shouldn’t Trust: 200 Words You Can’t Trust. Chambers (Ed.), Slang & Idiom Dictionaries. 2009; 208 p.
Watson D. Watson’s Dictionary of Weasel Words, Contemporary Cliches, Cant and Management Jargon. Knopf, 1^st Ed. 2004; 357 p.