проф. Древаль А.В.

Поиск медицинской информации в Интернете

 

Первый вопрос, который возникает у начинающего пользователя Интернета: «Как найти необходимую медицинскую информацию?» Прежде всего отметим, что нет правильных или неправильных  путей поиска в Интернете. Несомненно, одни из них  могут потребовать большего времени, чем другие, но в конечном счете предпочтение должно отдаваться тому методу, который кажется наиболее удобным и плодотоворным с точки зрения пользователя Интернета, то есть врача, в нашем случае.

Можно выделить три основных способа поиска медицинской информации:

-     по ключевому слову (к примеру «диабет») или фразе («диабетическая стопа»), которые вводятся в так называемую Поисковую Машину, (например, представленные по адресу www.rambler.ru или www.yandex.ru ) и она проводит поиск информации в Интернете, содержащей указанное слово или фразу

-     в предметных каталогах Поисковой Машины, например в разделах «Эндокринология», «Диабетология» и т.п.

-     в предметных каталогах, имеющих оценку качества информации, так называемые оцененные предметные каталоги

 

ПОИСК ПО КЛЮЧЕВОМУ СЛОВУ

 

Несмотря на бытующее предубеждение, особенно среди медиков, относительно сложности работы в Интернете, начинающего пользователя обычно приятно удивляет чрезвычайная простота поиска нужной информации в Интернете, который обычно осуществляется с помощью так называемых Поисковых Машин. Наиболее популярны в российском Интернете Поисковые Машины www.rambler.ru и www.yandex.ru . Вход в сеть  Интернет осуществляется обычно или через Microsoft Internet Explorer или Netscape Navigator, которые можно отнести к индувидуальным (пользовательским) Поисковым Машинам. В каждой из них имеется кнопка «Поиск» (Net Search), нажав на которую, можно сразу выйти на зарубежные Поисковые Машины (например, www.yahoo.com ). Взаимодействие пользователя с любой Поисковой Машиной в Интернете происходит однотипно. В специальную рамку (бокс) Поисковой Машины вводится ключевое слово или фраза, а затем нажимается кнопка «Поиск» (Search), которая обычно расположена справа от рамки. В течение нескольких секунд появляется перечень Сайтов, в которых обсуждаются, например, проблемы диабета, если было введено слово «диабет».

 Такой удивительно удобный способ поиска информации в Интернете стал возможен благодаря разработке компьютерных программ, под общим названием Poботы. Задача такой программы состоит в том, чтобы регулярно собирать в Интернете информацию о Сайтах и помещает ее в свою базу данных, с которой  и работает пользователь, когда обращается к услугам Поисковой Машины. Когда пользователь Интернета вводит в Поисковую Машину (Rambler, например) ключевое слово, то из базы данных сформированной Роботом, ему представляется перечень Сайтов, в которых имеется ключевое слово. 

В настоящее время в Интернете представлено несколько десятков популярных Роботов. Но, к сожалению, их обилие создает определенные проблемы для пользователя, поскольку принцип работы каждого из Роботов уникален и поэтому одно и то же ключевое слово (например, «диабет»),  введенное в разные Поисковые Машины (Rambler или Yandex), базы данных которых сформированны разными Роботами, дает различный перечень Сайтов, как по порядку их представления, так и по охвату.  Можно выделить две основные причины таких отличий в работе Роботов:

-     одни из них собирают все, что они в состоянии найти в Сети по заданной теме, а другие выбирают из Сайтов только определенные страницы по заданной теме

-     одни из них успешно идентифицируют такие сложные объекты для поиска как рисунки карт, фреймовые ссылки и страницы, доступ к которым возможен только с паролем, а другие Роботы такими возможностями не обладают.

 

Следует также отметить, что независимо от того, как велика база данных в Поисковой Машине, она не в состоянии индексировать (то есть детально и автоматически классифицировать) всю информацию представленную в Интернете. Например, ввод ключевого слова «MEDLINE» в Поисковую Машину Rambler представляет пользователю до 18000 Сайтов, через которые можно войти в эту базу данных, но ни одна Поисковая Машина, в том числе и Rambler, уже не классифицирует информацию, расположенную в базе данных MEDLINE. Таким образом, для врача, который ищет определенную информацию в Интернете остается довольно широкий диапазон для творческого подхода к этому процессу, который и определяет результативность поиска.

 Рассмотрим теперь практическую сторону вопроса, на примере некоторых популярных отечественных и зарубежных Поисковых Машин.

 

Yandex (Яндекс)

http://www.yandex.ru/

Яндекс является пожалуй наилучшей Поисковой Машиной в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые Поисковая Машина просматривает в течение нескольких секунд.

Поиск в базе данных Яндекс

Поиск информации задается введением ключевого слова («диабет», например) в специальную рамку и нажатием кнопки «Найти», справа от рамки. Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше). Таким образом, Сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных Поисковой Машиной Сайтов. Содержательную часть Сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой Машиной под адресом Сайта.

Например, поиск Сайтов по ключевому слову “диабет” даст список, в начале которого будут представлены Веб-страницы (Сайты), в заголовках которых содержится эта фраза. Если в найденных Поисковой Машиной документах будет содержаться эта фраза более одного раза, то Машина ранжирует остальные документы по частоте встречаемости заданной фразы. Некоторые недобросовестные авторы Сайтов, для того,  чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой Машины, умышленно включают в документ бессмысленные повторы ключевого слова, например, набирают в документе подряд несколько десятков раз слово «диабет». Но как только Поисковая Машина обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.

Даже ранжированный список документов, предлагаемый Поисковой Машиной в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска.  Например, на ключевое слово «диабет» Яндекс предлагает список из 34 899 Веб-страниц, где первый российский Сайт по диабету www.diabet.ru занимает первое почетное место. После ввода в команду «Искать в найденном» ключевого слова «нефропатия» список сокращается до 750 страниц, а после ввода в эту команду слова «микроальбуминурия» этот список сокращается до 130 Веб-страниц.

Под каждым Сайтом указана команда – «Похожие документы» и если ее запустить, то Поисковая Машина предложит перечень Сайтов с близким по теме содержанием. 

 

AltaVista

http://www.altavista.com

 

AltaVista безусловно является лучшим поисковым инструментом в Интернете. Эта база данных содержит более 100 миллионов Веб-страниц, которые Поисковая Машина может просматривать в течении нескольких секунд

Поиск в базе данный Alta Vista

Поиск информации задается введением ключевого слова («diabet», например) в специальную рамку и нажатием кнопки «Search» (англ. «Поиск»), справа от рамки. Результаты поиска появляются в течение нескольких секунд, ранжированные по значимости – наиболее важные документы размещаются в начале списка.

Alta Vista также позволяет ограничить результаты поиска определенным языком, а через сервис «Advanced» (Дополнительно) найти страницы, которые созданы в определенное временные промежутки (годы, месяцы и т.п.). Например, на ввод ключевого слова «diabetes» с указанием языка Russian, Alta Vista представляет 103 русскоязычных Веб-страниц, в котором российский специализированный по диабету Сайт www.diabet.ru занимает четвертое место, а на первом - http://aurinko.karelia.ru/, где слово диабет входит в рекламу экзотического респиратора для лечения диабета.

Специальная синтаксическая поисковая функция Alta Vista обеспечивает не только поиск изображений (картинок), но также информацию по Веб-страницам со схожей информацией (команда «Related pages»).

 

Northern Light

 

http://www.northernlight.com

 

Эта Поисковая Машина содержит в своей базе данных около  315 миллионов Веб-страниц, а также собственную специализированную коллекцию  полных текстов журналов и газетных статей. Northern Light обеспечивает врачей обширной, а порой и уникальной информацией.

 

Поиск в базе данных Northern Light

 По умолчанию, поиск задаваемой пользователем тематической информации осуществляется как в Интернете, так и в специальной коллекции этой Поисковой Машины. При этом коллекция состоит из 25 миллионов отобранных источников, которые не являются общедоступными в Интернете. Что касается диабета, то эта коллекция формируется на основе таких журналов как Diabetes, Diabetes Care, Lancet, British Medical Journal и других не менее авторитетных. К сожалению, российские источники не представлены, а главным образом, англоязычная литература.   Другим, ограничивающим использование этой специальной коллекции, обстоятельством является платность услуги – чтобы получить статью, следует заплатить от 1 до 4$ США. Но если окажется, что оплаченная статья не подходит, то можно за оплаченную уже сумму заказать новую статью.

Кроме вышеуказанного дополнительного сервиса, Поисковая Машина Northern Light сортирует найденную информацию по отдельным категориям, что упрощает поиск нужного материала. Например, в специальной коллекции выделяются по диабету категории  «Диабет»,  «Инсулин», «Болезни Сердца», «Генетика» и другие. Внутри начальных категорий выделяются Поисковой Машиной подкатегории, что позволяет существенно сузить, а следовательно и ускорить поиск нужной информации.

Веб-страницы и Сайты, не включенные в специальную коллекцию, кроме того, что ранжированы в общем списке также разделены на категории. И что особенно приятно, в этих категориях выделен раздел Российские Сайты (Russian Site), а наш первый отечественный Сайт www.diabet.ru выделен в отдельную категорию с перечнем ряда его страниц.  

 

Сравнительный анализ Alta Vista и Nothern Light (нужно дать свой пример)

 

-          Вследствие таких исключительных качеств как скорость ответа и чрезвычайно мощной функции поиска – Булева логика, поддержанная фильтрами по дате и языку – Alta Vista остается Поисковой Машиной выбора.

-          Хотя Northern Light содержит существенно меньшее число документов, вместе с тем, ее способность содержательно их сортировать «на лету», представляет значительное достижение  и существенно облегчает поиск нужной информации. Более того, ее уникальная коллекция из 2 миллионов полнотекстовых журнальных статей позволяет получать информацию не представленную более нигде в Интернете.  

 

Для того, чтобы сравнить базы данных этих Поисковых Машин научно более обосновано, организуем три различных поиска – по ключевому слову, по ключевой фразе и булевый (логический) поиск. Максимально возможная объективность результатов поиска определяется тем, что поиск проведен в один и тот же день и в обеих базах данных были заданы для поиска одни и те же параметры.

 

Результаты сравнительного анализа

Несмотря на то, что как на поиск по слову, так и по фразе число представленных документов совпало их ранжирование оказалось абсолютно различным. В то время как Alta Vista наиболее важной выделила документ…, Northern Light в качестве главного … Хотя оба из них потенциально важны. Более того, хотя обе Поисковые Машины  включили в список много совпадающих документов, но также часть из документов встречалась  только в одном из списков.

Логический (Булевый) поиск информации также дал различные результаты.

Эти примеры наглядно демонстрируют вариабельность результатов поиска различными Поисковыми Машинами. Следовательно, если требуется получить из Интернета исчерпывающую и максимально возможную информацию по какой-то теме, то нужно быть готовым к использованию базы данных различных Поисковых Машин.

 

Достоинства поиска по ключевому слову (фразе)

 

-          По ключевому слову поиск организуется узконаправленно, точно отражая потребность в информации пользователя, врача в частности.

-          Обширный перечень найденных документов, гарантирует в определенной степени, полноту охвата информации

-          Легко организовывать поиск по базе данных

Недостатки поиска по ключевому слову (фразе)

-          Неоднозначность выбранных для поиска слов и использование одних и тех слов в различных предметных областях приводит к тому, что в список включается много документов, не имеющих прямого отношения к запрашиваемой информации. Например, на фразу инсулиновая ручка, в список документов представленных Поисковой Машиной, могут войти не только инсулиновые, но и другие ручки – пишущие, дверные и т.п.

-          Ресурсы (Веб-страницы, Сайты), которые включаются в базу данных Поисковой Машины Роботом, специально не оцениваются. Для адекватного отражения Сайта  в Поисковой Машине, детальное ее описание нужно самостоятельно разместить в Поисковые Сайты Яндекс, Alta Vista, Northern Light или в любом другом.

 

 

Инструменты мета-поиска: краткое замечание

В настоящее время в Интернете представлены Серверы, которые позволяют осуществлять одновременный поиск по нескольким базам данных. Например, Поисковая Машина Dogpile (http://www.dogpile.com) обеспечивает поиск по 14 базам данных Интернета, представленным в одном экране. Эти базы данных включают Alta Vista, Yaho, Lycos  и другие.

Сторонники такого мета-поиска полагают, что использование большого перечня  Поисковых Машин существенно улучшает информативность поиска. Хотя эти и так, но теневой стороной этого утверждения является то, что поиск информации осуществляется не по объединенной базе данных всех Поисковых Машин, а его необходимо все равно проводить в базе каждой Поисковой Машины отдельно. В итоге пользователь нередко набирает, с одной стороны, практически необозримое число Веб-страниц, а с другой, в каждом из списков, которые представляет отдельная Поисковая Машина, оказывается много документов, представляемых другими Поисковыми Машинами, то есть информация дублируется. Кроме того, время поиска также существенно увеличивается.

В связи с вышесказанным, наиболее целесообразно использовать этот подход к поиску лишь в тех случаях, когда заведомо ищется  какая-то очень редкая и необычная информация, и поэтому удобнее организовывать поиск с какой-то одной Веб-страницы в Интернете, где представлен набор ведущих Поисковых Машин, чем разыскивать отдельные Поисковые Машины в сети.

 

ПРЕДМЕТНЫЕ КАТАЛОГИ

 

Поиск информации по ключевому слову (фразе) в Интернете, во многих отношениях, аналогичен поиску информации о каком-то слове или фразе в книге, когда для этого используется, так называемый «Предметный указатель», где напротив слова или фразы, указана страница текста, на которой можно найти его разъяснение. С другой стороны, если нужно получить общее представление о том, чему посвящена книга, следует обратиться к ее содержанию. Аналогично и в Интернете, можно искать медицинскую информацию, пользуясь в Поисковых Машинах выделенными тематическими разделами (предметными каталогами). Эти амбициозные проекты направлены на организацию информации в Интернете по типу библиотечного каталога.  Например, если необходимо найти информацию о сахарном диабете, следует обратиться к разделу «Медицина», в нем выбрать раздел «Эндокринология», а в последнем - раздел «Сахарный диабет», где должны быть сгруппированы материалы по этой тематике.

Информация по медицине и здравоохранению наилучшим образом представлена в Поисковой Машине Yahoo, а также на Сайте World Wide Web Virtual Library.

 

Yahoo! – раздел здравоохранение

http://www.yahoo.com/Health

 

До тех пор, пока работа в Интернете не стала привычной, Сайт Yahoo! является для начинающих наиболее подходящей стартовой точкой сбора медицинской информации в Интернете. База данных этой Поисковой Машины разбита на тематические разделы, один из которых называется Health (Здоровье).

Как только выбирается для поиска раздел Health, Поисковая Машина Yahoo! в ответ на запрос представляет новое меню для выбора в виде более детальной рубрикации раздела Health, состоящей перечня, включающего Diseases and Conditions (Болезни и состояния). Выбрав Diseases and Conditions, вы получаете новое меню, из которого можно вызвать раздел Diabetes, если нажать букву D в алфавите страницы. В разделе Diabetes выделены категории – Книги, Компании, Инсулинорезистентность, Наиболее популярные сайты по диабету и перечень Веб-страниц по диабету.

Когда неизвестно в каком разделе может располагаться нужная информация, тогда можно воспользоваться поисковым средством по каталогу разделов Yahoo! В результате такого поиска можно тут же попасть в нужный раздел.

Поскольку Yahoo! удерживает в процессе поиска иерархическую структуру разделов,  всегда можно вернутся на предыдущий вышестоящий уровень, если по какой-то причине вызванный текущий раздел не оправдал ожиданий.

 

Виртуальная библиотека всемирной паутины

(World Wide Web Virtual Library)

http://www.mth.uea.ac.uk/VL/Overview.html (Зеркало в Англии)

 

Virtual Library - старейший каталог ресурсов сети. В отличие от других Сайтов такого типа, он содержит обстоятельный каталог, с помощью которого можно выйти на раздел по своей специальности.

Также как и в Yahoo! ресурсы организованы иерархически. Так, например, внутри раздела Bioscience содержатся ссылки по более узким тематикам – Genetic, Neurobiology, Medicine и др. Внутри последней категории находятся другие подкатегории – Epidemiology, Nutrition и Psychology, например.

Как и любая другая виртуальная библиотека, поддерживаемая на добровольных началах, она не имеет какой-либо жесткой, раз и навсегда заданной структуры. Несмотря на это ограничение, предметный каталог Virtual Library дает представление о том, что опубликовано в Интернете и какой материал в настоящее время доступен. Более того, если в каталоге представлен раздел, соответствующий направлению поиска, тогда можно отыскать такие работы, которые в других поисковый системах практически недоступны.

 

Преимущества предметных каталогов

-          Поскольку предметный каталог позволяет сразу выделять из огромных ресурсов сети нужную информацию, то исчезает необходимость задавать в Поисковой Машине высоко-специфические для поиска ключевые слова и, тем самым, облегчается поиск

-          Организация информации в виде каталога является привычной, логически очевидной и поэтому для начинающего пользователя Интернета служит удобной стартовой площадкой.

 

Недостатки предметных каталогов

-          Поскольку каталог формируется не автоматически, а авторским коллективом, то в итоге перечень Сайтов и Веб-страниц оказывается менее полным, а материалы менее свежими, чем в аналогичных разделах автоматизированных Поисковых Машин, работающих по ключевым словам или фразам.

-          Важные ресурсы могут быть упущены вследствие размещения ресурса в неожиданном разделе каталога. В частности, довольно трудно разыскать информацию о диабете в каталогах Virtual Library, поскольку она не выделена в отдельный раздел, а разбросана по таким разделам как Эпидемиология, Генетика и др.

Использование предметного каталога – рабочий пример

Box 3.3 на странице 34. Можно привести и свой пример.

 

 

ОЦЕНЕННЫЕ ПРЕДМЕТНЫЕ КАТАЛОГИ

 

Необходимую медицинскую информацию можно найти и по третьему пути – если воспользоваться растущим числом каталогов, где дается оценка качества представленной в Интернете информации. Это так называемые оцененные предметные каталоги. Такой каталог специально формируется для профессионалов службы здравоохранения, которым необходимы только надежные и авторизованные источники информации. 

 

Medical Matrix

 

http://www.medmatrix.org/index.asp

      Одной из наиболее авторитетных медицинских поисковых служб является Medical Matrix Project, задачей которой является размещение, аннотация и постоянное обновление клинических медицинских Интернет-ресурсов, без ограничения к ним доступа.

Материалы для каталога собираются рабочей Интернет-группой от Американской Медицинской Ассоциации по Информатике. В настоящее время Matrix содержит более 4000 оцененных по качеству ссылок на Сайты, которые размещены в иерархически организованном предметном каталоге. Семь начальных разделов каталога включают такие направления как «Специальность», «Болезни», «Клиническая практика» и «Образование», «Литература», «Здравоохранение», «Компьютеры, Интернет и Технологии». Внутри каждого раздела ресурсы разделены на подразделы, что позволяет пользователю сужать направление поиска до нужной темы. Например, в разделе «Эндокринология» выделены подразделы – Новости, Инструменты принятия решений, Справочники и Практические Руководства.

Кроме того, что представленные гиперссылки позволяют выйти на первоисточник информации в Интернете, каждому ресурсу дается детальная оценка относительно типа содержащейся в нем информации. Например, в разделе «Эндокринология  – Инструменты принятия решения» дана характеристика трем представленным ресурсам. Ознакомившись с представленной аннотацией, можно сразу определить какой из ресурсов в наибольшей степени соответствует цели поиска. Это позволяет избежать посещения Сайтов, которые мало соответствуют цели поиска, что позволяет сэкономить  как личное время, так и время пребывания в Интернете (что особенно актуально, когда оно платное).

 Другой полезной чертой Matrix является его ранговая система. Хотя все Сайты, включенные в Matrix, отвечают определенным основным критериям качества, Сайты, которые в разделе являются наилучшими или лучшими по данной специальности, отмечены звездочками качества.

 Для того, чтобы пользоваться Matrix, необходимо зарегистрироваться. Но несмотря на несколько обременительную форму регистрации, результат себя оправдывает – вы получаете бесплатных пока еще доступ к качественной медицинской информации.

 

OMNI (Organising Medical Networked Information)

http://omni.ac.uk

Данные, которые можно получить на OMNI, предназначены профессионалам медикам и этот Сайт анонсирует себя как высококачественный биомедицинский информационный ресурс Великобритании. Особенностью этого Сайта является возможность поиска информации в базе данных по трем направлениям: а) по темам, сгруппированным в алфавитном порядке; б) по темам каталога; в) с использования метода медицинских тематических заголовков. Последний прием автоматически связывать искомую информацию с узкими и широкими медицинскими темами, что ускоряет поиск нужной информации. Например, когда ищется информация по теме «Нарушение аппетита» (Eating disorders), то предоставляется возможность на Сайте получить информацию сразу по двум направлениям – более узкому «Неврогенная анорексия» (Anorexia nervosa) и более широкому «Психические нарушения» (Mental disorders), а также по смежной тематике «Личностные нарушения» (Personal disorders).

Кроме того, Сайт, который сосредоточен исключительно на Великобританских информационных ресурсах, имеет определенные достоинства на фоне явного уклона Интернета на данные из США.  На Сайте OMNI также дается обстоятельная информация, на каком основании включена информация в базу данных, а также целый ряд превосходных статей, касающихся качества медицинской информации в Интернете.

 

Health on the Net

http://www.hon.ch/

 

Организация «Здоровье в Сети» (The Health on Net Foundation) – некоммерческая организация, которая занимается реализацией преимуществ Интернета и смежных технологий в области медицины и здравоохранения.

Представленные в базе данных Сайты ранжированы по качеству представленной в них информации. Поисковая Машина Сайта Health on the Net также позволяет ограничить поиск Интернет ресурсов определенной тематикой, например, образованием или даже географическим регионом. С ее помощью можно найти определенные клиники, группы самоподдержки, а также медицинские конференции и мероприятия.

 

 

Заключительные замечания по оценным предметным каталогам

 

·         Хороший обзор и общее представление по предмету поиска медицинской информации дает Medical Matrix

·         Если нужно выделить британские инфорационные ресурсы, то следует пользоваться OMNI

·         Когда необходимо найти определенный Сайт или получить информацию по отдельному географическому региону – целесообразно использовать Health on Net

 

Преимущества оцененных предметных каталогов

 

·         Благодаря тому, что перед размещением информации на Сайте она оценивается профессионалами, такого рода каталоги дают возможность быстро и легко получить медицинские данные

·         Краткое описание предложенных поисковой машиной Сайтов позволяет получить предварительное представление о Сайте, что избавляет от необходимости просмотра ненужных источников информации

 

Недостатки оцененных предметных каталогов

 

·         Так как каталоги составляются не автоматически, а людьми, то потенциально возможны упущения важных информационных ресурсов

·         Большинство такого рода каталогов находятся лишь на начальной стадии развития и потому содержат очень ограниченный перечень информационных ресурсов

 

ЗАКЛЮЧЕНИЕ

 

Итак выше был дано общее представление о спектре инструментов поиска информации в Интернете. Какой из них наиболее целесообразно использовать – зависит от поставленной задачи поиска и от того, что необходимо найти. Если возникает необходимость поиска информационных ресурсов высокого качества, то оцененные предметные каталоги подходят в наилучшей степени. Для того, чтобы получить более широкое представление о предмете поиска, предпочтительнее пользоваться общими предметными каталогами. Когда поиск узконаправлен (точечный), тогда можно использовать поиск по ключевому слову. Но обычно достаточную информацию из Интернета можно извлечь лишь используя комбинацию вариантов поиска.