Big Data. Большие данные в медицине
Интернет стал повседневной реальностью. В сети мы черпаем информацию, работаем, развлекаемся, учимся. Мы рассказываем о себе, оставляя ежедневный след, как и тысячи других людей. Мы тонем в потоке информации.
Постоянное желание быть в курсе новостей, открытий, событий уже не оставляет нас ни на минуту. Мы перерабатываем огромные потоки информации и рискуем утонуть в ней.
Но многие уже слышали выражение Big Data – большие данные. И, пожалуй, это наш спасительный круг в современном информационном мире.
Огромные объемы информации требуют обработки и анализа. Конечно, мы можем выбрать некоторый объем информации, обработать его, а полученный результат посчитать отражением закономерности всего объема информации рассчитав прогноз, вероятность и достоверность такого совпадения
Но на дворе XXI век, информация в библиотеках, больницах, разных НИИ, лабораториях уже оцифрован. Следует ли этим пренебрегать?
К тому же, вышеописанный подход не исключает погрешностей, которые иногда могут превратить математический прогноз в гадание.
Поэтому теперь случайная выборка различных переменных очень быстро стремится к полному набору их значений, которые зачастую нужно очень быстро обрабатывать.
И, если мы коснемся одной из самых важных тем нашей жизни – здоровья, то в случае медицинской обработки больших данных это в прямом смысле слова «вопрос жизни и смерти».
Результаты обработки «больших данных» должны быть получены максимально быстро. Это даст возможность превратить аналитику из инструмента, отвечающего на вопрос «кто виноват?», характерного для традиционных систем аналитики, в инструмент для получения ответов «что делать?». Специалист в этом случае из врача патологоанатома превращается в терапевта. Скорость доступа к данным и скорость их обработки является важным критерием качества технологий, входящих в Big Data.
Ранее оперативно учесть множество показателей работы медицинских учреждений было технически невозможно, поэтому на банковский счет госпиталей поступали средства, пропорциональные общему числу койко-дней и количеству выполненных манипуляций. Из-за этого сформировалась порочная система, в которой выгодно было проводить «лишнюю» диагностику, назначать ненужные консультации и затягивать лечение.
Если обратить внимание на сегодняшнюю реформу здравоохранения США, мы видим возможности более тонкой работы с Big Data. Ее авторы придерживаются концепции «подотчетной помощи», в рамках которой будет оцениваться, прежде всего, эффективность проведенного лечения.
Таким образом, благодаря технологиям обработки и анализа больших данных платить будут не столько за процесс лечения, сколько за способность быстро излечивать и поддерживать здоровье пациентов.
Другим важным направлением стало прогнозирование расходов. Оно базируется на многофакторном анализе таких статистических данных, как число повторных обращений, процент жалоб на конкретных врачей и подразделения, распространенность различных патологий, количество пациентов с хроническими заболеваниями, а также на эпидемиологических показателях.
Сотрудники Национальной службы здравоохранения Великобритании (NHS) используют анализ Big Data по частоте повторных госпитализаций и пропущенных приемов у врача, общему времени нахождения пациента в операционной, обеспеченности медицинскими препаратами и материалами во время операции и их доступности. А также по общему количеству времени, которое хирург затрачивает на выполнение операций в сравнении с административными или подготовительными мероприятиями. Определение несоответствий в этих показателях позволило NHS повысить загруженность операционных на 2%, что обеспечило экономию в размере 20 тыс. фунтов в неделю. В результате пациентам не только быстрее стали проводить операции по жизненным показаниям, но и быстрее выписывают их из стационара, освобождая место для других нуждающихся.
Таким образом, использование анализа «больших данных» позволяет зарубежным поставщикам медицинских услуг сократить длительность пребывания пациентов в стационаре, сдержать рост затрат и снизить число повторных госпитализаций.
Медицинские аналитические задачи, которые можно решать с применением анализа «больших данных», могут быть различных типов в зависимости от уровня зрелости (по возрастанию):
С ростом сложности задач увеличивается и сложность аналитической системы и алгоритмов, а также количество необходимых источников данных — от простых сведений из историй болезни и данных биометрического мониторинга до геномных и семейных данных и даже до информации из социальных сетей.
В здравоохранение приходят современные технологии, которые поддерживают все стандартные методы работы с данными. Это проектирование и наполнение многомерных OLAP-кубов, возможность синхронизации хранилищ OLTP и OLAP в режиме реального времени, быстрая разработка аналитических панелей с использованием библиотеки визуальных компонентов, возможность анализа неструктурированных текстовых данных и проведение прогнозной аналитики.
Анализ, сделанный в докладе компании McKinsey, показывает как «большие данные» могут не только создать дополнительный источник компенсации затрат, но и повысить качество медицинского обслуживания. В основе Big Data может быть объединена информация, хранящаяся в четырех главных источниках данных, которые сегодня не взаимосвязаны. Это:
На основе анализа всех этих данных предполагается развивать следующие направления использования Big Data:
1. Операционная деятельность медицинских учреждений. Появляется возможность исследования эффективности лечения благодаря обработке всей доступной информации о практике лечения. На основе анализа всех известных историй болезни и диагностики в практику врачей войдет широкое использование систем поддержки принятия решений, позволяющих предоставить клиницисту невиданный ранее доступ к опыту тысяч коллег по всей стране. Методы персональной и профилактической медицины, основанные на удаленном мониторинге пациентов приведут к существенному сокращению затрат и повышению качества жизни. Распространение различных сенсоров активностей человеческого организма, подключаемых к носимым гаджетам, позволяет сократить необходимость проведения лабораторных исследований, предотвратит неожиданные осложнения, а автоматическое напоминание о необходимости проведения самостоятельных лечебно-профилактических манипуляций повысит качество назначенного лечения;
2. Система ценообразования и оплаты. Анализ счетов и поступлений с помощью автоматических процедур, основанных на машинном обучении и нейронных сетях, позволит сократить число ошибок и хищений при оплате. Формирование ценовых планов, учитывающих реальные возможности населения и потребность в услугах, также увеличивает общие поступления от пациентов. Только системы, работающие с «большими данными», позволяют перейти к оплате, основанной на качестве оказываемой помощи и совместно регулировать расходы на медикаменты и труд медперсонала;
3. Исследования и разработки. Наибольший эффект здесь следует ожидать от новых возможностей предиктивного моделирования при разработке лекарственных препаратов. Не меньшее влияние статистические алгоритмы и инструменты больших данных производят на планирование клинических исследований и привлечение пациентов к таким испытаниям. Обработка результатов таких испытаний еще одно важное приложение «больших данных». Особое место в исследованиях и разработках в здравоохранении сейчас занимают инновации в персонализированной медицине. Основываясь на обработке гигантских объемов генетической информации, которые становятся всё более доступными для человека, врачи смогут назначать абсолютно уникальные лекарственные средства и методы лечения. Наконец, разработки по выделению паттернов заболеваний позволят получить хорошие прогностические оценки развития различных видов болезней, выделить профили рисков и не только провести профилактические мероприятия, но и спрогнозировать необходимость разработок методов лечения, эффективных для будущих видов заболеваний;
4. Новые бизнес-модели. Основанные на цифровых данных в здравоохранении эти модели могут дополнять существующие или даже конкурировать с некоторыми из них. Это агрегаторы данных, которые поставляют проанализированные и скомпонованные блоки данных, удовлетворяющих заданным условиям, третьим лицам. Например, все истории болезней пациентов, применявших тот или иной фармакологический препарат, важны для фармпредприятий и они готовы покупать такие данные. Другим потенциалом новых бизнес-моделей являются он-лайн платформы для пациентов и врачей, медицинских исследователей и фармакологов;
5. Массовый скрининг и предупреждение и выявление эпидемий. Это направление опирается на Big Data, развитие технологий позволяет строить как географические и социальные модели здоровья населения, так и предиктивные модели развития эпидемических вспышек.
Несмотря на то, что степень проникновения Big Data в российском здравоохранении ниже, чем в США и Европе, проблемы отношения к этим технологиям схожие. Хотя медицина (отечественная в частности) является одной из отраслей, в которых технологи управления «большими данными» дают наиболее яркий эффект, многие все еще относятся к ним пока со скепсисом, возможно, ввиду не всегда понятной бизнес-выгоды и нехватки специалистов.
Постоянное желание быть в курсе новостей, открытий, событий уже не оставляет нас ни на минуту. Мы перерабатываем огромные потоки информации и рискуем утонуть в ней.
Но многие уже слышали выражение Big Data – большие данные. И, пожалуй, это наш спасительный круг в современном информационном мире.
Итак, что же такое BigData?
BigData это не только большие объёмы информации, но и технологии её хранения, и аналитические методы обработки.Огромные объемы информации требуют обработки и анализа. Конечно, мы можем выбрать некоторый объем информации, обработать его, а полученный результат посчитать отражением закономерности всего объема информации рассчитав прогноз, вероятность и достоверность такого совпадения
Но на дворе XXI век, информация в библиотеках, больницах, разных НИИ, лабораториях уже оцифрован. Следует ли этим пренебрегать?
К тому же, вышеописанный подход не исключает погрешностей, которые иногда могут превратить математический прогноз в гадание.
Поэтому теперь случайная выборка различных переменных очень быстро стремится к полному набору их значений, которые зачастую нужно очень быстро обрабатывать.
И, если мы коснемся одной из самых важных тем нашей жизни – здоровья, то в случае медицинской обработки больших данных это в прямом смысле слова «вопрос жизни и смерти».
Результаты обработки «больших данных» должны быть получены максимально быстро. Это даст возможность превратить аналитику из инструмента, отвечающего на вопрос «кто виноват?», характерного для традиционных систем аналитики, в инструмент для получения ответов «что делать?». Специалист в этом случае из врача патологоанатома превращается в терапевта. Скорость доступа к данным и скорость их обработки является важным критерием качества технологий, входящих в Big Data.
Ранее оперативно учесть множество показателей работы медицинских учреждений было технически невозможно, поэтому на банковский счет госпиталей поступали средства, пропорциональные общему числу койко-дней и количеству выполненных манипуляций. Из-за этого сформировалась порочная система, в которой выгодно было проводить «лишнюю» диагностику, назначать ненужные консультации и затягивать лечение.
Если обратить внимание на сегодняшнюю реформу здравоохранения США, мы видим возможности более тонкой работы с Big Data. Ее авторы придерживаются концепции «подотчетной помощи», в рамках которой будет оцениваться, прежде всего, эффективность проведенного лечения.
Таким образом, благодаря технологиям обработки и анализа больших данных платить будут не столько за процесс лечения, сколько за способность быстро излечивать и поддерживать здоровье пациентов.
Другим важным направлением стало прогнозирование расходов. Оно базируется на многофакторном анализе таких статистических данных, как число повторных обращений, процент жалоб на конкретных врачей и подразделения, распространенность различных патологий, количество пациентов с хроническими заболеваниями, а также на эпидемиологических показателях.
Сотрудники Национальной службы здравоохранения Великобритании (NHS) используют анализ Big Data по частоте повторных госпитализаций и пропущенных приемов у врача, общему времени нахождения пациента в операционной, обеспеченности медицинскими препаратами и материалами во время операции и их доступности. А также по общему количеству времени, которое хирург затрачивает на выполнение операций в сравнении с административными или подготовительными мероприятиями. Определение несоответствий в этих показателях позволило NHS повысить загруженность операционных на 2%, что обеспечило экономию в размере 20 тыс. фунтов в неделю. В результате пациентам не только быстрее стали проводить операции по жизненным показаниям, но и быстрее выписывают их из стационара, освобождая место для других нуждающихся.
Таким образом, использование анализа «больших данных» позволяет зарубежным поставщикам медицинских услуг сократить длительность пребывания пациентов в стационаре, сдержать рост затрат и снизить число повторных госпитализаций.
Медицинские аналитические задачи, которые можно решать с применением анализа «больших данных», могут быть различных типов в зависимости от уровня зрелости (по возрастанию):
- описательная аналитика (отвечающая на вопрос «Что случилось?»);
- диагностическая аналитика («Почему это произошло?»);
- предиктивная аналитика («Что случится в будущем?»);
- предписывающая аналитика («Что необходимо сделать, чтобы этого не произошло?»).
С ростом сложности задач увеличивается и сложность аналитической системы и алгоритмов, а также количество необходимых источников данных — от простых сведений из историй болезни и данных биометрического мониторинга до геномных и семейных данных и даже до информации из социальных сетей.
В здравоохранение приходят современные технологии, которые поддерживают все стандартные методы работы с данными. Это проектирование и наполнение многомерных OLAP-кубов, возможность синхронизации хранилищ OLTP и OLAP в режиме реального времени, быстрая разработка аналитических панелей с использованием библиотеки визуальных компонентов, возможность анализа неструктурированных текстовых данных и проведение прогнозной аналитики.
Анализ, сделанный в докладе компании McKinsey, показывает как «большие данные» могут не только создать дополнительный источник компенсации затрат, но и повысить качество медицинского обслуживания. В основе Big Data может быть объединена информация, хранящаяся в четырех главных источниках данных, которые сегодня не взаимосвязаны. Это:
- данные, полученные в ходе исследований и испытаний;
- данные из клиник по историям болезни и диагностике;
- данные о поведении пациентов, их покупки, отзывы, данные от домашних медицинских приборов и даже от одежды и обуви, таких как кроссовки с сенсорами;
- данные от медицинских учреждений об оказании услуг, аптек об отпуске препаратов, сведения о ценах на рынке здравоохранения.
На основе анализа всех этих данных предполагается развивать следующие направления использования Big Data:
1. Операционная деятельность медицинских учреждений. Появляется возможность исследования эффективности лечения благодаря обработке всей доступной информации о практике лечения. На основе анализа всех известных историй болезни и диагностики в практику врачей войдет широкое использование систем поддержки принятия решений, позволяющих предоставить клиницисту невиданный ранее доступ к опыту тысяч коллег по всей стране. Методы персональной и профилактической медицины, основанные на удаленном мониторинге пациентов приведут к существенному сокращению затрат и повышению качества жизни. Распространение различных сенсоров активностей человеческого организма, подключаемых к носимым гаджетам, позволяет сократить необходимость проведения лабораторных исследований, предотвратит неожиданные осложнения, а автоматическое напоминание о необходимости проведения самостоятельных лечебно-профилактических манипуляций повысит качество назначенного лечения;
2. Система ценообразования и оплаты. Анализ счетов и поступлений с помощью автоматических процедур, основанных на машинном обучении и нейронных сетях, позволит сократить число ошибок и хищений при оплате. Формирование ценовых планов, учитывающих реальные возможности населения и потребность в услугах, также увеличивает общие поступления от пациентов. Только системы, работающие с «большими данными», позволяют перейти к оплате, основанной на качестве оказываемой помощи и совместно регулировать расходы на медикаменты и труд медперсонала;
3. Исследования и разработки. Наибольший эффект здесь следует ожидать от новых возможностей предиктивного моделирования при разработке лекарственных препаратов. Не меньшее влияние статистические алгоритмы и инструменты больших данных производят на планирование клинических исследований и привлечение пациентов к таким испытаниям. Обработка результатов таких испытаний еще одно важное приложение «больших данных». Особое место в исследованиях и разработках в здравоохранении сейчас занимают инновации в персонализированной медицине. Основываясь на обработке гигантских объемов генетической информации, которые становятся всё более доступными для человека, врачи смогут назначать абсолютно уникальные лекарственные средства и методы лечения. Наконец, разработки по выделению паттернов заболеваний позволят получить хорошие прогностические оценки развития различных видов болезней, выделить профили рисков и не только провести профилактические мероприятия, но и спрогнозировать необходимость разработок методов лечения, эффективных для будущих видов заболеваний;
4. Новые бизнес-модели. Основанные на цифровых данных в здравоохранении эти модели могут дополнять существующие или даже конкурировать с некоторыми из них. Это агрегаторы данных, которые поставляют проанализированные и скомпонованные блоки данных, удовлетворяющих заданным условиям, третьим лицам. Например, все истории болезней пациентов, применявших тот или иной фармакологический препарат, важны для фармпредприятий и они готовы покупать такие данные. Другим потенциалом новых бизнес-моделей являются он-лайн платформы для пациентов и врачей, медицинских исследователей и фармакологов;
5. Массовый скрининг и предупреждение и выявление эпидемий. Это направление опирается на Big Data, развитие технологий позволяет строить как географические и социальные модели здоровья населения, так и предиктивные модели развития эпидемических вспышек.
Несмотря на то, что степень проникновения Big Data в российском здравоохранении ниже, чем в США и Европе, проблемы отношения к этим технологиям схожие. Хотя медицина (отечественная в частности) является одной из отраслей, в которых технологи управления «большими данными» дают наиболее яркий эффект, многие все еще относятся к ним пока со скепсисом, возможно, ввиду не всегда понятной бизнес-выгоды и нехватки специалистов.
Автор: Игорь Калайда, Генеральный директор НИИ СОКБ (Научно-испытательный институт систем обеспечения комплексной безопасности)