Скачать книгу

закон «Об информации, информационных технологиях и о защите информации» от 27.07.2006 №149-ФЗ.

      Для обучения, внутренней и внешней валидации, клинико-технических и клинических испытаний технологий искусственного интеллекта применяют эталонные наборы данных, под которыми понимают упорядоченную совокупность:

      – результатов диагностических исследований одной или нескольких модальностей и/или однотипных медицинских документов;

      – сведений о наличии, характере и локализации и т. д. целевых признаков; для текстовых документов – библиотеки ключевых слов, словосочетаний и их критичных сочетаний;

      – сведений о верификации (опционально).

      Информация о наличии, характере, локализации и т. д. целевых признаков (в том числе в соответствии с Международной классификацией болезней – МКБ) может быть подтверждена объективно – в таком случае набор данных именуется верифицированным.

      Размер набора данных (математически – размер выборки) и баланс классов определяются исходя из целей и задач проводимого исследования и требований технического задания на проведение исследований, а также с учетом требований заказчика.

      Эталонный набор данных должен быть проверен профильной медицинской научно-исследовательской организацией на предмет полноты и качества содержащейся в нем информации. Рекомендуется при проведении клинических испытаний применять эталонные наборы данных, имеющие государственную регистрацию в качестве базы данных.

      Эталонный набор данных для клинических испытаний должен содержать такие сведения (описательного характера) [4]:

      – номер свидетельства о государственной регистрации базы данных (рекомендательно);

      – характеристика популяции (гендерно-возрастные показатели, этнический состав, регионы проживания и т.д.);

      – сведения о медицинских организациях, послуживших источниками для формирования набора данных;

      – характеристика исследований: анатомическая область (-и), модальность, проекции;

      – целевой признак;

      – общее количество клинических случаев, исследований, изображений, документов и их распределение по диагностическим группам (в т.ч. «норма»/«патология»);

      – сведения о верификации.

      Требования к эталонному набору данных [4]:

      1. Структура набора данных должна соответствовать поставленной цели его формирования (решаемой клинической задаче).

      2. Планируемый размер эталонного набора данных должен быть обоснован в протоколе исследования, исходя из статистических соображений и желаемой точности оценки основных метрик.

      3. Разметка должна быть проведена с использованием стандартизированной терминологии – т.н. тезауруса (кодированной библиотеки типовых формулировок, соответствующих нормативно-правовой документации, клиническим рекомендациям или рекомендациям профессиональных

Скачать книгу