ivdon3@bk.ru
Рассмотрены и использованы методы и технологии для решения задачи визуализации патентного ландшафта на основе кластерного анализа патентного массива. Разработаны алгоритмы загрузки патентных архивов, парсинга патентных документов, кластеризации патентов и визуализации патентного ландшафта. Реализован программный модуль для кластеризации патентных документов на основе модели латентного размещения Дирихле и визуализации патентного ландшафта на данных кластеризации с использованием библиотек gensim, PySpark, sklearn. Программный модуль апробирован на патентах, выданных ведомством по патентам и товарным знакам США.
Ключевые слова: патенты, извлечение информации, кластеризация, патентный ландшафт, инновационный потенциал
С развитием промышленности и науки растет размер патентной базы, а так же растет и количество патентных заявок, поступающих в ведомства, регулирующие вопросы по выдаче патентов. Каждую патентную заявку необходимо проверить на уникальность патентируемой технологии, для этого эксперту патентного бюро необходимо провести поиск по патентной базе и найти патенты-аналоги. В случае отсутствия патентов-аналогов данную технологию можно считать уникальной и принимать на патентирование. Поскольку базы патентов различных ведомств могут насчитывать десятки миллионов патентов, то такой патентный поиск и оценка уникальности патентируемой технологии может занимать очень длительное время. Существующие системы не удовлетворяют всем требованиям и не имеют полного необходимого функционала. В этой статье описывается разработка автоматизированной системы поиска патентов-аналогов в патентном массиве.
Ключевые слова: патент, база данных, поиск, патент-аналог, Hadoop, Solr, Django, Python, Haystack, HDFS
Представлена методика проектирования новых информационных систем с указанием перечня процедур, позволяющая создавать новые нетривиальные проекты, на примере программного продукта психосемантического анализа аудио данных. Описано, что на основе имеющейся потребности, в условиях наличия прототипа, эти технологии позволяют сформулировать требования к функциональной структуре будущей системы, определить ее принципы действия и представить варианты технического решения.
Ключевые слова: концептуальное проектирование, интеллектуальные технологии, информационные технологии, цифровая обработка сигналов.
Ключевые слова:
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)