×

Вы используете устаревший браузер Internet Explorer. Некоторые функции сайта им не поддерживаются.

Рекомендуем установить один из следующих браузеров: Firefox, Opera или Chrome.

Контактная информация

+7-863-218-40-00 доб.200-80
ivdon3@bk.ru

  • Анализ глубоких нейронных сетей для обнаружения человека на земле с высоты полета квадрокоптера

    • Аннотация
    • pdf

    В современном мире, когда технологии развиваются с невероятной скоростью, компьютеры обрели способность «видеть» и воспринимать окружающий мир подобно человеку. Это привело к революции в анализе и обработке визуальных данных. Одним из ключевых достижений стало применение компьютерного зрения для поиска объектов на фотографиях и видео. Благодаря этим технологиям можно не только находить такие объекты как люди, автомобили или животные, но и точно указывать их положение с помощью ограничивающих рамок или масок для сегментации. В данной статье подробно рассматриваются современные модели глубоких нейронных сетей, применяемые для детекции человека на изображениях и видео, снятых с высоты и большого расстояния на сложном фоне. Анализируются архитектуры Faster Region-based Convolutional Neural Network (Faster R-CNN), Mask Region-based Convolutional Neural Network (Mask R-CNN), Single Shot Detector (SSD) и You Only Look Once (YOLO), сравниваются их точность, скорость и способность эффективно выявлять объекты в условиях неоднородного фона. Особое внимание уделено изучению особенностей каждой модели в конкретных практических ситуациях, где важны и высокое качество обнаружения целевых объектов, и скорость обработки изображений.

    Ключевые слова: машинное обучение, искусственный интеллект, глубокое обучение, сверточные нейронные сети, детекция человека, компьютерное зрение, обнаружение объектов, обработка изображений

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Комбинированный метод реферирования русскоязычных текстов

    • Аннотация
    • pdf

    Статья посвящена разработке комбинированного метода реферирования русскоязычных текстов, объединяющего экстрактивные и абстрактивные подходы для преодоления ограничений существующих методов. Предлагаемому методу предшествуют этапы: предобработка текста, комплексный лингвистический анализ с использованием RuBERT, кластеризация на основе семантической близости. Метод включает экстрактивное реферирование через алгоритм TextRank и абстрактивную доработку с помощью нейросетевой модели RuT5. Эксперименты на новостном корпусе Газета.Ру подтвердили преимущество метода по точности, полноте, F-мере и метрикам ROUGE. Результаты показали превосходство комбинированного подхода над чисто экстрактивными методами, такими как TF-IDF и статистический, и абстрактивными методами, такими как RuT5 и mBART.

    Ключевые слова: комбинированный метод, реферирование, русскоязычные тексты, TextRank, RuT5

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Стохастическое моделирование работы системы автоматической обработки информации

    • Аннотация
    • pdf

    В работе рассмотрена стохастическая модель работы веб-сервера Apache HTTP Server, описываемая системой Колмогорова распределения вероятностей состояний, в предположении, что поток заявок пуассоновский, в том числе простейший. Предложена схема решения системы дифференциальных уравнений большой размерности с мало меняющимися начальными данными, проведено сравнение параметров представленной модели с параметрами имитационной модели работы веб-сервера. Для сравнения имитационной и стохастической моделей между собой использован тестовый сервер с генераций запросов и имитацией их обработки с использованием статистики программой Apache JMeter, на основании которого оценены значения параметров интенсивностей потоков входящих и обработанных заявок. Представленная модель не противоречит имитационной, позволяет оценить состояния системы при различных режимах работы и рассчитать загруженности веб-сервера при большом потоке данных.

    Ключевые слова: стохастическое моделирование, имитационная модель, уравнения Колмогорова, метод прогонки, система массового обслуживания, характеристики эффективности, тестовый сервер, поток заявок, каналы обслуживания, очередь

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Оценки интегральных изменений рельефа дна для участка Нижней Волги на основе гидродинамического моделирования

    • Аннотация
    • pdf

    В работе рассматривается влияние крупности частиц на динамику взвешенных наносов в речном русле. Используется вычислительный комплекс EcoGIS-Simulation для моделирования совместной динамики поверхностных вод и наносов в модели реки Волга ниже плотины Волжской ГЭС. Важнейшим фактором изменчивости русла являются весенние попуски воды из Волгоградского водохранилища, когда расход воды увеличивается в пять раз. Вычислены некоторые интегральные и локальные характеристики речного русла в зависимости от коэффициент крупности частиц.

    Ключевые слова: взвешенные наносы, размер частиц грунта, динамика наносов, диффузия, донные отложения, морфология русла, рельеф, скорость гравитационного оседания частиц, EcoGIS-Simulation, формула Векслера, расход воды

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Формирование частотного представления одномерного сигнала, инвариантного направлению обработки, на основе дискретного косинусного преобразования

    • Аннотация
    • pdf

    В статье исследуется влияние направления обработки данных на результаты дискретного косинусного преобразования (ДКП). На основе теории групп рассматриваются симметрии базисных функций ДКП, анализируются изменения, возникающие при смене направления обработки сигнала. Показано, что антисимметричные составляющие базиса меняют знак при обратном порядке отсчетов, в то время как симметричные остаются неизменными. Предложены модифицированные выражения для блочного ДКП, учитывающие изменение направления обработки. Экспериментально подтверждена инвариантность частотного состава преобразования к направлению обработки данных. Результаты демонстрируют возможность применения предложенного подхода для анализа сигналов произвольной природы, включая обработку изображений и сжатие данных.

    Ключевые слова: дискретные преобразования, базисные функции, инвариантность, симметрия, направление обработки, матричное представление, корреляция

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Веб-приложение многомерной регрессии на основе метода наименьших квадратов и программной библиотеки конструируемых базисов

    • Аннотация
    • pdf

    Рассмотрены алгоритмы построения базисных функций, методы оптимизации вычислений и механизмы L1/L2 регуляризации, на основе которых разработано веб-приложение для выполнения многомерной регрессии с использованием метода наименьших квадратов и программной библиотеки конструируемых базисов. Разработанное программное обеспечение обеспечивает эффективную аппроксимацию многомерных данных с возможностью визуализации результатов в двухмерной и трехмерной проекциях. Практическая ценность работы заключается в создании программного инструмента, находящегося в открытом доступе сЕти, для анализа и моделирования сложных многомерных зависимостей.

    Ключевые слова: аппроксимация, метод наименьших квадратов, базисные функции, многомерная регрессия, L1/L2- регуляризация, веб-приложение, визуализация данных, многомерный эллиптический параболоид

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Физически-информированная нейронная сеть на трансформерной архитектуре для прогноза временных рядов в инженерных системах

    • Аннотация
    • pdf

    В работе рассматривается задача краткосрочного прогнозирования температуры льда в инженерных системах с высокой чувствительностью к тепловым нагрузкам. Предлагается трансформерная архитектура, дополненная физически-информированной функцией потерь, основанной на уравнении теплового баланса. Такой подход позволяет учесть инерционные свойства объекта и согласовать динамику прогнозируемой температуры с подаваемой мощностью и внешними условиями. Модель протестирована на данных с ледовой арены с минутной частотой измерений. Проведено сравнение с базовыми архитектурами LSTM, GRU, Transformer по метрикам MSE, MAE и MAPE. Результаты демонстрируют существенное улучшение точности в переходных режимах, а также устойчивость предсказаний к резким скачкам температуры, особенно после заливки льда. Предложенный метод может быть интегрирован в контуры интеллектуального управления инженерными объектами, обеспечивая не только высокую точность, но и физическую интерпретируемость модели. Работа подтверждает эффективность интеграции физического знания в нейросетевые прогнозные модели.

    Ключевые слова: краткосрочное прогнозирование, временные ряды, трансформеры, машинное обучение, физически-информированная модель, предиктивное управление

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Классификация и теоретический анализ методов верификации динамики подписи

    • Аннотация
    • pdf

    Данная работа посвящена теоретическому анализу методов, применяемых в задачах верификации динамики подписи, полученной с графического планшета. Проведена классификация трёх фундаментальных подходов к решению данной задачи: сопоставление с эталоном; стохастическое моделирование и дискриминативная классификация. Каждый подход в данной работе рассмотрен на примере конкретного метода: динамическая трансформация временной шкалы; скрытые Марковские модели; метод опорных векторов. Для каждого метода раскрыты теоретические основы, представлен математический аппарат, выявлены основные преимущества и недостатки. Результаты проведённого сравнительного анализа могут быть использованы в качестве необходимой теоретической базы при разработке современных систем верификации динамики подписи.

    Ключевые слова: верификация, биометрическая аутентификация, динамика подписи, графический планшет, классификация методов, сопоставление с эталоном, стохастическое моделирование, дискриминативная классификация, скрытые Марковские модели, динамическая трансформация

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.6 - Методы и системы защиты информации, информационная безопасность

  • О точности полиномиальных моделей погружных электродвигателей в составе АСУТП

    • Аннотация
    • pdf

    Характеристики погружного асинхронного электродвигателя, с достаточной для практики достоверностью, описываются теорией многодвигательного электропривода. В этом случае классическая схема замещения погружного асинхронного электродвигателя представляет собой связанную систему из нескольких Т-образных схем замещения. В свою очередь это значительно увеличивает ее вычислительную сложность и снижает быстродействие АСУТП. Предлагается с помощью методов планирования эксперимента построить математическую модель погружного электродвигателя в виде полиномов с существенно большим быстродействием. В области применимости, расхождения в оценке энергетических показателей не превышают 1,1%, между предложенными моделями и классическими Т-образными схемами замещения.

    Ключевые слова: автоматизированная система управления, математическая модель, полином, средняя абсолютная процентная ошибка, вычислительная сложность, методы планирования эксперимента, диаграмма рассеяния, модальный интервал, погружной электродвигатель, пакет ротора

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.3 - Автоматизация и управление технологическими процессами и производствами

  • Применение современных языковых моделей для автоматической транскрибации и анализа аудиозаписей телефонных разговоров сотрудников отдела продаж с клиентами

    • Аннотация
    • pdf

    Статья посвящена изучению возможностей автоматической транскрибации и анализа аудиозаписей телефонных разговоров сотрудников отдела продаж с клиентами. Актуальность исследования связана с ростом объема голосовых данных и потребностью в их быстрой обработке в организациях, деятельность которых тесно связана с продажей своих продуктов или услуг клиентам. Автоматическая обработка аудиозаписей позволит провести проверку качества работы сотрудников call-центров, определяя допущенные нарушения в скриптах разговоров с клиентами. Предложенное программное решение основано на использовании модели Whisper для распознавания речи, библиотеки pyannote.audio для диаризации спикеров, а также библиотеки RapidFuzz для организации нечёткого поиска при проведении анализа строк. В ходе экспериментального исследования, проведенного на базе разработанного программного решения, было подтверждено, что использование современных языковых моделей и алгоритмов позволяет добиться высокой степени автоматизации обработки аудиозаписей и может использоваться в качестве инструмента предварительного контроля без участия специалиста. Полученные результаты подтверждают практическую применимость используемого авторами подхода для решения задач контроля качества в отделах продаж или call-центрах.

    Ключевые слова: call-центр, аудиофайл, распознавание речи, транскрибация, диаризация спикеров, классификация реплик, обработка аудиозаписей, Whisper, pyannote.audio, RapidFuzz

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Моделирование работы научно-исследовательской организации на основе теории массового обслуживания

    • Аннотация
    • pdf

    В статье представлена математическая модель, формализующая процесс управления научной деятельностью организации. В основе модели лежат инструменты теории массового обслуживания. При построении используется принцип гибели - размножения. Для частного случая приводится граф состояний и соответствующая система дифференциальных уравнений Колмогорова. Интенсивность входного и выходного потоков рассматриваются как нестационарные потоки, зависящие от времени. Модель позволяет рассматривать различные структуры и схемы взаимодействия научных подразделений и различные сценарии постановки научных задач и интенсивности их решения работниками организации. Для построенной модели разработан программный комплекс по принятию решения для оптимального управления научной деятельностью подразделения. В статье представлен один из результатов экспериментального и модельного исследования влияния мотивационной составляющей и уровня компетентности сотрудников.

    Ключевые слова: научная деятельность, математическая модель, система массового обслуживания, принцип гибели-размножения, граф состояний, система дифференциальных уравнений

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.4 - Управление в организационных системах

  • Расчет коэффициента неоднородности смеси при смешении сыпучих сред, частицы которых имеют различные размеры и форму

    • Аннотация
    • pdf

    В статье рассматривается строение и принцип действия усовершенствованного агрегата для смешения сыпучих материалов, имеющего возможность управления режимами смешения. Приведена расчетная схема процесса формирования разреженного потока. Выведено выражение для расчета коэффициента неоднородности при смешении сыпучих сред, имеющих различные размеры, форму и другие параметры Исследование, проведённое в статье, позволяет не только прогнозировать качество получаемой смеси, но и выявлять факторы, оказывающие наибольшее влияние на достижение требуемой однородности.

    Ключевые слова: агрегат, сыпучие среды, смешение, коэффициент неоднородности, концентрация, расчетная схема, размер частицы

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Обучение с подкреплением в адаптивном управлении параметрами генетического алгоритма

    • Аннотация
    • pdf

    В статье представлен новый подход адаптивного управления параметрами генетического алгоритма, основанный на методах обучения с подкреплением. Использование алгоритма Q-обучения позволяет динамически изменять вероятности мутации и кроссовера в зависимости от текущего состояния популяции и прогресса эволюционного процесса. Экспериментально показано, что данный подход обеспечивает более эффективное решение задач оптимизации по сравнению с классическим генетическим алгоритмом и предыдущими подходами с использованием искусственных нейронных сетей. Проведены тестирования на функциях Растригина и Шаффера, подтверждающие преимущества нового метода в задачах с большим числом локальных экстремумов и высокой размерностью.

    Ключевые слова: генетический алгоритм, обучение с подкреплением, адаптивное управление, Q-обучение, глобальная оптимизация, функция Растригина, функция Шаффера

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Разработка программного модуля для автоматической генерации кода на основе UML-диаграмм

    • Аннотация
    • pdf

    В статье рассматривается разработанный авторами программный модуль, предназначенный для автоматической генерации программного кода на основе UML-диаграмм. Актуальность разработки данного модуля обусловлена ограничениями существующих зарубежных инструментов кодогенерации, связанными с функциональностью, удобством использования, поддержкой современных технологий, а также с их недоступностью на территории России. Модуль анализирует JSON-файлы, полученные экспортированием из онлайн-сервиса draw.io UML-диаграмм и преобразует их в код на выбранном языке программирования (Python, C++, Java) или в DDL-скрипты для СУБД (PostgreSQL, Oracle, MySQL). В качестве основных инструментов разработки были использованы язык Python и шаблонизатор Jinja2. Работа программного модуля продемонстрирована на примере небольшого проекта «Система управления библиотекой». В ходе исследования была проведена серия тестов по автоматической генерации кодов на основе типовых архитектур программно-информационных систем. Результаты тестов показали, что сгенерированный с помощью разработанного модуля код полностью соответствует исходным UML-диаграммам, включая структуру классов, связи между ними, а также конфигурацию базы данных и инфраструктуры (Docker Compose). Практическая значимость исследования заключается в том, что предложенная концепция генерации программного кода на основе визуальных моделей UML-диаграмм, построенных в популярном онлайн-редакторе draw.io, значительно облегчает разработку программно-информационных систем, и может быть использована в учебных целях.

    Ключевые слова: генерация кода, автоматизация, python, jinja2, uml-диаграмма, json, шаблонизатор, парсинг, диаграмма классов, база данных, диаграмма развертывания

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Когнитивное моделирование сценариев геополитических процессов

    • Аннотация
    • pdf

    В статье рассматриваются возможности анализа геополитических процессов в рамках методологии ситуационного анализа, использующей когнитивное моделирование. Дается общее описание ситуационного анализа, процесса построения сценариев развития событий, в котором выделяются два этапа: этап подготовительный (предсценарный), необходим для выполнения описательной и объяснительной функций прогнозных исследований и этап сценарный, предназначенный для содержательного и формального исследования, а также описания прогнозируемых процессов, построения моделей системы и подготовки всей необходимой информации для синтеза сценариев. Далее предлагается метод применения ситуационного анализа в рамках инструментария когнитивного моделирования варианта «сценария будущего» и его анализ с учетом всех вновь открывающихся «главных» факторов, отношений, обратных связей и динамики их изменений. При формировании сценария развития конкретной геополитической ситуации в рамках когнитивного моделирования этот метод может быть представлен наличием каузальной (функциональной) и логико-смысловой связи элементов или агентов действий и контрдействий. Интерпретируя логико-смысловое как структурное, а каузальное – как динамическое, получаем возможность структурно-динамического системного описания геополитической конфронтации с помощью языка когнитивных графов, т.е. показа графического выражения каузальных отношений между понятиями (факторами), характеризующими тот или иной геополитический процесс. При этом в рамках сценарного этапа выполняются следующие процедуры: анализ исходной геополитической ситуации, а именно, определение существенных факторов, составляющих схему внутренних связей и внешних взаимоотношений, их структурирование; определение структуры влияющих факторов; определение направлений и силы воздействия факторов (позитивное и негативное влияние); выбор базовых стереотипов или обобщенных моделей взаимодействий, отвечающих исходной ситуации; построение когнитивных моделей фактического состояния ситуации; определение тенденций развития ситуации, анализ динамики; перенос сценария на практическую основу.

    Ключевые слова: геополитические процессы, ситуационный анализ, когнитивное моделирование, методика построение прогнозных сценариев

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Выделение сегментов клиентов для эффективных маркетинговых коммуникаций на базе применения uplift моделирования

    • Аннотация
    • pdf

    Традиционные маркетинговые методы продвижения товаров и услуг ориентируются на широкую аудиторию и не учитывают индивидуальные характеристики потребителей, что может привести к небольшому проценту положительных откликов и даже к отрицательным откликам (потере клиентов). Широкий охват аудитории приводит к увеличению стоимости маркетинговых взаимодействий и не гарантирует достижение целей маркетинговых кампаний. В такой ситуации ставится задача минимизации избыточных расходов за счет более рациональной организации маркетингового взаимодействия, направленной на получение максимальной прибыли от каждого целевого клиента. Для реализации подобной стратегии необходимы инструменты, способные выделить сегменты клиентов, маркетинговое взаимодействие с которыми приведет к положительному отклику. Одной из технологий построения таких инструментов является uplift-моделирование, которое является разделом машинного обучения и считается перспективным направлением в data-driven маркетинге. В рамках данной статьи на базе открытых данных X5 RetailHero Uplift Modeling Dataset, предоставленных компанией X5 Retail Group, проводится сравнительный анализ эффективности различных подходов uplift-моделирования для выделения сегмента клиентов, которые наиболее подвержены целевому воздействию. Для проведения сравнительного анализа используются различные uplift-метрики и визуальные технологии.

    Ключевые слова: эффективные маркетинговые коммуникации с клиентами, сегментирование клиентов, методы машинного обучения, uplift моделирование, uplift метрики качества

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Алгоритм формирования стратегии автоматического обновления моделей искусственного интеллекта в задачах прогнозирования в электроэнергетике

    • Аннотация
    • pdf

    Изменение внешних условий, параметров функционирования объектов, взаимосвязей между элементами системы и связей системы с надсистемой приводит к снижению точности результатов моделей искусственного интеллекта, которое называется деградацией моделей. Снижение риска деградации моделей актуально для задач электроэнергетики, особенностью которых является многофакторные зависимости в сложных технических системах и влияние метеорологических параметров. Автоматическое обновление моделей с течением времени является необходимым условием формирования доверия пользователей к интеллектуальным системам прогнозирования. В данной статье представлена классификация видов дрейфа данных. Формализованы варианты решений, которые разработчикам необходимо принять при создании интеллектуальных систем для определения стратегии обновления прогнозных моделей, включая критерии запуска обновления, выбор моделей, оптимизацию гиперпараметров, выбор способа обновления и формирования наборов данных. Предложен алгоритм формирования стратегии автоматического обновления моделей искусственного интеллекта и даны практические рекомендации для разработчиков моделей в задачах прогнозирования временных рядов в электроэнергетике.

    Ключевые слова: прогнозирование временных рядов, искусственный интеллект, машинное обучение, доверенная система искусственного интеллекта, деградация моделей, дрейф данных, дрейф концепции

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Обзор метрик с целью оценки качества работы генеративных моделей для создания изображений

    • Аннотация
    • pdf

    Статья представляет обзор метрик, используемых для оценки качества изображений, полученных с помощью генеративных моделей. Для них требуются специализированные метрики, позволяющие объективно оценивать качество изображений. Сравнительный анализ показал, что для комплексной оценки качества генерации необходимо сочетание различных метрик. Перцептивные метрики эффективны для оценки качества изображений с точки зрения машинных систем, в то время как метрики, оценивающие структуру и детали, полезны для анализа восприятия человеком. Метрики, основанные на текстовом описании, позволяют оценить соответствие изображений заданным текстам, однако они не могут заменить метрики, направленные на визуальную или структурную оценку. Результаты исследования будут полезны специалистам в области машинного обучения и компьютерного зрения, а также способствуют улучшению алгоритмов генерации и расширению областей применения диффузионных моделей.

    Ключевые слова: глубокое обучение, метрика, генеративная модель, качество изображений, изображение

    1.2.1 - Искусственный интеллект и машинное обучение , 1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Улучшение сжатия данных: инновации и будущие перспективы

    • Аннотация
    • pdf

    Статья посвящена теме применения современных методов генеративного сжатия изображений с использованием вариационных автокодировщиков и нейросетевых архитектур. Особое внимание уделяется анализу существующих подходов к генерации и восстановлению изображений, а также сравнительной оценке качества сжатия с точки зрения визуального восприятия и метрических показателей. Целью исследования является систематизация методов глубокого сжатия изображений и выявление наиболее эффективных решений, основанных на вариационном байесовском подходе. В работе рассмотрены различные архитектуры, в том числе условные автокодировщики и модели с гиперсетями, а также методы оценки качества получаемых данных. В качестве основных методов исследования применялись анализ научной литературы, сравнительный эксперимент над архитектурами генеративных моделей и вычислительная оценка сжатия на основе метрик. Результаты исследования показали, что использование вариационных автокодировщиков в сочетании с рекуррентными и сверточными слоями позволяет добиться высокого качества восстановления изображений при значительном снижении объема данных. Сделан вывод о перспективности использования условных вариационных автокодировщиков в задачах сжатия изображений, особенно при наличии дополнительной информации (например, метаданных). Представленные подходы могут быть полезны для разработки эффективных систем хранения и передачи визуальных данных.

    Ключевые слова: вариационные автокодировщики, генеративные модели, сжатие изображений, глубокое обучение, нейросетевые архитектуры, восстановление данных, условные модели

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Кластеризация данных с использованием несимметричных мер близости

    • Аннотация
    • pdf

    Статья посвящена разработке алгоритмов кластеризации данных с использованием несимметричных мер близости, актуальных в задачах с направленными взаимодействиями. Предложены два алгоритма: пошаговое формирование кластеров и модификация с итеративным уточнением центров. Проведены эксперименты, включая сравнение с методом k-медоидов. Результаты показали, что алгоритм с фиксированными центрами эффективен на малых данных, а алгоритм с пересчётом центров обеспечивает более точную кластеризацию. Выбор алгоритма зависит от требований к скорости и качеству.

    Ключевые слова: кластеризация, несимметричные меры близости, алгоритмы кластеризации, итеративное уточнение, k-медоиды, направленные взаимодействия, адаптивные методы

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Моделирование работы пользователей с многосерверной базой данных

    • Аннотация
    • pdf

    В работе рассмотрено моделирование работы пользователей с многосерверной базой данных, разработанной на основе микросервисной архитектуры. Был проведён анализ предметной области, описаны основные сущности системы, а также реализованы механизмы передачи данных и взаимодействия сервисов с использованием Docker и Apache Kafka. Выявлено, что разработка многосерверной базы данных позволила добиться высокой масштабируемости и отказоустойчивости системы. Реализация механизмов репликации и шардирования обеспечила равномерное распределение нагрузки, а использование брокера сообщений Kafka способствовало эффективному обмену данными между сервисами. Проведённое тестирование подтвердило надёжность системы при высокой нагрузке, а также выявило её сильные стороны и потенциальные улучшения.

    Ключевые слова: моделирование, балансировка нагрузки, Docker, Apache Kafka, микросервисная архитектура, распределённые системы, оптимизация запросов

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Сравнительный анализ разных подходов к оценке параметров регрессионных моделей с помощью метода наименьших модулей на примере моделирования стоимости домов по выборке большого объема

    • Аннотация
    • pdf

    Статья посвящена исследованию проблемы оценки неизвестных параметров линейных регрессий с помощью метода наименьших модулей. Рассмотрено два известных подхода к идентификации регрессионной модели. Первый из них основан на решении задачи линейного программирования, второй, называемый итерационным методом наименьших квадратов, позволяет получить приближенное решение задачи. Для возможности тестирования итеративного метода в пакете Gretl разработана специальная программа. Для проведения вычислительных экспериментов использована выборка о стоимости домов и влияющих на неё факторах, содержащая 20640 наблюдений. В итоге наилучшие результаты были показаны при использовании встроенной в Gretl команды quantreg, реализующей алгоритм Фриша-Ньютона. Второй результат показал итеративный метод, а третий – решенная в пакете LPSolve задача линейного программирования.

    Ключевые слова: регрессионный анализ, метод наименьших модулей, линейное программирование, итеративный метод наименьших квадратов, метод вариационно-взвешенных квадратичных приближений

    1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Анализ алгоритмов машинного обучения, используемых для обработки текстовых документов

    • Аннотация
    • pdf

    Использование машинного обучения при работе с текстовыми документами существенно повышает эффективность работы и расширяет диапазон решаемых задач. В работе приведен анализ основных методов представления данных в цифровой формат и алгоритмов машинного обучения, сделан вывод об оптимальном решении для генеративных и дискриминативных задач.

    Ключевые слова: машинное обучение, обработка естественного языка, модели архитектуры трансформер, градиентный бустинг, большие языковые модели

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Комплексный анализ русскоязычных текстов на основе нейросетевых моделей трансформерного типа

    • Аннотация
    • pdf

    Статья посвящена комплексному анализу русскоязычных текстов с использованием нейросетевых моделей, в основу которых положен двунаправленный кодировщик представлений трансформера (Bidirectional Encoder Representations from Transformers – BERT). В работе применяются специализированные модели для русского языка: RuBERT-tiny, RuBERT-tiny2 и RuBERT-base-cased. Предложенный метод охватывает морфологический, синтаксический и семантический уровни анализа, включая лемматизацию, определение частей речи, морфологических признаков, синтаксических отношений, семантических ролей и связей. Использование моделей семейства BERT позволяет достичь точности выше 98% для лемматизации, 97% для определения частей речи и морфологических признаков, 96% для синтаксического анализа и 94% для семантического анализа. Метод подходит для задач, требующих глубокого понимания текста, и может быть оптимизирован для работы с большими корпусами.

    Ключевые слова: русскоязычные тексты, морфологический анализ, синтаксический анализ, семантический анализ, лемматизация, RuBERT, обработка естественного языка

    1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации

  • Сравнительный анализ современных методов генерации изображений: VAE, GAN и диффузионные модели

    • Аннотация
    • pdf

    Статья представляет собой анализ современных методов генерации изображений: вариационных автоэнкодеров (Variational Autoencoder - VAE), генеративных состязательных сетей (Generative Adversarial Networks - GAN) и диффузионных моделей. Основное внимание уделено сравнительному анализу их производительности, качеству генерации и вычислительным требованиям. Для оценки качества изображений используется метрика расстояние Фреше между распределениями признаков (Fréchet Inception Distance - FID). Диффузионные модели показали наилучшие результаты (FID 20.8), превосходя VAE (FID 59.75) и GAN (FID 38.9), но требуют значительных ресурсов. VAE стабильны, но генерируют размытые изображения. GAN обеспечивают высокое качество, но страдают от нестабильности обучения и коллапса моды. Диффузионные модели, благодаря пошаговому декодированию шума, сочетают детализацию и структурированность, что делает их наиболее перспективными. Также рассмотрены методы генерации из изображения в изображение, применяемые для модификации изображений. Результаты исследования полезны для специалистов в области машинного обучения и компьютерного зрения, способствуя улучшению алгоритмов и расширению областей применения генеративных моделей.

    Ключевые слова: дипфейк, глубокое обучение, искусственный интеллект, GAN, VAE, диффузионная модель

    1.2.1 - Искусственный интеллект и машинное обучение , 1.2.2 - Математическое моделирование, численные методы и комплексы программ