Проект - Автоматизация анализа и классификации информации

Компания занимается анализом заработных плат и других HR-данных для страховых компаний, банков, телекомов и других крупных организаций

Клиент
NDA
Год
2025
Услуги
Внедрение ИИ

Описание

Компания занимается анализом зарплат на основе данных, которые предоставляют различные организации.

Клиенты регулярно передают Excel-файлы, содержащие штатное расписание компании

  • департаменты
  • должности сотрудников
  • данные о зарплатах

Для анализа эти данные необходимо привести к единому классификатору должностей и уровней квалификации.

Далее подготовленную информацию необходимо представить клиентам в виде отчета позволяющего фильтровать данные в множестве разрезов.

Проблематика

  • Файлы штатных расписаний могли содержать несколько тысяч строк (5000+).

  • Классификация выполнялась вручную специалистами, в результате накапливались человеческие ошибки.

  • Классификация и последующая проверка выполнялась несколько недель.

  • Всё это мешало масштабированию компании.

Поставленные задачи

  • Создание системы позволяющей работать множеству пользователей и клиентов с различными ролями (клиент, администратор, менеджер и т.д.).
  • Каждая роль должна иметь личный кабинет с возможностью приглашать(либо запрашивать приглашение) и откликаться или отклонять приглашения.
  • Различные роли имеют различные настройки профиля, а также настраиваемую цветовую палитру.
  • Клиенты должны иметь возможность загружать информацию на анализ, которая автоматически отправляется менеджеру для обработки.
  • Данные обрабатываются с помощью Искусственного Интеллекта и становятся доступны клиенту в виде Отчета.
  • Отчет позволяет клиенту фильтровать данные по множеству параметров а также выгружать нужные разрезы в XLS и PDF

Решения

Разделение ролей пользователей

Выявлены основные роли пользователей (администратор, менеджер, клиент и т.д.) и разработан соответствующий функционал и ограничения для каждой.

Разделение прав доступа по ролям обеспечивает безопасность и конфиденциальность данных.

Применение ИИ для анализа

Для автоматизации анализа и классификации штатных расписаний и должностей был применен ИИ.

Использовалась современная мощная модель для семантического анализа данных и сопоставления с общим классификатором.

Как работает

  • Данные загружается из Excel-файла
  • Очищаются и нормализуются
  • Текстовые элементы названий департаментов и должностей переводятся в векторное представление (embeddings)
  • Выполняется поиск наиболее близких значений в общем классификаторе
  • Для каждого элемента автоматически определяется код области и уровень должности
  • Результат сохраняется в базу данных

Обучение модели

Для получения наилучшего результата проведено обучение модели на исторических реальных данных, разбитых по отраслям предметной области.

Результат

Точность классификации составляет более 90%.

На текущем этапе компания получила:

  • объем ручной работы снизился
  • автоматическая обработка тысяч строк за минуты
  • снижение нагрузки на экспертов
  • меньше ручных ошибок
  • возможность масштабировать деятельность

Технологии

  • Python
  • Laravel
  • React
  • Docker
  • PostgreSQL
  • AI LLM

После внедрения ИИ скорость обработки данных и подготовки отчета сократилась в 4 раза

Олег Иванов
Генеральный директор
Обработка данных
Время обработки данных и подготовки отчета сократилось в 4 раза.

Другие проекты

Автоматизация ввода документов с помощью ИИ

ClоudCоllect - проект коллекторской компания из Дании. Позволяет пользователям автоматизировать работу с просроченной с дебиторской задолженностью

Подробнее

B2B кабинет для производственной компании

SpecInASec - это проект американской производственной компании, работающей в сфере гостиничного бизнеса. Компания занимается производством текстильной продукции с индивидуальной печатью паттернов (рисунков) для декорации помещений.

Подробнее

Оставить заявку

Контакты