Перейти к содержанию

Управление моделью машинного обучения

По умолчанию CodeScoring использует собственную модель машинного обучения чтобы снизить количество ложных срабатываний при поиске секретов. С помощью ручной разметки найденных секретов можно дообучить модель и улучшить результаты поиска на собственном исходном коде.

Для того, чтобы дообучить модель, необходимо перейти в раздел Settings -> Workmode и нажать на кнопку Run now в секции Secrets ML model management. Для активации возможности дообучения модели необходимо разметить минимум 1000 найденных секретов как истинно-положительные или ложно-положительные.

После дообучения можно сравнить результаты поиска секретов и на их основе либо принять пользовательскую модель (Accept training), либо вернуться к базовой модели (Purge user model).

Machine learning model

В секции управления пользователю выводится информация о текущем состоянии модели:

  • Current ML Model Type – тип использованной модели (базовая или пользовательская);
  • Base model accuracy – точность поиска на основе размеченных находок. Истинно-положительные находки берутся за единицу, ложно-положительные — за ноль. Итоговая точность – это среднее значение всех результатов, представленное в процентах.
  • User model accuracy – точность поиска с использованием пользовательской модели;
  • Latest training model accuracy – точность поиска с использованием последнего дообучения;
  • Is training possible – возможность дообучения модели на основе текущей разметки;
  • TP/FP/Total count – истинно-положительные, ложно-положительные и все находки.

Важно: если дообучение модели невозможно – это значит, что разметка недостаточно полная. В таком случае необходимо обозначить большее количество находок как истинно-положительных или ложно-положительных.