В МГУ создали алгоритм для поиска ключевых слов в рукописях

Проект разработали специалисты факультета вычислительной математики и кибернетики. Новый метод упростит работу с архивными документами. Он поможет искать ключевые слова и фразы в материалах и сортировать найденные фрагменты по степени соответствия запросу. «Авторы предложили новый подход, при котором рукописный текст рассматривается как последовательность отдельных штрихов — базовых элементов письма, формируемых движением пера. Алгоритм включает сегментацию изображения на штрихи, их нормализацию и классификацию с использованием математических описаний формы. Далее выполняется сопоставление последовательностей штрихов, запроса и документа, что позволяет находить совпадения и оценивать их точность», — рассказали ТАСС в МГУ. Авторы подтвердили высокую точность обнаружения элементов во время экспериментов с реальными рукописями.