По его словам, в рамках проекта предстоит обработать свыше 100 тыс. предложений, охватывающих различные сферы знаний. Ученые отмечают, что работа также включает восстановление специализированной терминологии, которая в научном и техническом употреблении не использовалась около 100 лет. Уже подготовлены словари по математике, физике и химии, что позволяет формировать базу для обучения ИИ разговорной и лексике.