СТАТИСТИЧЕСКИЙ МЕТОД ВЫДЕЛЕНИЯ ВРЕМЕННЫХ ПАТТЕРНОВ ИЗ ЕСТЕСТВЕННЫХ ЯЗЫКОВ
КАЛИМОЛДАЕВ МАКСАТ НУРАДИЛОВИЧ, ПАК АЛЕКСАНДР АЛЕКСАНДРОВИЧ,
НАРЫНОВ СЕРГАЗЫ САКЕНОВИЧ
АННОТАЦИЯ
Рассматривается алгоритм рекурсивной самоорганизующейся карты (Recursive Self Organizing Map, RSOM) для выделения статистически значимых временных паттернов из символьного потока контекстно-зависимых грамматик. Главной идеей метода является, предложенное Thomas Voegtlin в 2002, объединение классического алгоритма Teuvo Kohonen и неявного представления времени в виде комбинации текущего входа и контекстного отклика сети. В статье приведены результаты экспериментов над текстами на казахском и английском языках.