Сергей Горшков (serge_gorshkov) wrote,
Сергей Горшков
serge_gorshkov

Categories:

Извлечение фактов из текста на естественном языке

Опубликована наша статья "От текста к фактам", в которой мы рассказываем о методах преобразования текста на естественном языке в набор фактов или SPARQL-запрос. Такие задачи возникают и при создании чат-ботов, и при разработке корпоративных систем управления знаниями, и при реализации систем автоматической обработки поступающей текстовой информации.

Традиционно большие надежды по части решения таких задач возлагаются на разные варианты алгоритмов машинного обучения, однако мы считаем, что только сочетание опоры на онтологии вместе с использованием ML способно качественно улучшить результаты по сравнению с уже достигнутыми. Какой бы совершенной не была нейросеть, она "не понимает" смысла текста, а лишь выдает в ответ на текст нечто созвучное тем словам, которые получила.

Онтологии представляют в машинно-читаемой форме концептуальный слой нашего мышления, поэтому диалоговая система, "вооруженная" ими, способна делать логические выводы и точно "понимать" смысл сказанного. Для пользователя это проявляется прежде всего в качестве ответов, которые он получает от диалоговой или поисковой системы.

Важно, что в нашей разработке онтологии используются для представления не только концептуального, но и лексического уровня текста. С помощью онтологий LEMON / Ontolex мы описываем смысловые поля, что позволяет учитывать различия смысла одних и тех же слов в разных контекстах (например, лист стали, листы документа или лист дерева).

12 ноября будем делать доклад на эту тему на форуме "Управление данными - 2020"
Tags: семантические технологии
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments