Самое важное в этом журнале

Блог посвящен новостям и материалам на тему онтологического моделирования, Semantic Web и Linked Data, а также их применению в создании автоматизированных систем. Встречаются также материалы с личными мнениями по самым разным вопросам. Посты на личные темы перенесены отсюда на страницу в Facebook.

Читателю, пришедему сюда за онтологиями, прежде всего рекомендую краткий свод основных трудов компании ТриниДата:+ Одна повесть про жизнь и ИТ

Экономический парадокс

Если этот журнал читают люди, разбирающиеся в экономике, подскажите мне)
Есть компания, которая выполняет проекты и несколько лет показывала операционную прибыль. Затем потребовалось увеличить инвестиции в развитие - создание новых продуктов и маркетинг. Благодаря накопленным запасам удалось это сделать за счет собственных средств, без кредитов. Но поскольку на периоде в год-полтора расходы стали превышать доходы, это "испортило" баланс: тут же появились "негативные факторы" в разных приложениях по расчету рейтинга контрагентов, банки стали отказывать в кредитах на покрытие кассовых разрывов, которые неизбежно возникают, если клиенты расплачиваются за длинные проекты раз в год (пока баланс был в плюсе, с этим проблем не было).
В чем тут управленческая ошибка (или институциональная проблема нашего рынка)? Не инвестировать - нельзя, потеряешь перспективы и конкуренты обгонят. Занимать много, пока баланс в плюсе, и затем инвестировать только заемные средства - дорого и кажется бессмысленным, если есть свои.
Чую здесь какой-то логический подвох, но не могу понять, как надо действовать. Банки кредитуют только компании с постоянной операционной прибылью, положительным балансом - но таким компаниям не нужны кредиты, если они не инвестируют в развитие, а просто "стригут купон". Если же они инвестируют, то неизбежно ухудшат свой баланс и попадут в категорию "ненадежных". Инвестировать понемногу так, чтобы держать баланс без убытка, около нуля - вроде бы можно, но быстрого развития не получится, можно не угнаться за рынком.

Публикации и конференции - 2021

Начинается деловой сезон, по этому случаю пишу список наших недавних и предстоящих публикаций и конференций по двум основным темам.
1. Natural Language Understanding
- Свежая научная статья по этой теме должна выйти осенью, пока можно посмотреть публикацию "Онтологии: от текста к фактам" https://www.osp.ru/os/2020/04/13055699.
За год мы сильно продвинулись в этой теме, ближайший повод узнать подробности - наш доклад:
- Конференция Digital Oil&Gas https://smartgopro.com/digitalgasoil/, 23 сентября, онлайн, участие бесплатное. Тема доклада - "Технологии понимания естественного языка для нормализации справочников, поиска аналогов, создания диалоговых систем".
2. Дата-центричная архитектура
- Статья "Дата-центричная архитектура: «волшебная пуля» от интеграционных проблем" https://habr.com/ru/post/563132/
- Статья "Как снизить зависимость кода от структуры данных?" https://habr.com/ru/post/576304/
- Пре-принт статьи с описанием архитектуры нашей платформы "Ontology-based industrial data management platform" https://arxiv.org/abs/2103.05538
- ТНФ-2021, Тюменский нефтегазовый форум https://oilgasforum.ru/program/, 14 сентября, доклад "Дата-центричная архитектура как инструмент повышения качества аналитических данных" в онлайн-сессии "Цифровые технологии для повышения качества управления информацией на всех этапах жизненного цикла месторождения".
- Конференция "Управление данными 2021" https://www.osp.ru/lp/dm2021, 23 сентября, Москва (оффлайн). Доклад "Дата-центричная архитектура – реальная основа цифровизации" будем делать совместно с представителем одного из наших заказчиков, компании "Газпром недра".
- Наше мнение по поводу построения интегрированных систем экологического мониторинга в статье https://expert.ru/ural/2021/38/stsenarii-chto-yesli-vynosyat-v-virtualniy-mir/?fbclid=IwAR3fJIEgQSuxFtGl5GXSQdi88psWa_78tDy7IzwZz08iRrjMQ4NImDL44rA

Уберите модель данных из кода!

Сегодня был на конференции DUMP-2021. В основном присутствовал на секции DevOps, т.к. программа более интересной мне секции Back-end была на удивление слабой. На два доклада по Back-end, однако, я зашел - и был поражен вещам, которыми люди не только занимаются до сих пор, но и считают возможным об этом публично рассказывать.

Один доклад был посвящен "чистой архитектуре" - паттерну проектирования, который "углубляет и расширяет" самые кондовые идеи ООП и MVC, намертво зашивая в код структуру данных и бизнес-логику. Люди используют это в энтерпрайзе. Единственное объяснение, которое я могу найти этим практикам как минимум 30-летней идейной давности, состоит в том, чтобы брать с заказчика побольше денег за постоянную доработку кода, которая необходима при любом изменении в "автоматизируемых" такими средствами процессах.

Другой доклад был посвящен переносу одного известного публичного сервиса на GraphQL. Докладчики начали с похвального тезиса о том, что на каком-то этапе развития сервиса они столкнулись с необходимостью описать его модель данных, чтобы разные компоненты могли общаться между собой в ее терминах. В качестве решения они выбрали GraphQL, что само по себе неплохо. Но основное содержание доклада совсем не впечатлило: время, затраченное на разработку, не коррелирует со скромностью достигнутых результатов, а проблемы, которые решали докладчики, были, скажем так, простоваты.

Collapse )

Сбор данных для цифровых двойников

Могут ли онтологии использоваться при создании цифровых двойников? Конечно, могут! Короткий рассказ об этом с практическим примером смотрите в нашей презентации.
Под цифровым двойником в промышленности обычно понимается физическая/математическая модель какого-либо объекта, с помощью которой решаются задачи мониторинга, управления, оценки состояния, планирования ремонтов и др. Для того чтобы такую модель можно было использовать в поддержке принятия решений, она должна описывать моделируемый объект с разных точек зрения, быть расширяемой, содержать логику имитации работы объекта, а также использоваться для структурирования данных о нем. Из перечисления требований очевидно, что онтологическое моделирование - отличный кандидат на роль средства создания модели. А если учесть, что данных об объекте генерируется огромное количество, становится понятной и необходимость использования платформы виртуализации данных.

Представляем Систему сбора отчетности "Пульс дела"

25 февраля на конференции "Качество данных-2021" мы представили наш новый продукт - Систему сбора отчетности "Пульс дела". В презентации к нашему докладу можно прочитать об архитектуре и преимуществах системы, понять принцип ее работы.
А самый быстрый способ познакомиться с системой "Пульс дела" - посмотреть посвященный ей видеоролик:

АрхиГраф becomes ArchiGraph

Мы запустили международный сайт платформы АрхиГраф: https://archigraph.pro
На сайте доступна документация на наши продукты на английском языке, английская версия брошюры "Корпоративные автоматизированные системы на основе онтологических моделей: книга рецептов", а также демо-версия платформы.

Изменение информационной политики

Пришла пора поменять информационную политику. С 2009 года я вел этот ЖЖ, в котором писал посты в основном на профессиональные темы с небольшим добавлением "общечеловечки". Когда ЖЖ перестал работать как соцсеть - меня это не смутило, поскольку все публикации в блоге открыты, и мне важно только чтобы они индексировались и находились поисковиками.

Потом появилась корпоративная страница на FB https://www.facebook.com/trinidata. На ней мы постим новости и пресс-релизы от имени компании ТриниДата. ЖЖ в последние годы использовался в основном для кросс-постинга того же контента.

Однако иногда хочется написать что-то на общие темы. Такому контенту, похоже, место на личной странице в FB, а не в ЖЖ, где он выбивается из общей логики. Из постов за последний год - это "Вернисаж над диваном" https://serge-gorshkov.livejournal.com/53541.html, "Есть чё хорошее?" https://serge-gorshkov.livejournal.com/52846.html и "Не ходите, дети, в программисты" https://serge-gorshkov.livejournal.com/53177.html. Плюс ссылка на повесть про личную жизнь ИТшников и звериный оскал капитализма в заглавном посте. Не так много, но, может, это как раз из-за того, что площадка не подходящая. Попробую развести информационные потоки: на общие темы писать на личную страницу https://www.facebook.com/GorshkovSerge/, а в здесь оставить только профессиональный контент (с кросс-постингом на страницу компании в FB).

Извлечение фактов из текста на естественном языке

Опубликована наша статья "От текста к фактам", в которой мы рассказываем о методах преобразования текста на естественном языке в набор фактов или SPARQL-запрос. Такие задачи возникают и при создании чат-ботов, и при разработке корпоративных систем управления знаниями, и при реализации систем автоматической обработки поступающей текстовой информации.

Традиционно большие надежды по части решения таких задач возлагаются на разные варианты алгоритмов машинного обучения, однако мы считаем, что только сочетание опоры на онтологии вместе с использованием ML способно качественно улучшить результаты по сравнению с уже достигнутыми. Какой бы совершенной не была нейросеть, она "не понимает" смысла текста, а лишь выдает в ответ на текст нечто созвучное тем словам, которые получила.

Онтологии представляют в машинно-читаемой форме концептуальный слой нашего мышления, поэтому диалоговая система, "вооруженная" ими, способна делать логические выводы и точно "понимать" смысл сказанного. Для пользователя это проявляется прежде всего в качестве ответов, которые он получает от диалоговой или поисковой системы.

Важно, что в нашей разработке онтологии используются для представления не только концептуального, но и лексического уровня текста. С помощью онтологий LEMON / Ontolex мы описываем смысловые поля, что позволяет учитывать различия смысла одних и тех же слов в разных контекстах (например, лист стали, листы документа или лист дерева).

12 ноября будем делать доклад на эту тему на форуме "Управление данными - 2020"

Новая брошюра об использовании онтологий при создании ПО

Мы опубликовали брошюру "Корпоративные автоматизированные системы на основе онтологических моделей: книга рецептов". В ней мы постарались дать целостный взгляд на использование онтологий при создании ПО, а также поделились конкретными рецептами и техническими подробностями использования платформы АрхиГраф.