Опыт создания персональной поисковой библиографической системы, ориентированной на конкретную область научных или инженерных знаний


DOI: 10.34759/trd-2020-114-16

Авторы

Филимонов И. А.

Московский авиационный институт (национальный исследовательский университет), Волоколамское шоссе, 4, Москва, A-80, ГСП-3, 125993, Россия

e-mail: lja199@bk.ru; ilafilimonov@mai.education

Аннотация

В статье рассмотрен опыт создания и примеры применения персональной поисковой библиографической системы, работающей на основе банка научных публикаций AI Corpus, созданного в Институте искусственного интеллекта Пола Аллена. Получена система, дополняющая такие поисковики, как Google, и, благодаря использованию открытых компонентов, может служить платформой для развития поисковых и справочно-аналитических функций более высокого уровня. Предложен подход, позволяющий производить поиск информации в два этапа, на первом этапе – путём выборки из глобального хранилища, а затем, на втором этапе – путём проведения поиска внутри этой выборки с тонким учётом специальных интересов владельца системы. Объектом исследований являются системы информационного и аналитического обслуживания в области программной инженерии. Реализованная система может также использоваться для поиска, отбора и анализа документов в области аэрокосмической техники.

Ключевые слова:

поисковая система, банк ресурсов, двухэтапный поиск, банк научных публикаций, интерфейс пользователя

Библиографический список

  1. Коробейников П.А., Шишаев М.Г. Исследование семантической структуры навигационных интерфейсов типовых веб-ресурсов // Труды Кольского научного центра РАН. 2013. № 5 (18). С. 98 – 102.

  2. Беляев Д.В. Ассоциативная модель смысловых контекстов и ее применение в задаче уточнения поисковых запросов // Труды МАИ. 2005. № 18. URL: http://trudymai.ru/published.php?ID=34186

  3. Шишаев М.Г., Ломов П.А., Диковицкий В.В. Формализация задачи построения когнитивных пользовательских интерфейсов мультипредметных информационных ресурсов // Труды Кольского научного центра РАН. 2013. № 5 (18). С. 90 – 97.

  4. Диковицкий В.В. Методы интеллектуальной обработки и представления информации в мультипредметных информационных системах промышленных предприятий // Труды СПИИРАН. 2015. № 5 (42). С. 56 – 76.

  5. Диковицкий, В.В. и др. Современные методы создания мультипредметных вебресурсов на базе визуализации и обработки формализованной семантики // Вестник Кольского научного центра РАН. 2011. № 3 (6). С. 63 – 73.

  6. Гагарин А.П., Сердюков. В.В. Сбор и анализ научно-технической информации на основе динамической онтологии // Современные информационные технологии и ИТ-образование. 2018. Т. 14. № 3. С. 644 – 651.

  7. Сизиков Е.В., Сошников Д.В. Онтологическая поисковая система Jewel для реализации интеллектуального поиска в Интернет- и интранет-сетях // Труды МАИ. 2002. № 7. URL: http://trudymai.ru/published.php?ID=34628

  8. Набатов А.Н., Веденяпин И.Э., Мухтаров А.Р. Применение онтологического подхода к процессу проектирования информационной системы // Труды МАИ. 2018. № 102. URL: http://trudymai.ru/published.php?ID=99177

  9. Реакт П., Люк К. NDJSON. Newline-разделители в формате JSON. Стандарт для ограничивающей JSON в протоколах потока, 2018. URL: https://clue.engineering/2018/introducing-reactphp-ndjson

  10. Crockford D. The application/json Media Type for JavaScript Object Notation (JSON) // Internet Engineering Task Force, 2006. DOI:10.17487/RFC4627

  11. Open Research Corpus. SemanticScholar, 2019. URL: http://s2-public-api-prod.us-west-2.elasticbeanstalk.com/corpus

  12. Mandalka M. Open Semantic Search: Free Software for Search Engine, Explorer for Discovery of large document collections, Media Monitoring, Text Analytics, Document Analysis & Text Mining platform, 2018. URL: https://www.opensemanticsearch.org

  13. Chris Mattmann, Jukka Zitting. Tika in action, Manning Publications, 2011, 256 p.

  14. Парамошкин Д.С., Шибанов С.В., Хмелевской Б.Г. Анализ применения метаданных в электронных библиотеках информационных ресурсов // Труды Международного симпозиума «Надежность и качество». 2009. Т. 1. С. 211 – 214.

  15. Sidorov G. Syntactic Dependency Based N-grams in Rule Based Automatic English as Second Language Grammar Correction // International Journal of Computational Linguistics and Applications, 2013, vol. 4, no. 2, pp. 169 – 188.

  16. Мкртчян Г.А., Вечеринина Е.А., Добряшкина Е.Н., Чепракова Л.А. Лингвистическая теория: минимум базовых знаний для студентов технических вузов, изучающих иностранный язык // Труды МАИ. 2007. № 27. URL: http://trudymai.ru/published.php?ID=34001

  17. Freed N., Borenstein N. Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. RFC2046, Innosoft, First Virtual Holdings, November 1996, URL: http://tools.ietf.org/html/rfc2046

  18. Resnick P., Walker A. The text/enriched MIME Content-type. RFC-1896, February, 1996. URL: https://tools.ietf.org/html/rfc1896.html

  19. Kilgarriff A. Putting Frequencies in the Dictionary // International Journal of Lexicography, 1997, no. 10 (2), pp. 135 – 155. DOI: 10.1093/ijl/10.2.135

  20. Фролов А.С. Разработка алгоритма нечеткого поиска на основе хэширования // Молодой ученый. 2016. № 13 (117). С. 357 – 360.


Скачать статью

mai.ru — информационный портал Московского авиационного института

© МАИ, 2000—2020

Вход