Опыт создания персональной поисковой библиографической системы, ориентированной на конкретную область научных или инженерных знаний
DOI: 10.34759/trd-2020-114-16
Авторы
e-mail: lja199@bk.ru; ilafilimonov@mai.education
Аннотация
В статье рассмотрен опыт создания и примеры применения персональной поисковой библиографической системы, работающей на основе банка научных публикаций AI Corpus, созданного в Институте искусственного интеллекта Пола Аллена. Получена система, дополняющая такие поисковики, как Google, и, благодаря использованию открытых компонентов, может служить платформой для развития поисковых и справочно-аналитических функций более высокого уровня. Предложен подход, позволяющий производить поиск информации в два этапа, на первом этапе – путём выборки из глобального хранилища, а затем, на втором этапе – путём проведения поиска внутри этой выборки с тонким учётом специальных интересов владельца системы. Объектом исследований являются системы информационного и аналитического обслуживания в области программной инженерии. Реализованная система может также использоваться для поиска, отбора и анализа документов в области аэрокосмической техники.
Ключевые слова:
поисковая система, банк ресурсов, двухэтапный поиск, банк научных публикаций, интерфейс пользователяБиблиографический список
-
Коробейников П.А., Шишаев М.Г. Исследование семантической структуры навигационных интерфейсов типовых веб-ресурсов // Труды Кольского научного центра РАН. 2013. № 5 (18). С. 98 – 102.
-
Беляев Д.В. Ассоциативная модель смысловых контекстов и ее применение в задаче уточнения поисковых запросов // Труды МАИ. 2005. № 18. URL: http://trudymai.ru/published.php?ID=34186
-
Шишаев М.Г., Ломов П.А., Диковицкий В.В. Формализация задачи построения когнитивных пользовательских интерфейсов мультипредметных информационных ресурсов // Труды Кольского научного центра РАН. 2013. № 5 (18). С. 90 – 97.
-
Диковицкий В.В. Методы интеллектуальной обработки и представления информации в мультипредметных информационных системах промышленных предприятий // Труды СПИИРАН. 2015. № 5 (42). С. 56 – 76.
-
Диковицкий, В.В. и др. Современные методы создания мультипредметных вебресурсов на базе визуализации и обработки формализованной семантики // Вестник Кольского научного центра РАН. 2011. № 3 (6). С. 63 – 73.
-
Гагарин А.П., Сердюков. В.В. Сбор и анализ научно-технической информации на основе динамической онтологии // Современные информационные технологии и ИТ-образование. 2018. Т. 14. № 3. С. 644 – 651.
-
Сизиков Е.В., Сошников Д.В. Онтологическая поисковая система Jewel для реализации интеллектуального поиска в Интернет- и интранет-сетях // Труды МАИ. 2002. № 7. URL: http://trudymai.ru/published.php?ID=34628
-
Набатов А.Н., Веденяпин И.Э., Мухтаров А.Р. Применение онтологического подхода к процессу проектирования информационной системы // Труды МАИ. 2018. № 102. URL: http://trudymai.ru/published.php?ID=99177
-
Реакт П., Люк К. NDJSON. Newline-разделители в формате JSON. Стандарт для ограничивающей JSON в протоколах потока, 2018. URL: https://clue.engineering/2018/introducing-reactphp-ndjson
-
Crockford D. The application/json Media Type for JavaScript Object Notation (JSON) // Internet Engineering Task Force, 2006. DOI:10.17487/RFC4627
-
Open Research Corpus. SemanticScholar, 2019. URL: http://s2-public-api-prod.us-west-2.elasticbeanstalk.com/corpus
-
Mandalka M. Open Semantic Search: Free Software for Search Engine, Explorer for Discovery of large document collections, Media Monitoring, Text Analytics, Document Analysis & Text Mining platform, 2018. URL: https://www.opensemanticsearch.org
-
Chris Mattmann, Jukka Zitting. Tika in action, Manning Publications, 2011, 256 p.
-
Парамошкин Д.С., Шибанов С.В., Хмелевской Б.Г. Анализ применения метаданных в электронных библиотеках информационных ресурсов // Труды Международного симпозиума «Надежность и качество». 2009. Т. 1. С. 211 – 214.
-
Sidorov G. Syntactic Dependency Based N-grams in Rule Based Automatic English as Second Language Grammar Correction // International Journal of Computational Linguistics and Applications, 2013, vol. 4, no. 2, pp. 169 – 188.
-
Мкртчян Г.А., Вечеринина Е.А., Добряшкина Е.Н., Чепракова Л.А. Лингвистическая теория: минимум базовых знаний для студентов технических вузов, изучающих иностранный язык // Труды МАИ. 2007. № 27. URL: http://trudymai.ru/published.php?ID=34001
-
Freed N., Borenstein N. Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. RFC2046, Innosoft, First Virtual Holdings, November 1996, URL: http://tools.ietf.org/html/rfc2046
-
Resnick P., Walker A. The text/enriched MIME Content-type. RFC-1896, February, 1996. URL: https://tools.ietf.org/html/rfc1896.html
-
Kilgarriff A. Putting Frequencies in the Dictionary // International Journal of Lexicography, 1997, no. 10 (2), pp. 135 – 155. DOI: 10.1093/ijl/10.2.135
-
Фролов А.С. Разработка алгоритма нечеткого поиска на основе хэширования // Молодой ученый. 2016. № 13 (117). С. 357 – 360.
Скачать статью