Рассматриваются теоретические вопросы фактографического поиска, а также разработки технологии извлечения фактографической информации из научных документов достаточно произвольной структуры. Показано, что при создании фактографических информационных систем целесообразно следующее определение факта: содержащаяся в тексте и метаданных документа совокупность связей между сущностями, описываемыми в онтологии информационной системы. Предложена модель онтологии фактографической системы, работающей с документами достаточно произвольной структуры. Обсуждаются вопросы автоматизированного извлечения фактов из документов и организации взаимодействия фактографических систем с пользователями.
This paper considers the theoretical problems of factographic retrieval, as well as of development of technology for extraction factographic information from scientific documents with rather arbitrary structure. It is shown that when creating information factographic systems, the following definition of fact is advisable: contained in the document’s text and metadata, set of relations between the entities, described in the ontology of information system. A model of ontology of factographic system, working with documents of rather arbitrary structure, is proposed. The problems of automated retrieval of facts from documents and organization the interaction between factographic systems and users are discussed.