© 1999-2000 InterSoft
|
Программа
для смыслового поиска документов Следопыт Программа «Следопыт» предназначена для «смыслового» поиска информации в русских и английских текстах по запросам на естественном языке. Программа основана на технологии нечёткого поиска текстовой информации, разработанной компанией «МедиаЛингва». Поиск документов нужен всем. Как найти нужный документ на жёстком диске, если он был создан несколько месяцев назад? В принципе, можно запустить Norton Commander™ или Explorer™ и просто поискать нужный файл. Если Вы не гений делопроизводства и не держите в голове развитую и логичную структуру всех своих документов за последние два года, скорее всего, Вы потратите массу времени с неопределённым результатом, особенно если имя нужного файла не прямо связано с его содержанием. Очевидно, хотелось бы находить документы каким-нибудь автоматическим способом. Чем плохи стандартные средства поиска? Средства поиска документов по содержанию, конечно, существуют. Можно, например, запустить функцию поиска документов, входящую в состав Microsoft Word™. Многие из нас пробовали это делать; результат, увы, часто неутешительный. Как и большинство других стандартных средств, эта функция ищет заданный текст только буквально, как строку символов, и при этом ничего не знает о высоком разнообразии форм русских слов. В случае, когда Вы помните содержание нужного документа только в общем, подобные средства поиска практически бесполезны. В последнее время появились системы, позволяющие реализовывать поиск с учётом морфологии русского языка (то есть с учётом изменчивости русских слов). Однако такие системы очень негибки: например, на запрос «глубины океана» ни в коем случае не будет найдено сходное по смыслу выражение «океанские глубины», так как слова «океан» и «океанский» принадлежат разным частям речи (это, соответственно, существительное и прилагательное). Технические подробности. Демонстрационная
версия. |