Використання сучасних інформаційних технологій при розробці електронних посібників для фахівців з документознавства
Узагалі говорячи, кожен користувач Internet шукає інформацію в Мережі відповідно до своїх смаків і пристрастям. Однак існують деякі загальні принципи, випливаючи яким можна швидше знайти необхідну інформацію.
Найпростіший спосіб почати пошук у Internet – звернутися до однієї з пошукових служб мережі. Інформаційно-пошукові служби Internet – той самий інструмент, що дозволяє орієнтуватися у величезному інформаційному просторі мережі. Сьогодні багато користувачів знаходять необхідні матеріали, звертаючи до послуг пошукових служб.
Користувачам Internet добре відомі назви таких сервисов і інформаційних служб, як Lycos, Alta Vista, Yahoo, InfoSeek і багатьох інших. Без послуг цих систем сьогодні практично не можна знайти що-небудь корисне в ресурсах Мережі.
Усі ці відомі і популярні пошукові системи мають дуже простий інтерфейс, розрахований на недосвідченого користувача, мають безліч настроювань і досить прості у використанні. Як правило, у відповідь на запити видається список посилань на інформаційні джерела, на думку системи щонайкраще відповідають потребам користувача. Але від користувача залежить тільки формулювання запиту, пошук же здійснює убудований механізм пошукової системи.
Але що собою представляють ці системи зсередини, як вони улаштовані, чому результат пошуку в терабайтних масивах інформації здійснюється досить швидко і як улаштоване ранжирування документів при видачі – усе це звичайно залишається за кадром. Проте без правильного планування стратегії пошуку, знайомства з основними принципами роботи ІПС важко ефективно використовувати навіть такі сучасні і могутні пошукові служби. При роботі з цими системами варто враховувати ряд факторів.
По-перше, усі пошукові системи в Мережі мають свою спеціалізацію. Наприклад, Lycos і AltaVista містять одні з найбільших масивів посилань і відомі швидкістю додавання нових ресурсів мережі, однак багато ресурсів Internet недовговічні і рухливі, і посилання можуть указувати на відсутні ресурси. Infoseek – це найбільш стабільна база даних, де зручно знаходити відомі матеріали, але не слід шукати що-небудь нове, і т.д. у залежності від пошукової системи. У випадку пошуку якої-небудь спеціалізованої інформації користувачу треба відразу настроїтися на тривалу і кропітку працю.
Якщо в звичайній бібліотеці існує зрозуміла класифікація і досвідчений персонал, що розставляє книжки і журнали відповідно до предметного каталогу, загальним для всіх бібліотек, то – у Internet такого стандарту нема, і кожна інформаційна служба виробляє свою власну систему класифікації.
Крім того, зовсім очевидно, що Internet – це світовий інформаційний ресурс. Сюди поміщається усе, що так чи інакше цікавить людей в усьому світі, тому перш ніж починати що-небудь шукати, варто тверезо оцінити імовірність того, чи може дана інформація взагалі потрапити в мережу і де найбільш логічне для її місце.По-друге, варто розуміти, що пошук здійснюється не природною мовою і не по всьому тексту документа. Звичайно документ представлений набором ключових слів – пошуковим образом документа (ПОД), а користувач здійснює пошук не в наборі документів, а в наборі їхніх пошукових образів. Крім того, для кожної пошукової системи характерний свій механізм створення ПОД. Природно, що це впливає на результати пошуку.
По-третє, самі запити і їхня інтерпретація в інформаційних системах Internet реалізовані по-різному, хоча поза залежністю від типу інформаційно-пошукової мови багато систем містять можливість сформулювати простий запит і запит з урахуванням специфіки пошукового апарата системи.
Простий запит – це фраза природною мовою без загальних слів, союзів і приводів. Складний запит – це запит, що враховує специфіку системи і дозволяє користувачу варіювати різні параметри пошуку. Після завершення обробки запиту користувачу видається список посилань на документи, де вже можна використовувати гіпертекстові посилання для перегляду. Ці посилання можуть указувати як на Web-сторінки, так і на одиниці збереження інших інформаційних ресурсів Internet.
По-четверте, у даний час для управління інформацією Web у пошукових вузлах застосовуються два різних механізми — покажчики і каталоги, і різні пошукові системи використовують у своїй роботі різні механізми.
Покажчики Web являють собою громіздкі бази даних, формовані комп'ютером в автоматичному режимі й утримуючі інформацію про мільйони сторінок Web. Коли користувач уводить ключові слова чи фрази, пошукова система шукає ці терміни в існуючій виданий момент базі даних і видає посилання на усі відомі їй сторінки із шуканими термінами. Покажчики Web будуються так званими краулерами Web — програмами, що переглядають і індексують вміст HTML-сторінок, виявляють гіпертекстові зв'язки, що містяться в них, і читають відповідні сторінки. Багато сотень таких програм із заданою періодичністю переглядають весь доступний вміст Internet.