en

"Czekaj, czekaj.. Mam to chyba w mailu, zaraz poszukam.." -  Wiele wskazuje na to, że w niedługim czasie ten popularny zwrot będzie używany jeszcze częściej, a czas oczekiwania na rezultat poszukiwań się wydłuży. Z badań przeprowadzonych przez University of Southern California  wynika, że w latach 1986 - 2007 ludzkość wyprodukowała 295 bilionów gigabajtów danych oraz,  że liczba ta ulega podwojeniu średnio co 3 lata i 4 miesiące.  W obliczu tak ogromnej ilości danych oraz jej dynamicznego wzrostu, stajemy przed wyzwaniem budowy coraz to doskonalszych narzędzi wyszukiwania i kategoryzowania informacji.  Jakkolwiek poszukiwanie informacji w Internecie, dzięki coraz to "inteligentniejszym" wyszukiwarkom jest stosunkowo skuteczne, tak w obszarach zamkniętych informacji wewnątrz firm - już niekoniecznie. 

Oczywiste jest, że zasoby danych Internetu są nieporównywalnie większe do zasobów nawet największych korporacji. Czemu zatem łatwiej nam znaleźć dokument w Internecie niż we własnej firmie?  Na odpowiedź składa się kilka czynników:
Po pierwsze, autorom treści publikowanych w Internecie bardzo zależy na tym, żeby były one znajdowane jak najczęściej. Dla wszystkich jest jasne, że pozycja na liście w wyszukiwarce przekłada się bezpośrednio na zyski. Przedsiębiorstwa nie szczędzą więc środków na dostosowanie treści do panujących standardów, ułatwienie komunikacji poprzez API, budowę wyszukiwarek własnych produktów, czy też na "ułatwienie" ich znalezienia przez popularne wyszukiwarki typy Google. Nowoczesne wyszukiwarki z kolei śledząc praktycznie każdy ruch w sieci, potrafią już nie tylko trafnie ocenić ważność danej treści, lecz także "domyśleć" się o co użytkownikowi chodziło, mimo że sformułował nieprecyzyjne zapytanie. Dzieje się tak dzięki zaawansowanym funkcjom słownikowym  takim jak: uwzględnianie odmian, wybaczanie literówek, a także budowie tysięcy powiązań pomiędzy znaczeniami.

Zupełnie inaczej wygląda sytuacja w przypadku przedsiębiorstw, gdzie autorami treści są pracownicy, którzy często nie odnoszą żadnych bezpośrednich korzyści z tego, że efekt ich pracy będzie łatwo dostępny. Stoi to w oczywistej sprzeczności z ogólnym interesem firmy.  Konsekwencją mało-wydajnych narzędzi wyszukiwania są między innymi:

  • Strata czasu potrzebnego na szukanie i często brak pożądanego efektu
  • Konieczność odtwarzania zagubionych dokumentów (powstają duplikaty, ilość danych rośnie – zwielokratniając efekt) lub strata korzyści gdy takiego dokumentu nie da się odtworzyć
  • Utrudniony przepływ wiedzy pomiędzy pracownikami
  • Zazwyczaj szukamy tylko swoich dokumentów (utrata wartości dodanej przez innych)

Co prawda, firmy starają się porządkować wewnętrzne informacje używając różnych systemów typu CRM, ERP, FK, ECM i inne, ale mankamentem tych rozwiązań jest to, że każdy z nich posiada indywidualny system wyszukiwania zrzucając na użytkownika konieczność określenia, gdzie spodziewa się znaleźć daną informację. Rodzi to także konieczność kompletowania pełnego obrazu na podstawie danych z różnych systemów. Kolejną barierą jest oczywiste zróżnicowanie poziomu dostępu do tych danych dla poszczególnych pracowników oraz to, że często każdy system posiada indywidualne mechanizmy autoryzacji.  Z pomocą przychodzą tu coraz popularniejsze rozwiązania klasy Enterprise Search takie jak: Google Appliance, Microsoft FAST, czy oparte o Open Source'owe komponenty (Apache SOLR + Manifold)  takie jak Enser. Łączą one cechy nowoczesnych wyszukiwarek internetowych (wyszukiwanie kontekstowe, synonimy itp) wraz z  uwzględnieniem złożonej struktury archiwizowania danych w firmach (wiele systemów, poziomy zabezpieczeń itp). Nie sposób dziś wyobrazić sobie funkcjonowania Internetu bez wydajnych narzędzi wyszukujących. W niedalekiej przyszłości bez takich narzędzi ciężko będzie wyobrazić sobie sprawne funkcjonowanie firmy.

Autor: Bartosz Gędziorowski, 3e Software House

 

Więcej: Enser, ScienceDaily: How Much Information Is There in the World?

 

RODO

Wyrażam zgodę, aby 3e sp. jawna zbierała, katalogowała, analizowała i podejmowała automatyczne decyzje o adresach internetowych połaczonych z urządzeniem, którego używam a także informacji o samym urządzeniu, w tym jego typie, wersji zainstalowanego oprogramowania w celu obserwacji moich aktywności w internecie (stworzenia profilu użytkownika). Automatyczne podejmowanie decyzji nie dotyczy danych wrażliwych. Zgoda pozostaje w mocy tak długo, jak długo istotne pozostają dane, dla których została wyrażona, lub do czasu, gdy któraś ze Stron zgodę wycofa. Cofnięcie zgody będzie skutkować usunięciem danych.