Przejdź do strony

System ekstrakcji informacji

Choć technologia Wirtualnych Doradców ma niebagatelne zalety z punktu widzenia naszych klientów jak i osób korzystających z usługi Wirtualnego Doradcy, sam proces przygotowania odpowiedniej bazy wiedzy jest niezwykle skomplikowany i wymaga dużych zasobów. Każdy fakt wprowadzony do bazy wiedzy Wirtualnego Doradcy musi być odpowiednio przygotowany i „skonfigurowany” tak aby użytkownik otrzymywał poprawną odpowiedź bez względu na formę oraz sposób zadania przez użytkownika pytania. Przykładowo załóżmy, że wprowadzamy do Wirtualnego Doradcy informację na temat numeru telefonu do działu serwisu Klienta: Telefon do Działu serwisu to ZZ-XXX-YYYY. Użytkownik może o taki fakt zapytać na bardzo wiele różnych sposobów:

Choć we wszystkich przypadkach odpowiedź jest ta sama Wirtualny Doradca musi poprawnie zareagować na wszelkie konstrukcje pytające. Dzieje się to poprzez odpowiednią konfigurację bazy wiedzy, jej tuning oraz mozolne testy. Prace te składają się na proces uruchomienia i wdrożenia usługi Wirtualnego Doradcy.

W 2009 roku rozpoczęliśmy realizację projektu, którego celem byłoby zbadanie możliwości oraz stworzenie systemu ekstrakcji informacji celem usprawnienie procesu wdrożeń Wirtualnych Doradców.

Głównym celem badawczym jest weryfikacja możliwości stworzenie uniwersalnego systemu ekstrakcji informacji dostosowanego do specyfiki języka polskiego oraz automatyzującego zasilanie bazy wiedzy Wirtualnych Doradców. Celem praktycznym jest stworzenie systemu umożliwiającego automatyzację procesu wdrożenia usługi Wirtualnego Doradcy. Proces taki polegałby na odczytaniu podanych przez klienta treści (np. strony WWW, materiałów marketingowych, dokumentacji technicznej) , ekstrakcji wskazanych informacji (czyli odszukaniu informacji o określonym znaczeniu) oraz automatycznej lub półautomatycznej konfiguracji bazy wiedzy Wirtualnego Doradcy.

Niestety istniejące do tej pory rozwiązania komercyjne realizujące proces ekstrakcji informacji działają w ramach bardzo ograniczonych obszarów wiedzy i z reguły są dostępne dla języków anglosaskich, co dyskwalifikuje możliwość ich wykorzystania do naszych celów. Wynika to z faktów, iż język polski cechuje się:

Rozpoczęty w Stanusch Technologies projekt jest pierwszą polską próbą stworzenia systemu, który w sposób uniwersalny tworzyłby i aktualizował wiedzę Wirtualnego Doradcy w oparciu o dostarczone materiały.