Obsah
DISClient je nástroj sloužící pro snadné fulltextové vyhledávání nejen pomocí známých webových vyhledávačů jako je například Altavista, Google a podobně, ale umožňuje také přidávat další zdroje dat, které mohou obsahovat hledané dokumenty (například data uložená na Oracle8i interMedia).
Hlavní výhodou tohoto systému je počet oslovených serverů a přívětivé prostředí, ve kterém si uživatel definuje svůj dotaz. Nemusí se tak učit speciality jednotlivých vyhledávacích serverů, nemusí znát syntaxi na nich pokládaných dotazů. Práce je tak podstatně snazší, rychlejší a efektivnější.
Další výhodou je možnost nastavení prostředí, přednastavitelné speciální funkce jako je například rychlé hledání, či export. Nezanedbatelné je také uchovávání historie hledání a možnost uložení a exportu výsledků. Kdykoliv se tak může uživatel vrátit ke staršímu dotazu a znovu vyhledat odpovídající dokumenty nebo jen načíst informace o dříve nalezených dokumentech.
Díky tomu, že aplikace využívá více zdrojů dat, zpracuje podstatně více (a kvalitněji) jejich výsledky než by to provedl samotný uživatel postupným použitím jednotlivých serverů. Aplikace tyto servery oslovuje paralelně a navíc automaticky filtruje duplicity a umožňuje uspořádávat nalezené dokumenty.
Veškerý popis práce s aplikací DISClient je náplní tohoto manuálu. Pro pochopení je potřeba znát základní pojmy a mít jisté znalosti při práci v prostředí Microsoft Windows.
V případě používání knihovny pro Oracle je potřeba mít nakonfigurován ODBC ovladač pro Oracle 8, odpovídajícího klienta (ten je součástí klientské instalace Oracle) a podpora ADO (Microsoft ActiveX Data Objects) verze 2.1 (nebo vyšší). Ta je již součástí operačních systémů Microsoft Windows 2000 a XP. Pro jiné systémy ji lze zdarma stáhnout na stránkách Microsoftu (http://www.microsoft.com)
Aplikace byla koncipována tak, aby běžela na operačním systému Windows 2000 hlavně z důvodu chyb v dřívějších operačních systémech. Zejména se jedná o velmi časté chyby, jež obsahuje knihovna comctrl32.dll, kterými trpí zejména produkty vytvořené v Delphi či C++ Builderu.
V žádném případě tím ale není řečeno, že by produkt na jiné platformě než Windows 2000 neběžel, ale pouze to, že tam nemusí pracovat tak, jak bylo zamýšleno právě díky výše zmíněným problémům.
Instalace aplikace DIS Client je velice jednoduchá a probíhá v několika málo krocích. Lze ji kdykoliv zastavit tlačítkem Zrušit. Uživatel pak bude dotázán, zda opravdu chce instalaci ukončit. K dokončení se pak může kdykoliv vrátit.
Prvním krokem je spuštění instalačního souboru DISClient.msi. Po inicializaci se objeví přivítací dialog (Obrázek 3.1.).
Po stisku tlačítka Další se zobrazí dialog pro zadání lokace na disku, kam se má aplikace nainstlaovat (Obrázek 3.2.). Změna cílového adresáře se provede za pomoci tlačítka Procházet.
Nyní je instalátor připraven nainstalovat DIS Client na uživatelův disk. (Obrázek 3.3.). To spočívá v nakopírování souborů do zadaného adresáře, vytvoření zástupce v nabídce Start a přidání programu do seznamu nainstalovaných aplikací (Start/Nastavení/Ovládací panely/Přidat nebo odebrat programy), odkud lze kdykoliv snadno odinstalovat.
Po úspěšné instalaci se objeví informační dialog (Obrázek 3.4.) a v nabídce START/Programy vznikne zástupce pro spuštění aplikace (DISClient.exe).
Nechce-li uživatel instalovat aplikaci standardním způsobem, postačí když z instalačního CD zkopíruje adresář DISClient a spuštění poté provede souborem DISClient.exe.
Odinstalování aplikace se provede klasickým způsobem - použitím volby Přidat nebo odebrat programy z Ovládacích panelů.
Instalační soubor je vytvořen pomocí nové technologie „Windows Installer“. Místo toho, aby každý produkt měl vlastní instalační program, je instalace prováděna pomocí tzv. instalační databáze (soubor s příponou .MSI). Tato databáze obsahuje informace o tom, kam se má produkt instalovat, jaké přípony se mají registrovat a další.
V případě instalace produktu na starší operační systém, kde ještě tato technologie není zavedena, je potřeba ji dodatečně nainstalovat (potřebný instalátor lze najít na stránkách Microsoftu případně na instalačním CD v adresáři Servis, soubor InstMsi.exe).
Obsah
Hlavní okno aplikace (Obrázek 4.1.) se skládá z několika částí: hlavní nabídka, která se nachází v horní části okna. Hned pod ní je panel nástrojů, který obsahuje nejčastěji používané akce z hlavní nabídky. Panel pro rychlé vyhledávání se vstupním políčkem pro zadání hledaného výrazu a tlačítkem pro vlastní vyhledávání.
Největší část okna zabírá přehled dotazů a seznam nalezených dokumentů. který se váže k označenému dotazu v přehledu. Nejspodnější část okna zabírá stavový řádek, který zobrazuje informace o aktuálně vybraném tlačítku v panelu nástrojů nebo o položce v hlavní nabídce.
Prvním krokem při používání aplikace DISClient je přihlášení uživatele do systému. Toto umožňuje každému uživateli nastavit si pracovní prostředí dle svých zvyků, umožní mu nastavit si vlastní servery, vlastní historii dotazů atd.
Při startu aplikace se objeví přihlašovací obrazovka s logem (Obrázek 4.2.), která nabízí seznam uživatelů. Samozřejmě je zde také možnost vytvořit zcela nového uživatele.
Jiný způsob přihlášení je spuštění aplikace s parametrem, který představuje jméno uživatele:
DISClient.exe UŽIVATEL.
Jelikož je hlavním posláním aplikace usnadnit vyhledávání, je nejdůležitějším prvkem vlastní dotaz.
Nový dotaz se vytvoří za pomoci položky Dotaz/Nový dotaz v hlavní nabídce, případně lze použít odpovídající tlačítko v panelu nástrojů.
Prvním krokem je zadání názvu dotazu (ten slouží jen pro jeho identifikaci v seznamu dotazů). Zvolení počtu dokumentů, které si při vyhledávání aplikace vyžádá od každého osloveného serveru. A případně je možné zapsat poznámku (Obrázek 4.3.).
Druhým krokem je výběr serverů (Obrázek 4.4.), které budou zadaný dotaz vyhodnocovat. Některé servery se musí před vlastním použitím inicializovat (například Oracle). Toto může trvat delší dobu, ale děje se tak jen při prvním využití serveru. Průběh připojování se zobrazuje ve zvláštním okně. Podle toho, které servery zde budou vybrány, bude vypadat strom parametrů dotazu v dalším kroku.
Na další záložce je zobrazen strom parametrů dotazu (Obrázek 4.5.). Dotazy jsou dvojího typu. Jednoduché, představující jedinou hodnotu (například parametr „Jazyk“ pro specifikaci jazyku dokumentu) nebo skupinové. Ty reprezentují skupinu několika jednoduchých parametrů společně popisující jednu vlastnost hledaného dokumentu (například parametr „Datum dokumentu“ pro vymezení intervalu vzniku dokumentu nebo parametr „Slovo v sekci“, který popisuje která slova se musí, případně nesmí, v které sekci vyskytovat).
Po vybrání parametru se v prostřední části okna objeví příslušná editační políčka pro vyplnění jeho hodnoty (hodnot).
Někdy je potřebné vyplnit více parametrů stejného typu. Například při specifikaci výše zmíněného parametru „Slovo v sekci“ může uživatel potřebovat zadat jedno slovo, které se musí nacházet v určité sekci a zároveň ještě chce aby hledaný dokument neobsahoval nějaké jiné slovo v jiné sekci. Toto lze samozřejmě u některých parametrů (u kterých to má smysl) provést. Slouží k tomu jednak položka Přidej parametr v kontextové nabídce parametru, případně této položce odpovídající tlačítko nad stromem. Nově vytvořený parametr bude obsahovat stejné hodnoty jako originál. Libovolný nově vytvořený parametr, či jeho originál, lze obdobně smazat (položka Smaž parametr).
Poslední dvě tlačítka v této nástrojové liště slouží pro kompletní rozbalení, případně sbalení, stromové struktury parametrů.
Pravá část dialogu zobrazuje pomocné informace o aktuálně vybraném parametru. První záložka zobrazuje nápovědu, druhá přehled serverů, které daný parametr využívají. Výběr serverů se zde nedá změnit, to lze provést v dialogu pod záložkou Použité servery viz předcházející krok.
V okamžiku, kdy je uživatel spokojen s dotazem, potvrdí dialog tlačítkem OK, případně Vyhledej (pokud dotaz neobsahuje žádnou chybu, program se pokusí ihned začít vyhledávat). V tomto okamžiku se provede kontrola uživatelem zadaných dat a pokud se naleznou nějaké chyby, nabídne uživateli jejich zobrazení v poslední záložce tohoto dialogu (Obrázek 4.6.).
Tato poslední záložka obsahuje seznam chyb a informace o nich (popis, který server ji nalezl, kterého parametru se týká a případně další informace v poznámce - typicky jak bude chybný parametr zpracován v případě, že nebude opraven).
Rozhodne-li se uživatel chybu opravit, stačí na ni poklepat a dialog se automaticky přepne na předchozí záložku a nalezne tento parametr ve stromu.
Neobsahuje-li dotaz žádné chyby, je připraven pro vyhledání dokumentů, které tomuto dotazu odpovídají. Dokumenty budou hledány pomocí serverů, jež byly vybrány v druhém kroku.
Jiný způsob vytvoření nového dotazu je jeho odvození od stávajícího. Vznikne tak totožná kopie originálního dotazu. Toto je zejména výhodné, když se uživatel rozhodne ladit dotaz, ale chce si ponechat jeho kopii, aby se k němu mohl později v případě neúspěchu vrátit.
Existuje ještě jeden způsob vytvoření nového dotazu. Stačí do vstupního pole pod panelem nástrojů zadat řetězec, jež se má vyhledat a potvrdit tlačítkem Vyhledat. Parametry nově vytvářeného dotazu lze vyplnit v „šabloně“, která se nachází v nastavení. Nově vytvořený dotaz se zařadí do seznamu a ihned se začne vyhledávat.
Vyhledávání dokumentů se spustí buď za pomoci položky Dotaz/Vyhledat v hlavní nabídce případně odpovídajícím tlačítkem v nástrojové liště a nebo tlačítkem Vyhledat přímo v dialogu pro editaci dotazu. V případě, že se s některými servery ještě nepracovalo, proběhne jejich inicializace (například Oracle).
V následujícím dialogu (Obrázek 4.7.) se zobrazuje postup vyhledávání na jednotlivých serverech. Pod názvem serveru je vždy combobox se zprávami o průběhu. Při ukončení hledání obsahuje toto políčko mimo jiné počet nalezených dokumentů. Hledání lze kdykoliv ukončit tlačítkem Stop. Změní-li se popiska tohoto tlačítka na Ok znamená to, že vyhledávání bylo ukončeno.
Nyní se ve spodní části hlavního okna, pod seznamem dotazů, zobrazí přehled nalezených dokumentů (Obrázek 4.8.). Tento seznam obsahuje o každém nalezeném dokumentu několik informací:
Celkové pořadí a skóre, které dokument dosáhl. Pokud jeden a ten samý dokument byl nalezen více servery, tyto hodnoty představují průměrnou hodnotu. Hodnoty, které dokument dosáhl na jednotlivých serverech jsou uvedeny ve sloupečku Servery. Zde je třeba poznamenat, že ne každý server vrací ohodnocení nalezených dokumentů.
Lokace dokumentu může představovat například URL adresu nebo jiný identifikátor dokumentu (například v případě Oraclu je to jméno tabulky a hodnota primárního klíče dokumentu).
Seznam zkratek serverů, které našly dokument s uvedením pořadí a skóre, jež dokument na těchto serverech dosáhl.
Datumy vytvoření a modifikace dokumentu (pokud se tyto informace podařilo zjistit).
Ukázka z dokumentu se zobrazuje pod výše uvedenými informacemi. Zobrazování této ukázky je možno vypnout pomocí volby Zobrazit/Ukázka dokumentu.
Spodní část okna obsahuje i další informace o průběhu vyhledávání, které jsou schovány pod dalšími záložkami:
Seznam chyb (Obrázek 4.9.), ke kterým došlo v průběhu vyhledávání, případně chyby, které nebyly opraveny při editaci dotazu.
Obsahuje informace o celkové době hledání, počtu nalezených dokumentů, počtu chyb (Obrázek 4.10.). A také o tom, jak úspěšné byly jednotlivé servery:
Kolik dokumentů celkem odpovídalo položenému dotazu (z těchto bylo pouze několik prvních vráceno).
Dotaz položený serveru. Tento řetězec obsahuje dotaz jak jej server dostal. Pro každý server je tento dotaz odlišný. Jedná-li se například o webový fulltextový vyhledávač, je dotazem URL vyhledávacího stroje, která je doplněna příslušnými parametry. V takovém případě se po poklikání otevře asociovaný Internetový prohlížeč a zobrazí HTML stránku obsahující nalezené dokumenty, kterou oslovený server vrátil. Naopak například v případě Oracle serveru obsahuje toto políčko SQL dotaz.
Poznámka obsahuje případný dodatek k vlastnímu dotazu, případně další doplňující informace.
Dialog pro nastavení (Obrázek 4.11.) umožňuje nastavit základní vlastnosti aplikace. Jedná se zejména o parametry rychlého hledání, zobrazování seznamu dokumentů a nastavení serverů.
Tlačítko Parametry dotazu na první záložce slouží k nastavení šablony dotazu pro rychlé vyhledávání. Lze tak nastavit veškeré parametry dotazu. Hledaný řetězec (to co uživatel zadá) se dosadí do parametru, který je vybrán v comboboxu pod tímto tlačítkem.
Dále zde lze ještě určit jak se má zobrazovat uživateli seznam nalezených dokumentů při rychlém exportu. Na výběr je stejný seznam formátů jako při exportu (oddíl nazvaný „Seznamy dokumentů, export“). Navíc lze zvolit automatické zobrazování, které zapříčiní okamžité zobrazení nalezených dokumentů po vyhledání ve zvoleném formátu za použití asociovaného prohlížeče. To využijí uživatelé zejména v tom případě, že se jim nelíbí stávající zobrazování. Vzhled výsledného dokumentu lze změnit pozměněním stávající šablony nebo vytvořením nové (viz Kapitola 6., Vlastní šablona pro export).
Druhá záložka (Obrázek 4.12.) umožňuje nastavit veškeré parametry všech dostupných serverů. S tímto dialogem se pracuje obdobně jako při specifikaci parametrů dotazu.
V současnosti lze nastavit parametry proxy serveru pro webové vyhledávače a přihlašovací údaje pro Oracle server. Poslední položka v této skupině parametrů (Popiska serveru) je uživatelský název serveru. Tento název bude ve všech seznamech identifikovat server.
Seznamy nalezených dokumentů lze samozřejmě uložit pro pozdější práci (položka Dokument/Uložit seznam dokumentů) a zpětně načíst (položka Dokument/Načíst seznam dokumentů). O tom, zda k dotazu existuje uložený seznam nalezených dokumentů informuje uživatele malá ikona diskety ve druhém sloupci přehledu.
Jiným způsobem uložení seznamu dokumentů je jeho export (Dokument/Export seznamu dokumentů). Exportovat lze do několika formátů:
Report vygenerovaný jako HTML stránka s použitím kaskádových stylů
Tento formát lze načíst do většiny tabulkových programů jako je například Microsoft Excel (kde lze s daty dále pracovat). Jednotlivé hodnoty jsou ve výstupním souboru odděleny čárkou, věty jsou odděleny odřádkováním.
Univerzální formát, neobsahuje žádné formátovací tagy, lze prohlížet na libovolné platformě.
Pro vlastní export (Obrázek 4.13.) stačí vybrat požadovaný formát, zadat jméno souboru (koncovka je nepovinná, pokud nebude uvedena, doplní se automaticky dle vybraného formátu) a pořadí v jakém mají být dokumenty na výstupu uspořádány. Po úspěšném vygenerování je možno výsledek ihned prohlédnout pomocí asociovaného prohlížeče.
Uživatel může také využít „rychlý export“, který slouží pouze pro prohlížení výsledků (výsledek se ukládá do pomocného adresáře). Není třeba opakovaně zadávat vlastnosti tohoto exportu (ty lze editovat v nastavení viz oddíl nazvaný „Nastavení“).
V aplikaci lze mírně měnit vzhled zobrazování. Veškeré volby tohoto se týkající se nachází v podnabídce Zobrazit. Lze vypnout zobrazování ukázky dokumentu (v seznamu dokumentů zabírá téměř vždy nejvíce místa), lze vypnout zobrazování seznamu dokumentů případně seznamu dotazů.
Spíše pro vývojáře dalších DLL knihoven rozšiřujících spektrum vyhledávajících služeb je určen přehled (Obrázek 4.14.) všech implementovaných parametrů (Informace/Seznam parametrů).
Pro přehlednější a rychlejší práci s aplikací je vhodné používat více seznamů dokumentů. Dotazy tak budou rozumně uspořádány a také se tím zrychlí start a ukončení aplikace, kdy dochází k načítání a ukládání historie dotazů.
Přehled seznamů dotazů (Obrázek 4.15.) se nachází pod položkou Dotaz/Seznamy dotazů. V tomto přehledu lze vytvořit nový, smazat stávající, či nastavit zvolený seznam jako aktuální.
Základními prvky celé aplikace jsou servery, které se využívají při vyhledávání. Jejich seznam (Obrázek 4.16.) je přístupný přes položku Nastavení/Dostupné servery. V seznamu jsou uvedeny nejen jejich názvy, ale i zkratky, které se zobrazují v některých stručnějších výpisech, DLL knihovna, ve které jsou implementovány a další informace.
Některé servery umožňují svou duplikaci a tím rozšiřují řadu použitelných zdrojů. Jedním z příkladů je server Oracle. Vytvořením jeho další kopie (tlačítko Nový server, které je povolené v okamžiku, kdy je vybrán server umožňující vytváření svých kopií) vznikne další plnohodnotný zdroj pro vyhledávání, který se od originálu liší nastavením (to je možno upravit v dialogu Nastavení/Nastavení). Duplicitní servery lze samozřejmě také smazat (tlačítko Smazat server).
Dalším způsobem, jak rozšířit množinu použitelných serverů je získání další DLL knihovny a to buď od výrobce programu nebo od kohokoliv jiného. Nové knihovny je třeba nahrát do adresáře Servers, který je v adresáři obsahující program (DISClient.exe).
Tabulka 5.1. Klávesové zkratky
Klávesová zkratka | Popis |
---|---|
Ctrl+N | Nový dotaz |
Ctrl+D | Odvodit nový dotaz |
Ctrl+E | Editace dotazu |
Shift+Del | Smazání dotazu |
Ctrl+F | Vyhledat |
Ctrl+S | Uložit seznam dokumentů |
Ctrl+O | Načíst seznam dokumentů |
Ctrl+T | Zobrazit seznam šablonou |
Ctrl+F1 | Informace o aplikaci |
F1 | Nápověda |
Ins | Přidání parametru (ve stromě parametrů) |
Obsah
Výběr formátů na export je v dodávané verzi aplikace omezený (HTML, CSV, TXT). Uživatel si ale může kdykoliv vytvořit vlastní novou šablonu pro export do libovolných dalších formátů (XML, TEX, TXT, ).
Tuto šablonu (textový soubor, jehož popis bude následovat dále) je třeba uložit do podadresáře Export Templates adresáře, kde se nachází vlastní exe soubor aplikace. Na jeho jméně a koncovce nezáleží.
Šablonu exportu tvoří jednoduchý textový soubor, který kromě vlastního formátování výstupního exportu (například HTML tagy v případě HTML exportu) obsahuje i speciální tagy, které aplikace nahradí příslušnými daty. Tyto tagy mají následující syntaxi:
<#JMENO_TAGU JMENO_ATRIBUTU='HODNOTA'>.
Tabulka 6.1. Názvy a popisy tagů šablony
Název tagu | Význam |
---|---|
ACT_DATE | Aktuální datum a čas (tedy datum a čas exportu) |
USER_NAME | Jméno aktuálně přihlášeného uživatele |
DOC_COUNT | Počet nalezených dokumentů |
Tagy reprezentující vlastnosti dotazu | |
QNAME | Název dotazu |
QCREATED | Datum a čas vytvoření dotazu |
QEDITED | Datum a čas poslední modifikace dotazu |
QSEARCHED | Datum a čas posledního vyhledávání dokumentů odpovídajících dotazu |
QTOTAL_COUNT | Maximální počet nalezených dokumentů z jednoho serveru |
QSERVER_COUNT | Počet dotazem využívaných serverů |
QSERVERS | Seznam serverů, které dotaz používá pro vyhledávání |
QNOTE | Poznámka k dotazu |
Tagy reprezentující vlastnosti dokumentu | |
DNUM | Aktuální číslo dokumentu |
DNAME | Název dokumentu |
DLOCATION | Lokace dokumentu |
DSCORE | Celkové skóre dosažené dokumentem |
DORDNUM | Celkové pořadí dokumentu |
DCREATED | Datum vytvoření dokumentu |
DMODIFIED | Datum poslední změny dokumentu |
DEXTRACT | Ukázka z dokumentu |
DNOTE | Poznámka k dokumentu |
DSERVERINFOS | Informace o hodnocení dokumentu servery, které jej nalezly |
Speciální tagy | |
TEMPLATE_INFO | Tag popisující vlastní šablonu, musí být uveden na začátku souboru (tedy jako první tag), má dva atributy viz popis dále. |
LIST_BEGIN | Tag označující začátek smyčky, která obsahuje všechny nalezené dokumenty. Mezi tagy LIST_BEGIN a LIST_END by měly být uvedeny tagy popisující dokument, které budou nahrazeny skutečnými vlastnostmi nalezených dokumentů. |
LIST_END | Konec smyčky dokumentů |
Rozšiřující atributy jsou použity pouze u jediného tagu TEMPLATE_INFO, který popisuje šablonu a musí být uveden na samém začátku souboru. Popis atributů tohoto tagu:
Koncovka, s jakou se bude soubor ukládat (html, txt, xml, ). Tato koncovka je poměrně důležitá, neboť to bude výchozí koncovka, pokud uživatel nezapíše jinou a jednak se na zobrazení výsledného exportu použije prohlížeč, který je s touto koncovkou asociován.
Jméno (může být i s krátkým komentářem) pod jakým bude šablona uvedena v seznamu dostupných formátů pro export.