CA on CD

 

 

Elektronická verze Chemical Abstracts

 

Jaroslav Šilhánek

 

Ludmila Zetková

 

 

Vysoká škola chemicko-technologická Praha

Praha 2006

 

 

1. Jaké jsou možnosti práce s Chemical Abstracts ?

 

Chemical Abstract je bezesporu nejdůležitější chemický informační zdroj, který je zpracováván a vydáván již od r. 1907, tedy prakticky celých sto let. Největší část této doby byl a stále je zpracovaný materiál vydáván jako tištěné sešity vycházející každý týden (tedy 52 svazků za rok, rozdělených do dvou „ročníků“ ,Volumes, tj. 2x26 sešitů = jeden svazek, za půl roku, tj. dva svazky za rok). Přístup k elektronické verzi se postupně vyvíjel v závislosti na vývoji informačních technologií, v současné době se ustálil na dvou hlavních formách. Tištěné verzi je nejbližší forma na médiu CD-ROM označovaná jako „CA on CD“, kde místo 4 týdenních sešitu je vydáván 1 CD-ROM každý měsíc. Ve skutečnosti je na tomto médiu materiál postupně kumulován, takže celkový počet CD-ROM diskú je v současné době minimálně 10 za rok.

Vedle toho je možný přístup k celému souboru informací nakumulovaných za celou dobu existence Chemical Abstracts od samého počátku, který byl již kompletně převeden do elektronické formy. Přístup k tak rozsáhlému materiálu je pouze prostřednictvím sítě (Internetu) na vzdálený server producenta a uživatel má k disposici speciální vyhledávací program, který je mimořádně intuitivní a široce využívá možností, které dnešní informační technologie nabízí. Tato forma přístupu je známá pod označením SciFinder , která má pro akademické instituce (univerzity) ještě verzi označovanou jako SciFinder Scholar. Tato forma je samozřejmě mimořádně výhodná, ale je také mimořádně nákladná a skutečně pohodlný a okamžitý přístup je omezen na jen několik současně pracujících uživatelů, kdy licenční poplatky jsou vázány právě na počet současných přístupů. Tato forma je dále striktně omezena jen pro pracovníky instituce (univerzitu) a zásadně nemůže být přístupná ve veřejné knihovně.

Konečně je k disposici přístup k celému souboru Chemical Abstracts, tedy k celé bázi dat od r. 1907, na databázovém středisku STN International, tedy rovněž prostřednictvím sítě Internet. Tato forma je zcela univerzální a otevřená komukoliv, je ale třeba se naučit s touto formou pracovat a otevřít si na zmíněném databázovém středisku účet, protože jak vlastní přístup na databázové středisko,tak i veškerá rešeršní činnost, tj. jak zadávané dotazy, tak i zobrazované odkazy, jsou pochopitelně zpoplatňovány a budiž řečeno, že tyto poplatky jsou značně vysoké (cena rešerší se pohybuje řádově v tisících Kč).

Shrneme-li tedy uvedené možnosti, máme k disposici jen následující alternativy.

 

Forma

Možnosti přístupu

Poznámky

Tištěné sešity

neomezeně

na VŠCHT v Praze od 1907 do r. 1998, dnes v žádné knihovně v ČR nejsou odebírány

Verze na CD-ROM médiu

„CA on CD“

licenčně částečně omezený

na VŠCHT v Praze a Univerzitě Pardubice

Databázové středisko STN International

neomezený, ale vyžadující administrativní zajištění a zkušenosti

VŠCHT v Praze

SciFinder Scholar

jen pro pracovníky dané instituce

většina chemických fakult českých vysokých škol

 

Jak z uvedené tabulky vyplývá, digitální forma přinesla obrovský pokrok v možnostech práce s informacemi obsaženými v Chemical Abstracts, ale na druhé straně zatím do jisté míry zkomplikovala jejich využívání. Protože tištěné sešity se již v žádné chemické knihovně  v České republice neodebírají a přístup k nejefektivnější verzi, tj. SciFinder Scholar je striktně omezen, ukazuje se verze na médiu CD-ROM jako v současné době nejuniverzálnější a nejsnáze dostupná. Proto bude v následujícím textu uveden sice maximálně stručný, ale podle našeho názoru dostatečně názorný návod na práci s tímto zdrojem.

 

 

2.  Něco více o verzi „CA on CD“

 

 

n    Elektronická forma, „CA on CD“, je koncipována jako plný ekvivalent tištěné verze zachovávající filosofii i formu zpracovávání informací, ale současně využívá co nejvíce možnosti vyplývající z digitální podoby materiálu. Tato vazba na tištěnou formu ztrácí postupně svůj smysl.

n    Jedinou možnou formou zpřístupnění CD-ROM disků je jejich instalace v lokální síti, tedy jejich kopírování na paměťová pole CD-ROM serveru (individuální využívání postupným vkládáním jednotlivých disků prakticky nepřichází v úvahu).

n    Frekvence souboru nových informací 1x za měsíc je kompromisem mezi aktuálností a nutností instalovat nové soubory na server.

n     Každý další CD-ROM disk kumuluje obsahy disků předchozích až do vyčerpání kapacity disku. Prvý rok (1996) spotřeboval na obsah celého kalendářního roku (2 x 26 čísel, tj 2 svazky - Volumes, neboli 56 čísel) 4 CD-ROM disky, pro rok 2005 už bylo pro oba ročníky 10 CD-ROM disků.

n    Podle licenčních podmínek, kterými jsme vázáni při zpřístupňování tohoto informačního zdroje, mohou být současně připojeni k instalované versi CA čtyři uživatelé. Tato podmínka ale platí pro každý jednotlivý rok, takže v praxi není nijak významně omezující.

n    Využívání této elektronické verze CA instalované na lokálním serveru na VŠCHT v Praze je zatím bezplatné. Zachování této formy nebo zavedení určitých způsobů úhrady či participace na provozování bude záviset jak na rozpočtovém i cenovém vývoji, tak na míře využívání a růstu nároků na udržování systému.

 

3.  Organizace přístupu k verzi „CA on CD v síti VŠCHT Praha

 

 

VŠCHT Praha přešla na elektronickou verzi od r. 1997 a v postupně investovala do nákupu všech svazků Chemical Abstracts, které byly do této formy převedeny. Jedná se o tzv. „Collective Indexes“, tedy souhrnné rejstříky, které byly a stále ještě jsou vydávány v tištěné verzi vždy za 5 uplynulých let. Protože producent již ohlásil, že další materiál nebude do této podoby převádět, je možné shrnout celý obsah Chemical Abstracts, který je v této podobě k disposici a také je současně k disposici na VŠCHT Praha.

 

 

10th Collective Indexe

1977 - 1981

Vol. 86 - 95

11th Collective Indexe

1982 - 1986

Vol. 96 – 105

12th Collective Index

1987 - 1991

Vol. 106 – 115

13th Collective Index

1992 - 1996

Vol. 116 – 125

14th Collective Index

1997 - 2001

Vol. 126 - 135

CA on CD 1997

1997

Vol. 136 – 137

CA on CD 1998

1998

Vol. 138 – 139

CA on CD 1999

1999

Vol. 140 – 141

CA on CD 2000

2000

Vol. 142 – 143

CA on CD 2001

2001

Vol. 144 - 145

CA on CD 2002

2002

Vol. 146 – 147

CA on CD 2003

2003

Vol. 148 – 149

CA on CD 2004

2004

Vol. 150 – 151

CA on CD 2005

2005

Vol. 152 - 153

CA on CD 2006

2006

Vol. 154 - 155

 

Vysvětlení: Uvedený stav odpovídá roku 2006 s předpokladem, že bude pokračovat ve stejné koncepci. Rozdíl mezi souhrnnými rejstříky a jednotlivými roky je v tom, že souhrnné rejstříky neobsahují texty abstraktů, zatímco jednotlivé roky ano. Proto je období 1997 až 2001 ponecháno i když se překrývá. Otázka dokoupení souhrnného rejstříku za období 2002 – 2006 je otevřená.

 

Všechny možnosti se objeví jako nabídka při otevření přístupu k verzi „CA on CD“ a je tedy nutné zvolit jednu z nabídnutých možností. Současně z toho vyplývá i nevýhoda této verze, spočívající v tom, že musíme při práci postupně otevírat jednotlivá časová období.

                                                                                 

 

 

         

4. Vlastní práce s elektronickou verzí Chemical Abstract - vyhledávání informací

 

Práci s verzí „CA on CD“ tedy musíme zahájit volbou příslušného kalendářního roku, resp. souboru 5ti let v jednou ze souhrnných rejstříků. Po odkliknutí informačního okna s upozorněním na právní aspekty práce s tímto produktem je otevře pracovní obrazovka se standardní nabídkou a panelem tlačítek, z nichž jsou při zahájení práce aktivovány jen první čtyři:

 

Browse“, „Search“, „Subst.“ a „Form“.

 

 

                                             

 

 

Obr. 3 Vstupní panel nástrojů báze dat „CA on CD“

 

Prvé dvě ikony představují dvě základní universální  možnosti práce, tj. prohlížení rejstříků („Browse“) a vyhledávání konkrétních hesel a jejich kombinace („Search“). Další dvě ikony, „Subst“ a „Form“, jsou určeny pro vyhledávání chemických názvů a sumárních (molekulárních) vzorců a seznámíme se s nimi později.

 

 

        

 

5. Práce v režimu „Browse“                                                                                    

 

Kliknutím na ikonu „Browse“ se otevře jeden z rejstříků, zpravidla ten, se kterým se pracovalo naposledy. Rozbalením nabídky „Index“ zvolíme ten rejstřík, který chceme prohlížet. Nejlepším způsobem jak se seznámit s obsahem jednotlivých rejstříků a tím i s celkovými možnostmi práce s touto bází dat, je postupně si je podrobně pohlédnout. Vzhledem k tomu, že nabídka rejstříků (selekčních polí) představuje jednu ze základních charakteristik elektronické verze, protože v podstatě určuje, podle jakých hledisek bude možné vyhledávat informace a vůbec tento informační zdroj využívat, bude užitečné, jestliže budeme jednotlivé položky v Tab.1 alespoň stručně komentovat.

 

 

Tab. 1. Přehled volitelných polí pro vyhledávání v „CA on CD“

 

Název pole

Obsah daného rejstříku

Word

Klíčová slova, závazné termíny z General Subject Headings aj .

CAS RN

Registrační číslo CA

Author

Jméno autora

Gen.Subj.

Hesla z rejstříku General Subject Headings

Patent No.

Čísla patentů

Formula

Rejstřík sumárních vzorců

Compound

Rejstřík chemických názvů

CAN

Čísla abstraktů

Organization

Název pracoviště autora(ů)

Org. Words

Části názvů institucí (pracovišť autor(ů))

Journal

Název časopisu

Language

Jazyk primárního dokumentu

Year

Rok publikace abstrahovaného dokumentu

Doc.Type

Druh dokumentu (článek, patent aj)

CA Section

Číslo sekce tištěné verse CA

Update

Informace o stavu instalovaných disků

 

 

Podrobnější popis jednotlivých polí:

 

 

Word  

Tento rejstřík obsahuje soubor jakýchkoliv textových výrazů, které se vyskytují v záznamech ale vždy jen v jednoslovném tvaru !!! Jsou zde ale zařazeny i termíny z rejstříku General Subject Headings (viz dále) a pojmy použité v jeho rozšiřujících textových modifikacích (tzv. „index modification phrases“). Chemické názvy a jejich fragmenty jsou uvedeny jen tehdy, pokud jsou použity jako klíčová slova. A i v tomto případě bývají zjednodušené, resp. zevšeobecněné. Tak např. hovoří-li se v abstraktu určité práce o „pyridine-2-aldehyde“, je jako klíčové slovo použit termín „pyridinealdehyde“.

CAS RN

Rejstřík registračních čísel, může být použit i jako jejich identifikátor

Author

Autorský rejstřík, je nutné dát pozor na iniciály, resp. na skutečnost, že u některých citací jsou uvedeny jen iniciály, jinde plná jména.

Gen.Subj.

Toto pole (rejstřík) obsahuje pouze závazná hesla používaná v tištěném rejstříku „General Subject Index“ podle seznamu Chemical Abstracts, který je možné konsultovat např. v tištěném rejstříku Index Guide.

Patent No.

Seznam čísel patentů odkazovaných v daném ročníku CA.

Formula

Rejstřík sumárních vzorců uspořádaný podle Hillových pravidel, tj. v pořadí: uhlík, vodík, ostatní prvky v abecedním pořádku. Je nutné si uvědomit, že číslovky jsou chápány jako znaky a nikoliv numerické hodnoty. Podrobněji viz kap. 2.4.

Compound

Abecední seznamem názvů sloučenin, o kterých je ve zpracovaném období zmínka, a to v jejich přesném rejstříkovém tvaru, tedy v invertované podobě se základem názvu („Heading parent“ jako prvé slovo. Názvy jsou uspořádány přesně abecedně a proto sloučeniny stojící v rejstříku za sebou spolu nemusí nijak souviset. Abecední řazení začíná číslovkami, které jsou chápány jako znaky (nikoliv jako označení číselné hodnoty) a  stojí dříve než abeceda.

CAN

Čísla abstraktů, např. 126: 131221.

Organization

Název pracoviště autorů s adresou.

Organization Words

Složky názvů institucí, resp. adres autora nebo autorů. Ve starších ročnících se nevyskytuje.

Journal

Zkratky časopisů z nichž jsou čerpány odkazy v daném ročníku.

CA Section

Čísla sekcí používaná v tištěných sešitech CA. Počet odkazů v prvém řádku platí pro časopisecké publikace, druhý řádek je počet abstraktů patentů.

Update

Důležitý údaj o konkrétních nainstalovaných číslech CA, resp. CD-ROM disků

           

Obsahy polí „Language“, „Year“, a „Doc.Type“ jsou zcela evidentní a nepotřebují žádný komentář.

 

K čemu slouží prohlížení rejstříků v režimu „Browse“ ?

             

 

Hlavní smysl prohlížení jednotlivých rejstříků je předběžná orientace v rejstříkovém materiálu, která pak slouží ke smysluplné formulaci dotazu v daném rejstříku místo „střílení od boku“ zadáváním náhodně zvolených termínů přímo do formuláře pro vyhledávání dotazů. V abecedně seřazené části rejstříku se můžeme seznámit se správným tvarem hesla nebo jmen autorů či názvu časopisu a rovněž si můžeme povšimnout a využít všechny gramatické tvary daného termínu pro případné využití rozšiřujících znaků (*, ?). Mimořádně důležité je prohlížení správných tvarů v rejstříku autorů (kombinace čárky, mezery, iniciál apod.


 

 

6.  Přímé vyhledávání - režim „Search“                      

 

 

Kliknutím na sousední ikonu označenou „Search“ otevřeme formulář pro zadávání termínů a určení jejich vzájemných logických vazeb (Obr. 4). Samozřejmě musíme pro každý do formuláře zapsaný údaj určit v jakém rejstříku má být vyhledáván rozbalením posledního sloupce (Search Fields). Stejně tak můžeme volit logické operátory, buď přepisem po umístění kurzoru, nebo rozbalením a volbou.

 


Do pole pro zadávání hledaných termínů můžeme zapsat vždy jen jeden termín, resp. heslo. Pouze pokud jsou všechna hesla z rejstříku Word, můžeme je zapsat spolu s logickými operátory do jedné řádky. Např. požadavek na vyhledání odkazů týkajících tzv. „Phase Transfer Catalysis“ můžeme formulovat buď:

 

 

Phase

Word

AND

Transfer

Word

AND

Catalysis

Word

 

nebo

 

Phase AND Transfer AND Catalysis

Word

 

                                                                                             

Pokud bychom vynechali operátory, dostaneme jako odpověď jen takové odkazy, kde zadané termíny stojí vedle sebe. Implicitně tedy systém dosadí za vynechané operátory tzv. proximitní operátor, který vyžaduje, aby zadané termíny byly v dokumentech uvedeny vedle sebe a to v uvedeném pořadí. Univerzálně můžeme volit vzdálenost termínů v textu použitím nabídky „Word Relationship“ ve formuláři „Search“.

Zde můžeme volit jeden ze tří relačních vztahů, tj. buď dovolujeme výskyt vyhledávaných termínů v celém záznamu, tj. ve všech jeho částech, v názvu, abstraktu, souboru klíčových slov nebo v závazných termínech, nebo musí být jednotlivé termíny jen v určitém logickém bloku záznamu (volba „Same Paragraph“). Logický blok záznamu znamená např. abstrakt, blok klíčových slov nebo blok definovaných indexových termínů („Index Entries“). Třetí možnost, „Words Apart“, se vztahuje ke vzájemné poloze dvou vyhledávaných termínů, které mohou být od sebe vzdáleny určený počet jiných slov, maximálně 9. Největší význam má tato volba pro vyhledávání víceslovných termínů (gas chromatography, phase transfer catalysis apod.) kde je možné dále požadovat i dané pořadí vyhledávaných termínů. Tyto proximitní operátory představují poměrně velmi citlivý a užitečný nástroj pro vyhledávání informací a je velmi doporučitelné si na nějakém vhodném případu vyzkoušet jejich funkci. 

Formulář pro vyhledávání nepočítá s používáním závorek, což je častý požadavek při formulaci složitějších logických vazeb. Ve skutečnosti můžeme se závorkami pracovat, ale musíme si být vědomi následující zásady:

 

           

Jakákoliv změna logického operátoru způsobí, že předchozí logická vazba se uzavře do závorky.


 

 

Máme ze úkol vyhledat informace o spektrálních charakteristikách polysacharidů, ale nikoliv o infračervených spektrech. Víme přitom, že polysacharidy mohou

být rovněž označovány termíny „sugars“ nebo „carbohydrates“. Následující, zdánlivě „logická“ formulace zadání, může vypadat následovně:

 

 

 

spectra

Word

not

infrared

Word

and

polysacharides

Word

or

sugars

Word

or

carbohydrates

Word

 

 

Výsledek je ale na první pohled nesmyslný, protože počet nalezených odkazů je příliš vysoký a letmá inspekce několika odkazů ukáže, že nejsou splněny selekční podmínky. Velké množství odkazů totiž odpovídá „logice“ vytváření souboru odkazů, kdy postupně vytvářená množina vzniklá kombinací hesla „spectra“, „infrared“ a „polysaccharides“ je překryta množinou odkazů obsahujících buď heslo „sugars“ nebo „carbohydrates“, protože předchozí kombinace se uzavřela do závorek.

Musíme proto zadání přeformulovat v následujícím smyslu:

 

 

polysaccharides

Word

or

sugars

Word

or

carbohydrates

Word

and

spectra

Word

not

infrared

Word

 

Při této formulaci je nejdříve vytvořena množina všech synonym skupinového označení sloučenin, která je pak logicky omezena požadavkem na současný výskyt dalšího hesla a nakonec je dále omezena negací posledního termínu.

 

Je proto nutné si uvědomit, že formulaci dotazu obsahující více hledisek je třeba věnovat větší pozornost a případně postupným vytvářením množin odkazů nabýt jistoty, že výsledek odpovídá našemu záměru.

 

 

 

7.                  Vyhledávání informací o chemických sloučeninách.

 

 

Nejjednodušší cesta k nalezení informací o chemických sloučeninách vychází z jejich sumárních vzorců. Protože ale konečné rozhodnutí záleží o konkrétního názvu, seznámíme se nejdříve s touto problematikou.

 

Je nutné mít alespoň základní vědomosti o nomenklaturních principech používaných v Chemical Abstracts, alespoň co se týká struktury názvosloví. Stejně jako názvosloví IUPAC i CA zakládá svůj systém (který se od názvosloví IUPAC až tak moc neliší) na primárním určení názvoslovného základu, resp. matečné sloučeniny, v terminologii CA nazývané „Heading Parent“, k němuž jdou přiřazovány další části jako substituenty s numerickými lokanty a případně dalšími upřesňujícími atributy. Pro rejstřík (tištěný i elektronický) jsou názvy invertovány, tj. názvoslovný základ neboli matečná sloučenina je uvedena na prvém místě a abecední řazení je uspořádáno v první úrovni právě podle něho. Připomeňme si tento systém na příkladu:

Název sloučeniny, který bychom v textu napsali následovně (pochopitelně v anglické verzi):

 

methyl ester of (1a, 3a, 4b)- 4-chloro-3-hydroxy-cyclohexanecarboxylic acid

 

bude pro rejstříkové zařazení tzv. „invertován“ do následující podoby:

 

 

Cyclohexanecarboxylic acid,

4-chloro-3-hydroxy,

methyl ester,

(1a, 3a, 4b)-

základ názvu, matečná sloučenina,

(Heading Parent, Index Heading)

substituenty

modifikace

stereochemické

atributy

 

 

K názvoslovnému základu („Heading Parent“) jsou na druhé a případně dalších úrovních přiřazeny substituční nebo funkční a jiné deriváty, opět na dané úrovni seřazeny abecedně. Tato inverze názvů je pro abecední seřazení v rejstřících naprosto zásadní a byla (a stále je) uplatňována v tištěných verzích, kde je na první pohled patrná. Protože se jedná o v pravém slova smyslu hierarchickém uspořádání názvů, je tato hierarchie zachována i v elektronické verzi a musíme proto postupně otevírat a zavírat jednotlivé hierarchické úrovně názvů.

Při práci ve verzi CA on CD jsou pro přechody mezi hierarchickými úrovněmi k disposici následující tlačítka:

 

Document

 

Expand

 

Collapse

 

Druhé tlačítko slouží k přechodu na nižší hierarchickou úroveň (úroveň se expanduje) a poslední pak k obrácené cestě. Tlačítko „Document“ pak k otevření odkazu.

Nyní se můžeme věnovat praktické práci při vyhledávání informací o chemických sloučeninách, kdy můžeme vyjít buď ze sumárního (molekulového) vzorce nebo přímo z názvu, pokud jej známe nebo více méně spolehlivě odhadneme.

 


8.   Práce s rejstříkem sumárních vzorců - ikona „Form“

 

Tato ikona otevírá selekční nástroj velmi podobný tištěné verzi rejstříku sumárních vzorců, tedy Formula Indexu. Po kliknutí na ikonu „Form“ se nám otevře abecedně seřazený rejstřík sumárních vzorců, kde jsou jednotlivé položky předznamenány buď znakem + nebo -, což značí, že můžeme prostřednictvím tlačítek „Expand“ a „Collapse“ příslušnou hierarchickou hladinu otevírat a opět zavírat. Pro práci s tímto rejstříkem je nutné respektovat následující zásady:

Pro abecední seřazení symbolů je používán tzv. Hillův systém, to znamená, že ...

 

 

Sloučeniny neobsahující uhlík mají všechny prvky seřazeny abecedně


 

 

V uhlíkatých sloučeninách je uveden nejdříve uhlík, pak vodík (pokud je přítomen) a teprve pak všechny ostatní prvky v abecedním pořadí


 

Příklad:

 

Mějme za úkol vyhledat informace o sloučenině 2-amino-5-methoxy-benzonitrile (uvědomme si, že musíme pracovat s anglickou nomenklaturou, i když v běžné komunikaci si rozumíme). Sloučenina má následující vzorec:

 

 

Její sumární vzorec je proto C8H8N2O. V rejstříku otevřeném ikonou „Form“ postupně nalezneme následující údaje:

 

 


 

které nás dovedou k Registračnímu číslu 23842-82-2. což je nejvhodnější identifikace pro jakékoliv další vyhledávání informací o této sloučenině.

 

Zcela analogicky postupujeme při vyhledávání anorganických sloučenin, hlavně pro nalezení jejich registračních čísel. V případě sulfurylchloridu se bude jednat jen o správné seřazení sumárního vzorce, tedy Cl2O2S, vyhledání registračního čísla typické soli, fosforečnanu vápenatého, ilustruje následující sled oken v rejstříku sumárních vzorců:

 

 


 

Větší problémy nastávají v případě většiny vícesložkových systémů, tj. solí, komplexů, koordinačních sloučenin, slitin, směsí, polymerů, proteinů, nukleových kyselin a pod.. Pravidlo CAS pro hledání těchto látek v rejstříku sumárních vzorců říká, že ...

 

….kovové soli kyselin, alkoholů a aminů a hydrochloridy, acetáty a podobné soli

bází, jsou uvedeny u vzorců volných látek, od kterých jsou odvozeny.

 

 

Tuto formulaci je nutné vzít doslova a ještě ji poněkud upřesnit. Pravidlo, že soli jsou uvedeny u volných kyselin platí u kyselin organických (acetáty, formiáty a pod.) a anorganických solí s anionty obsahující prvky VI. skupiny (SO42-, PO43- aj.). Tedy síran sodný, uhličitan vápenatý aj budeme hledat pod sumárním vzorcem příslušných volných kyselin, který expandujeme až narazíme na „compounds“. Naproti tomu soli bezkyslíkatých kyselin, jako HCl, HBr, H2S aj.) jsou uvedeny pod úplnými sumárními vzorci, tedy jako ClNa, BrNa, Na2S aj. Totéž platí o anorganických hydroxidech, které najdeme pro HKO, HNaO, CaH2O2 a pod. Jako příklad budiž uvedeno vyhledání fosforečnanu vápennatého, který musíme hledat pod sumárním vzorcem kyseliny fosforečné a „rozbalením“ nabídek u nižších hierarchických hladin (viz obr. 6). Na tomto příkladu je i patrný důvod pro tuto zdánlivou komplikovanost, protože bychom asi poměrně obtížně formulovali jednotlivé formy fosforečnanu vápennatého, jehož všechny známé modifikace včetně krystalických hydrátů nalezneme přehledně seřazené na nejnižší hierarchické hladině, v podobě jejich úplných sumárních vzorců.

 

Organické hydrochloridy, acetáty, sulfáty a pod. najdeme nejenom u příslušných matečných sloučenin (např. hydrochlorid triethylaminu pod „Ethanamine, N,N-diethyl- a příslušnou expanzí.), ale také pod sumárními vzorci volných kyselin, tedy ClH, H2O4S, C2H4O2  aj., kde je nám po otevření nižší úrovně nabídnuta řada matečných sloučenin, jejichž soli pak dále najdeme pod dalším otevřením nižších hladin. Např. hydrochlorid alaninu nalezneme pod ClH a rozbalením nižší hladiny u nabídnutého „Alanine“. Důvod je v tom, že indexová politika CAS se na tyto látky dívá jako na vícesložkové systémy, které jsou uváděny pod každou složkou zvlášť. Praxe registrovat vícesložkové látky, kterých je mimochodem v chemii velké množství, pod sumárními vzorci jednotlivých složek, je v CAS již dlouhou dobu i v tištěných rejstřících zcela běžná a je velice užitečná. Jako příklad budiž uvedeno vyhledání amonné soli  komplexního iontu diaminotetranitrokobaltu(1-) pod sumárním názvem samotného aniontu. Je samozřejmé, že tak snadno najdeme i další látky obsahující tuto složku.

 

 


 

Podobně jednotlivé polymery nalezneme u vzorců monomerů a zcela obecně můžeme vyjádřit pravidlo, že …

 

 

Textové pole: … molekulové sloučeniny, směsi, slitiny a podobné vícesložkové látky musíme hledat pod sumárními vzorci jejich složek a nikoliv pod celkovým sumárním vzorcem celé látky

 

9.  Práce s rejstříkem chemických názvů - ikona „Subst“                             


 

 

Chceme-li použít pro vyhledávání informací o chemických sloučeninách jejich názvy, klikneme na ikonu označenou „Subst“. V podstatě se nám otevře stejný systém jako v předchozím případě sumárních vzorců, jen o jednu úroveň níže. Jediný rozdíl je v tom, že na základě sumárního vzorce si musíme vybrat z názvů přicházejících v daném případě v úvahu, zatímco začínáme-li přímo s názvem, musíme jej spolehlivě znát. Takže např. derivátů kyseliny 2-butenové otevřeme následující sled oken:

 

Textové pole:      -	    Butenoic acid
	-        2-Butenoic acid (MODIFIED)
	       -	     butyl ester (STEREO)
		         (E)-	[591-63-9]

Název Butenoic acid buď spolehlivě známe, nebo se k němu dostaneme přes sumární vzorec (viz předchozí příklady). Podobně v případě solí kyseliny sírové bude postup následující:

 


 

Z uvedených ukázek je dále patrný další rozdíl v použití názvu nebo sumárního vzorce, tedy ikony „Form“ nebo „Subst“. V prvém případě je konečný výsledek určen sumárním vzorce a pokud zadaný sumární vzorec neodpovídá žádnému vzorci s nějakým názvoslovným základem, jeho název se v nabídce neobjeví. Pokud použijeme pro vyhledávání přímo název, můžeme se tak dozvědět o existenci řady dalších (nebo i všech) derivátů nebo substituovaných názvoslovných základů.

 

V řadě předchozích ukázek jsme se již setkali s několika termíny, které se v rejstříkových nabídkách vyskytují. Např. SUBSTITUTED, STEREO apod. Typická situace je na následujícím příkladě:

 

Textové pole: +	Butenoic acid
                2-Butenoic acid  [3724-65-8]	konkrétní sloučenina
     +	     2-Butenoic acid (STEREO)
     +	     2-Butenoic acid (MODIFIED)
     +	     2-Butenoic acid (SUBSTITUTED)
     +	     2-Butenoic-2,4-13C2 acid (SUBSTITUTED)
     	     3-Butenoic acid  [624-38-7]	konkrétní sloučenina
     +	     3-Butenoic acid (MODIFIED)
     +	     3-Butenoic acid (SUBSTITUTED)
     +	     3-Butenoic-2-d acid (SUBSTITUTED)
     +	     3-Butenoic-4-13C acid (SUBSTITUTED)

 

Povšimněme si, že numerický lokant se vyskytuje až na nižší hierarchické úrovni a musíme proto začít s vyhledáváním s prostým názvem bez lokantu. Přitomnost znaku + před názvem značí nižší hierarchickou úroveň, registrační čísla za názvem označují poslední úroveň a tedy konkrétní sloučeninu. Dvojklik na takto označenou úroveň vede přímo k dokumentům, tedy abstraktům, ve kterých se vyskytují informace o té které sloučenině.

 

Označení STEREO a SUSTITUTED jsou evidentní, v prvním případě budou na nižší úrovni jednotlivé stereoisomery, ve druhém případě pak všechny příslušně substituované deriváty, viz např. předchozí ukázku u derivátů benzonitrilu. V praxi může být na nižší úrovni i velmi velké množství substituovaných derivátů. Poměrně srozumitelné je označení MODIFIED. Jsou pod ním uvedeny deriváty matečné sloučeniny, jejichž některá funkce je „modifikována“, např. tvorbou solí nebo typicky esterů. Takže estery kyselin musíme hledat právě až na této hierarchické úrovni, viz ukázka pro butyl ester kyseliny 2-butenové, jehož registrační číslo najdeme pod označením MODIFIED a na poslední úrovni pak pod STEREO.

 

Poslední označení, které se v těchto rejstřících vyskytuje je QUALIFIED. Setkali jsme se s ním např. v ukázce vyhledání solí kyseliny fosforečné a setkáváme se s ním právě u sloučenin často studovaných, resp. od nichž je odvozeno velké množství derivátů. Z tištěné verze je převzata praxe, kdy nashromážděný materiál u frekventovaných sloučenin je rozdělen do tématicky společných skupin, které jsou v tištěných verzích označovány jako „qualifiers“. Typicky jsou to např. skupiny odkazů označených termíny jako …

 

 

Textové pole: „analysis“, „biological studies“, „formation (nonpreparative)“, „miscellaneous“, „occurence“, „preparation“, „processes“, „properties“, „reactions“, „uses“

S podobným cílem, tj. zpřehlednit velké množství rejstříkových odkazů a především seskupit dohromady ty sloučeniny, které k sobě z chemického hlediska logicky patří, byly zavedeny i tzv. „categories“, což jsou v podstatě některé vybrané funkční deriváty. Těch bylo zavedeno celkem patnáct a opět pro danou látku nemusí (zpravidla ani nemohou) být všechny použity.

 

Textové pole: „acetals“, „anhydrides“, „anhydrosulfides“, „compounds“ (adiční sloučeniny, komplexy, směsi a pod.), „derivatives“ (nedostatečně definované nefunční deriváty), „esters“, „ethers“, „hydrazides“, „hydrazones“, „lactones“, „mercaptals“, „mecaptoles“, „oxides“, „oximes“, „polymers“

 

V elektronické verzi se těchto označení používá méně, ale některé jsou důležité. K nejdůležitějším patří nepochybně „compounds“, „derivatives“ a „esters“ u organických sloučenin. Pod těmito hesly totiž musíme hledat tak běžně vyhledávané látky, jako jsou anorganické i organické soli, dále nejrůznější komplexy nebo adiční sloučeniny a v případě organických sloučenin pak estery. Připomeňme ale znovu, že se jedná o praxi již dlouho běžnou v tištěném rejstříku Chemical Substance Index, s tím rozdílem, že v tištěné verzi můžeme mít před očima celý rejstříkový záznam (stránku) najednou, kdežto v elektronické verzi jen tu část, kterou si dokážeme vyvolat na obrazovku.

 

 

10.  Některé další užitečné pokyny pro práci s verzi „CA on CD“

 

 

Primárním výsledkem práce s verzí „CA on CD“ je seznam názvů dokumentů, které odpovídají zadanému dotazu, respektive kombinaci hesel ve formuláři „Search“. Typicky má následující podobu.

 


První číslo je pořadové (v dané ukázce je pořadí záznamů podle četnosti výskytu hesel, což je použito jako měřítko přesnosti vyhledání dokumentu, je možné v nabídce „Preferences“ změnit na pořadí časové, tedy nejnovější záznam jako první), druhé číslo označuje počet výskytů všech zadaných hesel nebo jiných hledaných termínů (např. registračních čísel) v tom kterém abstraktu.

 

Textové pole: Celý text abstraktu otevřeme dvojklikem na jeho název !!!

 

Asi nečastěji se setkáme s úkolem nalezené výsledky uchovat, resp. odejít od počítače s něčím, s čím můžeme dále pracovat. V zásadě je možné nalezené výsledky tisknout nebo ukládat na vhodné paměťové medium. Na horní liště najdeme následující kombinaci tlačítek.

 

 


 

Nabídka na tisk („Print“) na této liště platí pro právě otevřenou obrazovku. Máme-li tedy otevřený výše uvedený seznam názvů dokumentů, vytiskne se tento seznam, jestliže jsme si otevřeli dvojklikem konkrétní abstrakt, vytiskne se tento abstrakt. Poslední dvě tlačítka na liště slouží k přechodu mezi již otevřenými obrazovkami. Zvolíme-li tisk, jsou nám nabídnuty tři možnosti, tj. vytisknou celý záznam abstraktu nebo jen jeho bibliografickou část, nebo bibliografickou část a abstrakt.

 


 

Textové pole: POZOR:  Součástí záznamů abstraktů jsou nejenom všechna použitá předmětová hesla, ale i soupis všech sloučenin, o nichž je v dané práci zmínka. Tyto seznamy mohou být velmi dlouhé a jsou tištěny formátem jedna sloučenina, resp. její registrační číslo – jeden řádek !!!!

 

Přesně totéž  platí i pro ukládání, tedy nabídku tlačítka „Save“. Tedy ukládáme jen to, co je na obrazovce.

 

 

Nejčastěji ale pracujeme tak, že si jednotlivé názvy v seznamu výsledků prohlížíme, ať jen podle názvů nebo otevíráme jednotlivé abstrakty a rozhodujeme se zda se ten který dokument hodí nebo nikoliv. K tomuto výběru slouží následující další řada tlačítek:

 

 


 

Pokud nás nalezený abstrakt zajímá, klikneme na tlačítko „Mark“ a postupujeme k dalšímu odkazu. Stejné tlačítko se objeví při otevření abstraktu, je umístěno uprostřed. Prohlížíme-li seznam, můžeme označit (vybrat) všechny nalezené odkazy tlačítkem „Mark All“ nebo si to rozmyslet a opět všechna označení smazat tlačítkem „Clear“, resp. můžeme smazat označení jen u některých odkazů tlačítkem „Unmark“. Logickým doplňkem této činnosti je pak nabídka na vytištění všech označených abstraktů nebo na jejich uložení na paměťová média. Tedy tlačítky „PrintMk“ a „SaveMk“.

 

Poslední důležitou poznámkou je možnost volby formátu pro ukládání výsledků rešerší. Kliknutím na tlačítko „Save“ nebo „SaveMk“ se otevře standardní okno umožňující především pojmenovat vytvořený soubor odkazů a zvolit médium, na které bude soubor uložen a současně zvolit i formát, ve kterém bude uložen. Rozbalením okna označeného „Uložit jako typ“ jsou nám nabídnuty následující možnosti:

 

Text

Standardní textový formát se znaky ukončení řádek

Tagged Text

Jednotlivé bloky údajů jsou označeny více méně standardními kódy, napr. TI=titul, BI=bibliografické údaje, AN=abstrakt, KW=klíčová slova, IN=indexové údaje

Tabbed Text

Textové úseky odpovídající „taggům“ jsou odděleny znakem pro tabulátor

Comma Text

Jako v předchozím případě, oddělovač je znak pro čárku

Rich Text Files

Univerzální textový formát pro Word.

 

 

Všeobecně lze doporučit používání poslední alternativy, což je vskutku univerzální formát, který se otevře v každé verzi Wordu a je možné jej pak libovolně upravovat. Formáty „Tabbed Text“ a „Comma Text“ se uplatní pokud počítáme s převodem soubory odkazů např. do Exelu.

 

 

 

 

Závěreční upozornění !!!!!!

 

Jak bylo stručně popsáno v úvodním přehledu možností práce s Chemical Abstracts, jak forma zpřístupnění, tak i její konkrétní podoba se v průběhu let vyvíjely, v případě verze „CA on CD“ od r. 1997 až do současnosti, v době přípravy tohoto materiálu tedy do r. 2006. Během této doby pochopitelně docházelo k větším či menším úpravám některých aspektů práce s touto verzí, takže ne vždy platí uvedené postupy vyhledávání ve všech letech. Celková koncepce ale zůstala zachována, takže uživatel by si měl vždy s drobnými odchylkami od toho, co je v tomto materiálu uvedeno, poradit.

 

 

Přejeme úspěšnou práci s Chemical Abstracts ve verzi „CA on CD“