Data-mining

Informatie beter vinden, zoeken in Databases

Zoekt en gij zult vinden........

Iedere arts moet deze homepage kennen: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed
Het is de grootste medische database die er bestaat en vrij toegankelijk.
Echter als je niet goed weet hoe je moet zoeken, dan zul je minder vinden.
In dit artikel over data-mining legt de arts Johan Bolhuis hoe hij te werk gaat.

Clipmate

Clipmate

Clipmate

Voor dat je gaat zoeken in PubMed is het handig ervaring te krijgen met het database programma Clipmate. Zie hiervoor op www.clipmate.com
Het is geen must voor het zoeken in PubMed maar ik vind Clipmate reuze handig om alles op te slaan wat ik gelezen heb en boeiend vind. Ik werk hier al meer dan 8 jaar mee en zou het niet willen missen. Het is een eenvoudig programma dat in eerste instantie dient als uitbreiding van je klembord in Windows. Echter in tegenstelling tot het Windows klembord slaat het alles op in een database die je gemakkelijk zelf kan indelen en uitbreiden. Als je iets boeiend leest op internet, in een online krant, op Pubmed of welke tekst dan ook die op je scherm verschijnt, dan kun je het eenvoudig bewaren door het te selecteren en op CTRL C (of kopiëren) te drukken. Later kun je de database opschonen, je kunt er in zoeken en je hebt een hele handige plakfunctie. Op de homepage van Clipmate kun je alle info hierover vinden. De eerste 30 dagen werkt het gratis, daarna moet je eenmalig 29,95 dollar betalen. Klik je op bovenstaande afbeelding (de Banner van Clipmate dan kun je korting krijgen voor de electronische download versie).

Zoeken in Pubmed

Dan nu het zoeken in Pubmed

Je kunt hier eenvoudig zoeken door het intypen van een woord waar je naar zoekt. Bijvoorbeeld Curcuma.Je vind dan (7 sept. 2005) 487 studies. Echter door niet alleen curcuma in te typen, maar
curcuma OR curcumin OR tumeric OR curcuminoid OR curcum* OR curcuma longa
dan vind je al 1680 studies.
Om zeker te weten of je niet nog meer woorden kan intypen kun je deze teksten vluchtig bekijken en dan zie je bijvoorbeeld af en toe het woord curcumol en curcumin maar die hebben we al opgevangen door het ingeven van curcum*

Er zijn artsen die kijken naar de relatie tussen curcuma AND neoplasm en dan vinden ze 79 studies.
Kijk je echter op curcuma AND cancer dan vind je maar liefst 106 studies.
Kijk je naar (curcuma OR curcumin OR tumeric OR curcuminoid OR curcum* OR curcuma longa) AND cancer dan vind je 491 studies

en kijk je naar (curcuma OR curcumin OR tumeric OR curcuminoid OR curcum* OR curcuma longa) AND

(cancer OR tumor OR breast cancer OR prostate cancer OR carcinoma OR chemotherapy OR survival OR colorectal cancer OR metastasis OR lung cancer OR metastatic OR apoptosis OR malignancy OR metastase OR cancer risk OR non small cell carcinoma OR radiotherapy OR tumor cell OR colon cancer OR recurrence free survival OR cancer therapy OR adenocarcinoma OR human cancer OR nsclc OR gastric cancer OR gastric cancer OR neoplasm OR lymph node OR neoplasm* OR squamous OR ovarian cancer OR cancer progression OR oncology OR carcinogenesis OR anticancer OR adjuvant OR neoadjuvant OR cancer development OR tumorigenesis OR apoptotic OR cervical cancer OR tumor growth OR pancreatic cancer OR paclitaxel OR prostate specific OR gemcitabine OR her2 OR radiation OR lymphoma OR cetuximab OR anti cancer OR docetaxel OR tumor suppressor OR cancer survivor OR chemotherapy method OR cancer related OR psa OR tumor progression OR melanoma OR carcinoma OR hepatocellular carcinoma OR irinotecan OR cancer case OR radiation therapy OR carcinoma material OR specific survival OR iressa OR antitumor OR rectal cancer OR node metastasis OR cancer result OR induced apoptosis OR neck cancer OR tumor size OR oxaliplatin OR cisplatin OR leukemia OR neoplasia OR chemopreventive OR bladder cancer OR antiangiogenic OR invasive breast OR neoplastic OR primary tumor OR breast carcinoma OR gleason OR radical prostatectomy OR endometrial cancer OR chemoradiotherapy OR chemoprevention OR metastatic disease OR skin cancer OR capecitabine OR taxane OR cancer incidence OR adjuvant therapy OR gleason score OR adenoma OR palliative OR immunotherapy OR cell lymphoma OR chemoradiation OR prostatectomy OR apoptosis inducing OR adjuvant chemotherapy OR metastatic breast OR tamoxifen OR cancer vaccine OR avastin OR distant metastasis OR cancer research OR thyroid cancer OR ductal carcinoma OR tumor tissue OR 5-fluorouracil OR hodgkin lymphoma OR tumor volume OR cancer susceptibility OR cancer death OR neoadjuvant chemotherapy OR doxorubicin OR glioma OR 5-fu OR breast tumor OR tumor stage OR colorectal carcinoma OR antitumor activity OR myeloid leukemia OR cancer prospective OR sarcoma OR Neoplasm Recurrence, Local OR Adenocarcinoma OR Colorectal Neoplasms OR Carcinoma, Squamous Cell OR Tumor Markers, Biological OR Lymphatic Metastasis OR Carcinoma, Hepatocellular OR Disease-Free Survival OR Neoplasm Proteins OR Cervix Neoplasms OR Melanoma OR Pancreatic Neoplasms OR Carcinoma, Non-Small-Cell Lung OR Colonic Neoplasms OR Kidney Neoplasms OR Bone Neoplasms OR Neoplasm Metastasis OR Carcinoma OR Drug Resistance, Neoplasm OR Adenoma OR Glioma OR Precancerous Conditions OR Lymphoma, Non-Hodgkin OR Multiple Myeloma OR Leukemia, Lymphocytic, Acute OR Sarcoma OR Carcinoma, Renal Cell OR Soft Tissue Neoplasms OR Neuroblastoma OR Hodgkin Disease OR Glioblastoma OR Carcinoma in Situ OR Medical Oncology
)
dan vind je maar liefst 988 studies. Natuurlijk zijn niet al deze studies de moeite waard, maar liever iets meer en dat je zelf kan filteren dan dat je belangrijke studies over het hoofd ziet.

Dus als je alleen zou zoeken op de MESH terms (zoals wordt aanbevolen door de makers van PubMed) vind je 988-79 = 911 studies minder !
Dit enorme verschil komt doordat sommige studies over cancer bijvoorbeeld alleen onder de noemer apoptosis of oxaliplatin of radiotherapy of leukemia worden vermeld.



Data-mining software

De vraag is alleen hoe je het beste komt tot een goede lijst van zoektermen. Je kunt in PubMed in de linker kolom het woord MeSH aanklikken en daar bijvoorbeeld curcuma intypen. Je krijgt dan een opsomming met dit keer maar 1 selectiebox en dan het woord curcuma (PS onderaan het begin scherm van de MeSH staat een tutorial, kort filmpjes die laten zien hoe het werkt). Klik je op het woord curcuma dan krijg je de volgende afbeelding:

Je ziet dan een opsomming van de Entry terms:

Curcuma longa
Tumeric
Turmeric
Curcuma zedoaria
Zedoary zedoaria

en ook de familynaam: Zingiberaceae
Al deze termen kunnen helpen bij het zoeken naar studies over curcuma.

Wil je nog verder zoeken kijk dan eens op Anne O'tate: http://128.248.65.185/cgi-bin/arrowsmith_uic/AnneOTate.cgi

Dan zie je het volgende:

In de linker kolom zie je vervolgens de volgende opsomming:

Terms
Important words
MeSH terms
Recent terms
Authors
Affiliations
Journals
Year
Clustered by topic

Klik hier op en u zult zich verbazen. Ik ben in ieder geval helemaal fan geworden van tante Anne.
Zo leer je sneller de juiste woorden in te typen, je leert welke nieuwe zoektermen erbij zijn gekomen, bij Authors zie je welke auteur het meest heeft gepubliceerd over bijv. Melatonine. En dan zie je dat Lissoni op nummer 9 staat hetgeen me niet verbaasd, maar vooral dat meneer of mevrouw Reiter RJ maar liefst 580 studies over melatonine heeft gepubliceerd. Dat lijkt me iemand om eens mee te gaan e-mailen. Enige nadeel van Anne O'tate is dat je soms flink moet wachten. Mijn advies: doe het 's ochtends en in het weekend dan slaapt Amerika en dat scheelt aanzienlijk in tijd.

Arrowsmith

Overzicht Data-mining software

Op de site http://arrowsmith.psych.uic.edu/arrowsmith_uic/tools.html vinden we een overzicht van veel gebruikte Data-mining software. De handigste vind ik: Arrowsmith. Op de startpagina van Arrowsmith staat meteen een link naar de al bejubelde Anne O'tate.

Arrowsmith is bedoeld voor het zoeken van nieuwe inzichten en verbanden tussen twee onderwerpen door te kijken wat de overeenkomsten zijn (gemene delers) van de beiden onderwerpen. Zie onderstaande afbeelding, het resultaat door in een nieuwe search op Arrowsmith te zoeken naar fish oil and cancer.

(Titel van afbeelding ontbreekt - voeg een titel t

Dit resultaat is ook te vinden door in de startpagina van Arrowsmith te zoeken op #4913

De gevonden lijst met B terms kun je vervolgens via semantics (aanklikken in linker kolom) bijvoorbeeld filteren op immunologic factor. Dan hou je vervolgens een lijst over waarop de software een waarschijnlijkheid aangeeft van mogelijke overeenkomsten (de zogenaamde high-lights.) Hierop kun je weer filteren (je gooit alles behalve de highlights weg) en dan hou je een lijstje over van mogelijke verbanden tussen in dit geval immunologische factoren en visolie en immunologische factoren en kanker.
Al had het niks met kanker te maken, ik vond op deze wijze wel deze interessante studie:

Lupus. 1993 Oct;2(5):319-23.

Fish oil derivatives as a prophylaxis of recurrent miscarriage associated with
antiphospholipid antibodies (APL): a pilot study.

Rossi E, Costa M.

Department of Haematology I, Ospedale S. Martino, Genova, Italy.

Since 1989, 22 patients with persistent antiphospholipid syndrome (PAPS)
associated with recurrent miscarriage (defined as three or more miscarriages)
were treated with fish oil, equivalent to 5.1 g eicosapentaenoic acid (EPA) and
docosahexaenoic acid (DHA) at a ratio of 1.5 EPA to DHA. Twenty-two patients had
23 pregnancies (one patient had two pregnancies) over a period of 3 years. There
was only one intrauterine fetal death at the 27th week associated with
pre-eclampsia. Twenty-one pregnancies, 19 of which ended after the 37th week,
produced a baby. Two pregnancies ended with cesarean section for pre-eclampsia
at 30th and 35th week of gestation and one is ongoing at 32nd week. All babies
are well. The weight at birth of babies delivered at term was always > 2500 g.
These encouraging results favour a therapeutic role, without any adverse
reaction, of fish oil to prevent recurrent miscarriage in PAPS.

Publication Types:
Clinical Trial

PMID: 8305926



Het blijkt dat deze wijze van zoeken vooral van belang is bij onderwerpen waar nog maar heel weinig over bekend is. Ook hier heb je wat geduld nodig.

Tot zover mijn verhaal. Aanvullingen of suggesties zijn van harte welkom. Tenslotte ben ik slechts een auto-didact op dit gebied.

Johan Bolhuis, arts
7 september 2005.


P.S. Je hebt niks aan een uitgebreide database in je computer als je computer crasht en je hebt geen backup. Zorg voor een firewal en een goede virusscanner, bijv. Norton Internet Security en maak geregeld back-ups. Dit kun je doen door bijv. een externe harde schijf (bijv. van Freecom) aan te schaffen en hier regelmatig een kopie van je computers harde schijf op te zetten en ook door je bestanden af en toe weg te branden op een CD of DVD. Ik spreid mijn risico door te werken met een server die middels een RAID 1 configuratie altijd een zogenaamde mirror harde schijf heeft. Als de ene harde schijf uitvalt, neemt de ander het automatisch over en heb je dus geen dataverlies en ik zet regelmatig de bestanden van verschillende computers op de andere door eenvoudig het even weg te schrijven op een USB memory stick (ik heb er een van Kingston: 2 GB) en deze vervolgens weer te kopiëren naar een andere harde schijf.

StartpaginaStudies inzake "Nutritional Oncology"Ledenlijst NGOO