Qué es mapeo automático de términos o “Automatic Term mapping” de PubMed

Cuando escribimos nuestra estrategia en la ventana inicial de PubMed el sistema recuperará los registros en los que encuentre correspondencia con los términos buscados en un proceso denominado mapeo automático de términos (“Automatic Term Mapping” o ATM).

PubMed de manera automática comprueba lo que hemos escrito frente a varios índices en el orden siguiente:

  • Temas (MeSH)
  • Revistas
  • Autores

El primer índice se denomina “MeSH Translation Table“ que incluye los encabezamientos MeSH, Subencabezamientos, Tipos de Publicación, Entry Term (conocidos como sinónimos), los Supplementary Concepts y sinónimos de los Supplementary Concepts.

Si encuentra una correspondencia en este índice “MeSH Translation table” el proceso se detiene y el término es mapeado al término MeSH correspondiente. La busqueda incluirá el MeSH, a lo que se añade la búsqueda de la frase cortada en palabras individuales que es buscada en todos los campos (All Fields). La búsqueda del MeSH incluye los términos jerárquicamente por debajo de él, es decir, hace la denominada búsqueda ampliada o “automatic explosion”.

Si, por ejemplo, escribimos Cancer, PubMed rastrea automáticamente el  término “cancer” y selecciona el término MeSH más apropiado, en este caso  “Neoplasms” y efectúa la búsqueda por él.  Además, PubMed busca el término MeSH “neoplasms” en todos los campos “All Fields”. Por último, PubMed busca el término “cancer”  en todos los campos “All Fields”. De tal forma que la estrategia sería:

“neoplasms”[MeSH Terms] OR “neoplasms”[All Fields] OR “cancer”[All Fields]

Solo hay una excepción, cuando el Supplementary Concepts (sustancias) o encabezamiento MeSH incluye un número o único caracter (e.j., protein c) no es dividido en palabras individuales y es buscado solo como frase en todos los campos (All Fields).

Si los términos son mapeados en la tabla MeSH, el proceso se detiene. Si algún término no es localizado en esta tabla, PubMed pasa a mapear por revistas buscando en la “Journals Translation Table” que incluye el nombre completo de la revista, abreviatura y número ISSN.

Si es encontrada una revista, esta es añadida a la búsqueda. El término también es buscado en todos los campos (All Fields) y el proceso se detiene aquí.

Si, por ejemplo, escribimos en la ventana de búsqueda Oncology reports, PubMed realiza el mapeo y la estrategia aplicada sería la siguiente:

“Oncol Rep”[Journal] OR (“oncology”[All Fields] AND “reports”[All Fields]) OR “oncology reports”[All Fields]

Si no encuentra correspondencia en “MeSH Translation table” ni en “Journals Translation Table” PubMed comprueba los nombres de autor. Si lo encuentra el proceso se detiene aquí.

Si no encuentra correspondencia, PubMed divide la frase en partes y repite el proceso de mapeo automático del término hasta que encuentra una correspondencia. Los términos que no encuentra correspondencia se buscarán en todos los campos (“All Fields”).

Hay que tener en cuenta que podemos evitar y no aplicará el mapeo automático del término:

  • Escribiendo la frase entrecomillada. P. ej.: “kidney allograft”
  • P. ej.: kidney allograft*
  • Cuando buscamos con etiquetas de campo. P. ej.: Cancer[ti]
  • Cuando buscamos desde el “Single citation matcher”.
  • Cuando usamos la búsqueda avanzada.

Pasos para la búsqueda de información en una revisión sistemática (parte II)

En la primera parte vimos cuales los primeros pasos para la búsqueda de información en una revisión sistemática:

  • Si esta es la primera vez que hacemos una revisión sistemática podemos comenzar leyendo el Manual Cochrane de Revisiones Sistemáticas(Parte 2, Capítulo 6).
  • Comprobar si ya existe una revisión anterior o si está en curso.
  • Incorporar a un bibliotecario en el equipo.
  • Confeccionar un protocolo y registrarlo.

Una vez realizados estos preliminares toca el turno de la búsqueda bibliográfica. Lo primero sería hacer una búsqueda preliminar (conocida como scoping search ). Esta primera búsqueda nos ayudará a preparar el proyecto general, entender las preguntas clave, identificar las revisiones sistemáticas existentes, identificar el primer conjunto de estudios primarios potencialmente relevantes y estimar los recursos que van a ser necesarios para realizar la revisión sistemática.

Por lo general, esta búsqueda preliminar se centra en buscar sistemáticamente en fuentes de información preseleccionadas (p. ej.: en Medline con el filtro correspondiente, Cochrane Library, CRD Database, NICE, AHRQ,…) revisiones sistemáticas del tema. Otra posibilidad para esta búsqueda preliminar es aplicar otras técnicas de búsqueda como “snowballing” y “Similar Articles” en PubMed partiendo de un artículo relevante conocido por el equipo. Hay incluso quien recomienda el uso de twitter en esta fase de pre-búsqueda (https://twitter.com/giustini/status/735978949969223680).

En mi experiencia es importante hacer esta primera búsqueda y enviarla al equipo de la revisión para poder recibir su feedback. Además, sirve al bibliotecario para enfocar la búsqueda definitiva generando una lista de términos tras el análisis de los artículos relevantes localizados para su posterior utilización en la estrategia de búsqueda en MEDLINE y en el resto de recursos. Una herramienta muy útil para esto es el Yale MeSH Analizer.

Antes de desarrollar la estrategia de búsqueda debemos partir de una pregunta claramente formulada siguiendo el esquema PICOS (Patient or population / Intervention / Comparison / Outcome / Study design). Los conceptos más importantes serán incluidos en la estrategia de búsqueda. No debemos incluir demasiados conceptos y, en general, la estrategia debe incluir la población, intervención y tipos de diseño de estudio. El resultado o outcome no suele incluirse en la búsqueda. Para desarrollar la estrategia de búsqueda tenemos que utilizar MeSH combinado con texto libre con el operador OR. En esta fase de la búsqueda es importante separar en diferentes líneas la búsqueda con MeSH de la del texto libre. De esta forma evitaremos errores y no nos perderemos entre tantos términos. Para localizar tipos de estudio se debe emplear los filtros de estudio existentes validados y que ya he comentado en biblioGETAFE.

El paso siguiente será la selección de las fuentes de información. La producción de una revisión sistemática requiere la búsqueda sistemática en varias bases de datos bibliográficas. La búsqueda en MEDLINE es insuficiente aunque no existe evidencia de la cantidad de bases de datos en las que se debe buscar. El manual Cochrane menciona MEDLINE, EMBASE y CENTRAL como las tres bases de datos más importantes para estudios primarios.

Los principales recursos de ciencias de la salud son: MEDLINEEmbase / Cochrane Collaboration / CENTRAL / EconLit / Dare / CINAHL / LILACS / IMEMR / Global Health Library /POPLINE / PsycInfo / ERIC / AMED / HEED / Campbell Collaboration / Proquest Central / Scopus / Web of Science /Health Services  Research, …

Si el tema de interés consiste en medicamentos o dispositivos, debemos ponernos en contacto con el laboratorio o el fabricante para localizar estudios no publicados disponibles en sus bases de datos. Para los medicamentos disponemos también de: Drug Information Portal, ChemID Plus, ChemSpiderTOXNET,  DynaMed Plus, Micromedex, AHFS Drug Information, BMJ Best Practice, NICE (UK), SIGN (UK), National Guideline Clearinghouse (USA) (Oday R, Snowden L; Where to find information about drugs;Aust Prescr 2016;39:88-95).

Dependiendo del objetivo de nuestra revisión, bases de datos regionales como MEDES o de temas específicos pueden ser relevantes. Además de las fuentes de ciencias de la salud, algunas revisiones sistemáticas pueden requerir el uso de recursos no sanitarios. Decidir cuáles elegir va a depender tanto del tema de nuestra revisión como de la disponibilidad, coste, …

¿Qué son los filtros de búsqueda?

Los filtros metodológicos o filtros de búsqueda son estrategias de búsquedas que nos ayudan a encontrar artículos de manera eficiente. Son instrumentos cuyos objetivo principal es atenuar el efecto negativo causado por el exceso de información en las bases de datos bibliográficas, reducir al mínimo la obtención de información superflua o redundante, así como elevar el nivel de especificidad o sensibilidad de la búsqueda al máximo posible.

Los filtros son una herramienta para perfeccionar la estrategia de búsqueda y están constituidos por una combinación de términos o descriptores y diseñadas para localizar tipos de estudios determinados. Estas estrategias prediseñadas se han de combinar con el término/s o descriptor/es de lo que deseamos buscar permitiéndonos una recuperación de la información con un alto grado de exactitud.

El primer filtro se creó al observarse limitaciones en la indización de la base de datos MEDLINE para los ensayos clínicos y fue desarrollado por K. Dickersin, R Scherer y Carol Lefebvre en 1993 en Inglaterra y llamado Optimally Sensitised Search Strategy. Por otra parte,  Haynes, Wilczynski,  McKibbon y cols., en la Universidad de McMaster desarrollaron filtros subjetivos para estudios metodológicos.

Desde entonces se han creado diferentes tipos de filtros centradas en diferentes tipos de publicaciones tales como filtros para la recuperación de revisiones sistemáticas, estudios de pronóstico, tratamiento, etiología, diagnóstico, guías de predicción clínica, etc., y han sido desarrollados específicamente para su uso en diferentes bases de datos como MEDLINE, EMBASE, CINAHL y PsycINFO (en sus diferentes interfaces como OVID o PubMed).

En la página del Centre for Reviews and Dissemination (The InterTASC Information Specialists’ Sub-Group Search Filter Resource) podemos encontrar una recopilación de diferentes filtros para diversas bases de datos y plataformas. Este grupo ha anunciado hoy algunos cambios y próximos desarrollos. Entre estos está el cambio de su dirección web. La nueva dirección es
https://sites.google.com/a/york.ac.uk/issg-search-filters-resource/home .
FireShot Screen Capture #532 - 'ISSG Search Filters Resource' - sites_google_com_a_york_ac_uk_issg-search-filters-resource_home

Otro sitio de interés es el Blog de Cindy Schmidt’s: PubMed Search Strategies creado para compartir estrategias de búsqueda en PubMed.

FireShot Screen Capture #531 - 'PubMed Search Strategies' - pubmedsearches_blogspot_com_es

También en BiblioGETAFE hemos ido informando sobre los filtros como en las siguientes entradas:

Problemas de recuperación de ensayos clínicos en MEDLINE

La identificación completa de los ensayos controlados aleatorios es fundamental para la recuperación de toda la evidencia. Sin embargo, las bases de datos como MEDLINE no siempre han tenido una recuperación sencilla de estos artículos. Así RCT (ensayo controlado aleatorio) [pt] (tipo de publicación) se introdujo en 1991 y CCT (ensayo clínico controlado) [ pt] se introdujo en 1995. Por tanto, los ECC anteriores a esta fecha tuvieron que ser clasificados bajo categorías muy amplias, mezclados con otro tipo de estudio. Por este motivo se creó el primer filtro al observarse limitaciones en la indización de la base de datos MEDLINE para los ensayos clínicos. Este filtro, basado en una opinión experta, fue desarrollado por K. Dickersin, R Scherer y Carol Lefebvre y en 1993 en Inglaterra y llamado Optimally Sensitised Search Strategy y posteriormente Cochrane Highly Sensitive Search Strategy para localizar ensayos clínicos aleatorizados en MEDLINE. Esta situación cambió en 1994 para la base de datos EMBASE y en 1995 para MEDLINE tras añadirse nuevos términos de indización.

Desde el año 1994 hasta 2006 la Colaboración Cochrane y Biblioteca Nacional de Estados Unidos de Medicina (NLM) trabajaron juntos para identificar y reetiquetar registros de ensayos controlados aleatorios con RCT [pt]. Durante este tiempo el proyecto de reetiquetado Cochrane se identificaron 39.189 registros de Medline de ensayos controlados aleatorios que no se indexan con RCT [pt] y que fueron transmitidas a la Biblioteca Nacional de Medicina de EE.UU. para el reetiquetado. Desde el año 2006 se ha suspendido este trabajo de reetiquetado y la clasificación de la RCT [pt] en Medline ahora se basa únicamente en la indexación realizada por la Biblioteca Nacional de Medicina de EE.UU.

Se acaba de publicar un artículo en el BMJ en el que analizan los motivos por los que los artículos que son ensayos clínicos no se indexan como tales con la etiqueta de tipo de artículo (“randomised controlled trial[pt]) en MEDLINE. En este trabajo se han identificado al menos 3.000 registros en los ensayos controlados aleatorios, pero no indexados usando RCT [pt] que se ha introducido en Medline entre 2006 y 2011.

Por lo tanto, aquellos que buscan la evidencia basada en ensayos clínicos deben tener en cuenta que ciertos tipos de ensayos clínicos pueden no recuperarse mediante el uso de RCT [pt] para los años desde que el proyecto de reetiquetado ha cesado.  Los editores de revistas y aquellos que revisan las revisiones sistemáticas deben seguir examinando las estrategias de revisión sistemática de búsqueda para garantizar que los autores no se han basado en las búsquedas sencillas tales como que el uso de ECA [pt].