Cómo funciona el nuevo PubMed: ¿Por qué da resultados diferentes el Legacy vs. nuevo PubMed?

En las entradas anteriores Cómo funciona el nuevo PubMed: Search Details y Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM) ya analizamos la forma de trabajar del nuevo PubMed.

Pero dicho lo anterior, todavía hay un tema que hay que conocer y que explica el motivo de por qué los resultados del PubMed legacy son distintos a los del nuevo PubMed.

Podemos aclarar que no es un solo motivo, son los tres siguientes de la figura 1:

Figura 1. Motivos del resultado diferente en el nuevo vs. antiguo PubMed

El primero de los motivos es que son dos sistemas independientes en los que la indexación se realiza en diferentes momentos, por lo que las adiciones, eliminaciones (por ejemplo, eliminar duplicados) o actualizaciones de registros no surten efecto al mismo tiempo en ambos lugares.

Otra modificación es el funcionamiento del algoritmo de búsqueda. Como vemos, el mapeo automático del término o asignación automática de términos (ATM) se ha aumentado para incluir la ortografías británica y americana, las formas de palabras en singular y plural y otros sinónimos para proporcionar una recuperación de búsqueda más coherente y completa (Figura 2). 

Figura 2. Mejora del algoritmo de búsqueda del nuevo PubMed

Y, por último, el truncamiento ha cambiado incluyendo todas las variaciones del término truncado frente a las primeras 600 variaciones del legacy PubMed. Además, si truncamos una frase debemos conocer que ya no hace la búsqueda por frase por defecto si no que separa los términos y los busca por separado (Figura 3).

Figura 3. Diferencias del truncamiento del legacy vs. nuevo PubMed

Para buscar una frase en el nuevo PubMed que incluya el último término truncado tenemos tres posibilidades:

  • Escribir la frase entre comillas dobles: “breast feed*” 
  • Usar una etiqueta de búsqueda: breast feed*[tiab] 
  • Use un guión: breast-feed*

En la figura 4 podemos ver y analizar los detalles de la búsqueda si escribimos en la venta de búsqueda otitis media treatment y vemos en Details la diferente traducción en el legacy vs. nuevo PubMed.

Figura 4. Ejemplo de detalle de búsqueda de otitis media treatment en legacy vs.nuevo PubMed

En resumen, las mejoras del motor de búsqueda del nuevo PubMed las podemos ver en las figura 5:

Figura 5. Mejoras en la recuperación del nuevo PubMed

¿Estamos preparados para el nuevo PubMed?

El pasado 5 de mayo BiblioMadSalud lanzaba a la primera experiencia de formación online con el título ¿Estamos preparados para el nuevo PubMed?.

Como ya se ha anunciado, el próximo 18 de mayo se hace efectiva la transición al nuevo PubMed. Por lo tanto, es el momento de poner a punto nuestros conocimientos en la nueva versión y familiarizarnos con las novedades.

En este seminario online se revisaron los principales cambios comparando la nueva versión con la legacy (antigua) y se analizaron sus fortalezas y debilidades. 

En resumen, se quiso aportar algo de luz centrándonos en las novedades de las funciones más usadas y aprender colectivamente mediante el planteamiento de los principales problemas que los bibliotecarios hemos detectado en estos últimos meses.

Aquí os dejo el video del webinar que permanecerá el canal de YouTube de BiblioMadSalud.

Grabación del webinar

Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM)

En la entrada Cómo funciona el nuevo PubMed: Search Details mostraba como podemos ver los detalles de nuestra búsqueda y cómo se había modificado esta visualización frente al Legacy PubMed.

En esta nueva entrada vamos a explicar con detalle qué hace PubMed con los términos que nosotros escribimos en su ventana de búsqueda.

Nuevo superalgoritmo de PubMed

La NLM recomiendan a los usuarios de PubMed realizar una búsqueda básica con las siguientes características:

Búsqueda básica recomendada por PubMed

Cuando escribimos nuestra estrategia en la ventana inicial de PubMed siguiendo estas recomendaciones el sistema recuperará los registros en los que encuentre correspondencia con los términos buscados en un proceso denominado mapeo automático de términos (“Automatic Term Mapping” o ATM).

Mediante este proceso los términos ingresados en el cuadro de búsqueda se comparan (en este orden) con una tabla de traducción de Temas (incluyendo MeSH o Encabezamientos de temas médicos), una tabla de traducción de Revistas, el índice de Autor y un índice de Investigador (Colaborador).
Cuando se encuentra una coincidencia para un término o frase en una tabla de traducción, el proceso de mapeo se completa y no continúa a la siguiente tabla de traducción.

Mapeo automático de términos o Automatic Term Mapping (ATM)

El primer índice se denomina “Subject Translation Table“ que incluye:

  • Los encabezamientos MeSH
  • MeSH Subheadings
  • Términos MeSH Entry Terms (See-Reference mappings) para los términos MeSH
  • Tipos de publicación 
  • Pharmacological Actions
  • Términos derivados del Unified Medical Language System (UMLS) que tienen sinónimos equivalentes o variantes léxicas en inglés
  • Supplementary Concepts (sustancias) y sus sinónimos
Subject Translation Table de PubMed

Si encuentra una correspondencia en este índice “MeSH Translation table” el proceso se detiene y el término es mapeado al término MeSH correspondiente. La busqueda incluirá el MeSH, a lo que se añade la búsqueda de la frase cortada en palabras individuales que es buscada en todos los campos (All Fields). La búsqueda del MeSH incluye los términos jerárquicamente por debajo de él, es decir, hace la denominada búsqueda ampliada o “automatic explosion”.

Si, por ejemplo, escribiéramos en la ventana de búsqueda otitis media treatment la estrategia resultante es la que veríamos en Datails tal como en la entrada comenté en la anterior entrada Cómo funciona PubMed: Search Details.

Detalles de búsqueda por otitis media treatment

Si los términos son mapeados en la tabla MeSH, el proceso se detiene. Si algún término no es localizado en esta tabla, PubMed pasa a mapear por revistas buscando en la “Journals Translation Table” que incluye el nombre completo de la revista, abreviatura y número ISSN.

Si es encontrada una revista, esta es añadida a la búsqueda. El término también es buscado en todos los campos (All Fields) y el proceso se detiene aquí.

Si no encuentra correspondencia en “MeSH Translation table” ni en “Journals Translation Table” PubMed comprueba los nombres de autor. Si lo encuentra el proceso se detiene aquí.

Si no encuentra correspondencia, PubMed divide la frase en partes y repite el proceso de mapeo automático del término hasta que encuentra una correspondencia. Los términos que no encuentra correspondencia se buscarán en todos los campos (“All Fields”).

Aquí os dejo un enlace a un pequeño cuestionario para que podáis evaluar vuestros conocimientos del mapeo automático de términos de PubMed

Cómo funciona el nuevo PubMed: Search Details

El próximo 18 de mayo se hace efectiva la transición del legacy (antiguo) al nuevo PubMed. Por lo tanto, hay que poner a punto nuestros conocimientos en la nueva versión y familiarizarnos con las novedades. Y para ello lo primero que tenemos que tener claro es cómo funciona el nuevo PubMed.

¿Cómo funciona el nuevo PubMed?

Pero antes de adentrarnos en cómo funciona es importante conocer dónde ir a ver los detalles de lo que el motor de PubMed hace con los términos que hemos introducido en la ventana de búsqueda.

En el legacy PubMed nos aparecía una ventana de Search Details en la página de resultados de nuestra búsqueda. Esta ventana podíamos verla con más detalles si entrábamos en See more…. Gracias a la nueva pantalla que aparecía éramos capaces de analizar con detalle la “verdadera” estrategia y cómo PubMed había traducido e interpretado nuestros términos de búsqueda. En esta ventana podíamos, además, editar y modificar la estrategia.

En el nuevo PubMed esta ventana ha desaparecido de la página de resultados. Para ver cómo se tradujeron nuestros términos introducidos en la ventana de búsqueda debemos ir a la página de búsquedas avanzadas (Advanced) desde el enlace que aparece debajo de la ventana de búsqueda.

Acceso a página Advanced del nuevo PubMed

Entrando en la página de búsquedas avanzadas veremos el historial de búsqueda. Desde aquí podemos ver, combinar, comparar y descargar nuestras búsquedas previas. Si queremos ver en detalle nuestra estrategia de búsqueda tenemos que acceder a Details.

¿Cómo podemos ver los detalles de nuestra estrategia de búsqueda?

¿Y si queremos editar y modificar nuestra estrategia? Ya no podemos hacerlo directamente como en el Legacy PubMed. En el nuevo PubMed tenemos que escoger en Action la opción de Add to Box y modificarla en esa ventana de búsqueda.

Más novedades MeSH de MEDLINE para la búsqueda de #COVID19

El pasado 17 de febrero y el 3 de abril daba cuenta de las novedades en tesauro MeSH de MEDLINE para actualizarse con Supplementary Concepts relativos al COVID-19.

A estos se han añadido en marzo alguno más de tal forma que ahora tenemos disponibles los siguientes Supplementary Concept Records:

COVID-19

severe acute respiratory syndrome coronavirus 2

spike glycoprotein, COVID-19 virus

COVID-19 diagnostic testing

COVID-19 drug treatment

COVID-19 serotherapy

COVID-19 vaccine

LAMP assay

Más información aquí.

Novedades MeSH de MEDLINE para la búsqueda de COVID-19

El tesauro MeSH de MEDLINE se sigue actualizando con los Supplementary Concepts relativos al COVID-19. En una entrada anterior “Qué son los MeSH Supplementary Concept Records de MEDLINE y nuevo COVID-19” ya di cuenta del nuevo Supplementary Concept “COVID-19“. Ahora han creado tres más:

COVID-19 diagnostic testing

COVID-19 drug treatment

COVID-19 vaccine

Hay que tenerlo en cuenta para actualizar las estrategias de búsqueda que vamos desarrollando y guardando sobre esta enfermedad.

Si quieres saber más de los Supplementary Concepts de MeSH mira la siguiente presentación:

Información obtenida de @Farhad_Cochrane y @angelmones

¿Quieres estar informado de lo publicado en PubMed sobre #COVID-19 y tienes poco tiempo?

Or recomiendo la estupenda  web de @ernestob con artículos de Coronavirus en PubMed actualizada diariamente

https://bit.ly/covid19bibliometria

Además, podemos ver:

─ Valor y link a Altmetric para cada artículo

─ Enlaza web con artículos en inglés y español ordenados por valor top de Altmetric

https://bit.ly/covid19top

Por otro lado os recomiendo LitCovid que es la colección más completa de trabajos de investigación sobre #COVID19 -19 (ver http://go.nature.com/3almd5p).

https://www.ncbi.nlm.nih.gov/research/coronavirus/docsum

También puedes acceder a las últimas publicaciones de la CDC: https://www.coronavirus.gov  y las últimas investigaciones del NIH: https://www.nih.gov/coronavirus.

Os queremos recordar que, como siempre, nos tenéis a vuestra disposición para búsquedas de información en general y obtención de documentos. cualquiera de los recursos virtuales que tenemos disponibles para hacer vuestras peticiones porque estamos teniendo problemas con el correo electrónico y no os atenderíamos con la agilidad necesaria.

Trucos de búsqueda en PubMed

La búsqueda de información viene condicionada por una serie de factores tales como nuestros objetivos, tema de la búsqueda así como tiempo y recursos disponibles.

Por ello, una vez definida nuestra pregunta que ha de contestar nuestra búsqueda de información, lo primero que debemos hacer es seleccionar la fuente de información.

Muchas veces vamos directamente a buscar en PubMed cuando no es la fuente de elección para el tipo de búsqueda que necesitamos llevar a cabo. En otras ocasiones sí lo es y en estos casos nuestra forma de consulta es diferente dependiendo de si queremos unos pocos artículos que van a contestar nuestra pregunta o si vamos a necesitar realizar una búsqueda de todo lo relevante publicado sobre un tema o deseamos reducir el NNR (Numbers Needed to Read).

En la primera de las situaciones hemos de realizar una búsqueda sencilla partiendo de la ventana de búsqueda inicial. Para ello lo recomendable no complicar mucho la estrategia y realizarla al modo “Google”.

En la siguiente presentación hay recomendaciones para este tipo de búsqueda y un ejemplo:

Pero PubMed dispone de funcionalidades que nos van a ayudar a realizar una búsqueda experta. Será útil en el caso de que estemos buscando estudios en búsquedas sistemáticas de la literatura o una búsqueda en la que queramos ahorrar tiempo reduciendo el número absoluto de referencias e incrementando el número de referencias relevantes. Un ejemplo sería el utilizar el tesauro MeSH, las etiquetas de campos de registro y los filtros metodológicos disponibles en Clinical Queries.

En la siguiente presentación vemos los trucos y recomendaciones para cuando queramos llevar a cabo una búsqueda experta.

Y recuerda, si necesitas realizar una búsqueda experta contacta con el bibliotecario/documentalista de ciencias de la salud que sabrá orientarte en todos los pasos metodológicos que este tipo de búsqueda requiere.

Bibliografía:

Campos-Asensio C. Como elaborar una estrategia de búsqueda bibliográfica. Enferm Intensiva. 2018 Oct – Dec;29(4):182-186. doi: 10.1016/j.enfi.2018.09.001. PMID: 30291015.

Novedad PubMed Labs: Accesible el icono de Localizar en Biblioteca

Ahora podemos activar en PubMed Labs la opción para ver el icono de acceso a la biblioteca de dos formas:

  • Si tenemos cuenta personal en My NCBI si, tras iniciar la sesión con nuestra cuenta y contraseña en NCBI Site Preferences seleccionamos en Outside Tool la opción de C17.

Novedad PubMed: Dos formas de buscar revisiones sistemáticas

Como todos los años hace, la NLM ha actualizado su listado de encabezamientos MeSH. Entre las novedades destaca el nuevo tipo de publicación “Systematic Review” que, además, ha aplicado de manera retrospectiva a las referencias de artículos que son revisiones sistemáticas (ver más en MEDLINE Data Changes—2019.

Por otro lado, la estrategia de búsqueda para el filtro de revisión sistemática también se ha actualizado de tal forma que solo recupera revisiones sistemáticas. Hasta ahora, este filtro recuperaba otros tipos de artículos, incluidos meta-análisis, revisiones de ensayos clínicos, medicina basada en la evidencia, guías, etc. En detalle este filtro es el siguiente:

(((systematic review[ti] OR systematic literature review[ti] OR systematic scoping review[ti] OR systematic narrative review[ti] OR systematic qualitative review[ti] OR systematic evidence review[ti] OR systematic quantitative review[ti] OR systematic meta-review[ti] OR systematic critical review[ti] OR systematic mixed studies review[ti] OR systematic mapping review[ti] OR systematic cochrane review[ti] OR systematic search and review[ti] OR systematic integrative review[ti]) NOT comment[pt] NOT (protocol[ti] OR protocols[ti])) NOT MEDLINE [subset]) OR (Cochrane Database Syst Rev[ta] AND review[pt]) OR systematic review[pt]

Por lo tanto, ahora podemos:

  1. Aplicar en nuestra búsqueda el filtro de revisión sistemática, disponible de tres maneras diferentes: en la opción que se encuentra en la barra lateral izquierda; incluyendo a nuestra estrategia de búsqueda “AND systematic[filter]”; o desde la pantalla de PubMed Clinical Queries.
  2. Utilizar “Systematic review[pt]“. Con esta última estrategia recuperaríamos menos referencias, al ser más restrictiva y, además, perder las referencias más recientes que todavía no han pasado por el proceso de indización de MEDLINE así como artículos de revistas que no forman parte de la base de datos MEDLINE pero si están incluidos en PubMed.

Más información aquí.

¿Cómo buscar si un artículo tiene material suplementario?

PubMed Central (PMC) y PubMed ofrecen nuevos filtros de búsqueda para encontrar artículos de revistas con información de datos.
En PubMed podemos buscar citas con datos usando “data[filter]” para buscar artículos con enlaces a datos relacionados en cualquiera de los campos “Secondary Source ID” o “LinkOut—Other Literature Resources” que hay tras el resumen del artículo.

Pero es en PMC donde disponemos de filtros para localizar artículos con diversos tipos de datos asociados:

  • “has suppdata[filter]” para buscar artículos con material complementario asociado.
  • “has data avail[filter]” para buscar artículos que incluyen una disponibilidad de datos o una declaración de accesibilidad de datos.
  • “has data citations[filter]” para buscar artículos que incluyan citas de datos.
  • “has associated data[filter]” para encontrar todos los artículos con cualquier tipo de sección de datos descrita anteriormente.

PMC_ Suppl Data Plos

Además, después de ejecutar una búsqueda en PMC, se puede aplicar rápidamente el filtro disponible en la columna lateral izquierda “Associated Data” para recuperar artículos con cualquier tipo de datos.

PMC associated data.PNG

Por último, para aumentar la visibilidad de las citas de datos, las declaraciones de disponibilidad de datos y los materiales complementarios disponibles en los artículos, el texto del artículo en PMC incluye un cuadro de “Associated Data”.

PMC_Supplementary Data.PNG

Más información aquí.

¿Sabes que en PubMed se indizan revistas fraudulentas?

La National Library of Medicine produce la base de datos MEDLINE y el repositorio de revistas a texto completo PMC (PubMed Central). Desde 1997 el motor de búsqueda PubMed nos permite buscar en MEDLINE de forma gratuita. En la entrada anterior ¿Pero no es lo mismo PubMed que MEDLINE? explicada las diferencias existentes entre ambas y que PubMed no solo es MEDLINE aunque su mayor componente sea este. En el siguiente diagrama de Venn publicado por Andrea Manca y cols. (Manca A, Moher D, Cugusi L, Dvir Z, Deriu F. How predatory journals leak into PubMed. CMAJ. 2018 Sep 4;190(35):E1042-E1045. doi: 10.1503/cmaj.180154. PubMed PMID: 30181150; PubMed Central PMCID: PMC6148641.) podemos ver la diferencia de contenido cuantificada y representada su solapamiento.

PUBMED PMC MEDLINE solapamiento

En este artículo se indican las diferentes políticas de selección de revistas para su inclusión en PMC y MEDLINE que provoca la entrada “por la puerta de atrás” de artículos procedente de revistas fraudulentas a PubMed. A diferencia de la política de selección de revistas en MEDLINE, que es muy estricta, PubMed Central tiene un criterio más relajado y flexible.

Previamente a que una revista se incluya en PMC esta ha de cumplir los siguientes requisitos:

  1. Tener un ISSN debidamente registrado.
  2. Ha de estar dentro del ámbito de PMC, como se describe en la sección “PMC Scope“.
  3. Proporcionar a NLM acceso inmediato al contenido.
  4. Debe de estarse editando al menos 2 años y con un mínimo de 25 artículos (por ejemplo, investigación original o artículos de revisión, informes de casos clínicos) revisados por pares.  en forma final antes de presentar la solicitud.

Después hay un procedimiento de 6 pasos que incluye:

  1. Presentación de la solicitud;
  2. Evaluación inicial de la solicitud donde la NLM comprueba que la revista cumple con los requisitos de solicitud previa mencionados;
  3. Revisión de la calidad científica de la revista;
  4. Evaluación técnica donde el editor envía un conjunto representativo de archivos de muestra, que se evalúan para garantizar que los datos de la revista cumplen con los estándares técnicos de calidad de PMC;
  5. Postproducción, una vez completada la fase de evaluación de datos.
  6. Lanzamiento donde la NLM refrenda el “Participation Agreements and Options” del editor y publica la revista en el sitio público de PMC con la aprobación del editor.La participación continua en PMC requiere que una revista y el editor de la revista sigan cumpliendo con los estándares de calidad de NLM para PMC y la colección de NLM a lo largo del tiempo.

En la página “How to participate in PMC” tenéis descrito todo el proceso de forma detallada.

Sin embargo, Andrea Manca y cols. argumentan que la aplicación de estos requisitos no siempre es uniforme y algunas de las revistas que se indizan en PMC tienen menos de 2 años de antigüedad y menos de 25 artículos (a menudo menos de 10). Para conseguirlo la revista ha de demostrar que al menos cuenta con un autor acreditado en su consejo editorial. Por este motivo, las revistas depredadoras a menudo utilizan la identidad de investigadores acreditados que no saben que se les incluye en el consejo editorial de estas revistas. También, esto explica el número masivo de correos electrónicos spam diarios que reciben muchos investigadores con invitaciones para unirse a un comité editorial de una revista.

Para evitar que revistas fraudulentas o depredadoras se incluyan en PubMed los autores proponen que la National Library of Medicine eleve el nivel para la inclusión de revistas en PubMed y PubMed Central y exigir que todos las revistas candidatas cumplan con los exigentes requisitos de MEDLINE.

 

¿Qué es el nuevo algoritmo Best Match de PubMed?

Best Match es un nuevo algoritmo de búsqueda por relevancia para PubMed implantado en julio de 2017 que aprovecha la inteligencia de los usuarios y la tecnología de aprendizaje automático como una alternativa al orden por fecha que tradicionalmente nos ofrecía PubMed.

pm_best_match_fig1.png

Hasta hace poco de forma predeterminada los resultados se mostraban en orden cronológico inverso. Es decir, los artículos recién publicados primero. Si bien este orden de clasificación es deseable para buscar la información más reciente sobre un tema determinado o para un autor individual, puede no ser adecuado para otros tipos de búsquedas. Esto se agrava pues, como ocurre cuando buscamos en Google, más del 80% de los clics de los usuarios en los resultados de búsqueda ocurren en la primera página. Por lo tanto, para la mayoría de las consultas de PubMed con más de 20 resultados, los usuarios pueden fácilmente pasar por alto los documentos más útiles de la segunda o posteriores páginas.

Best Match se basa en un algoritmo de frecuencia de término ponderado. Incorpora el aprendizaje automático para volver a clasificar los principales artículos devueltos para una mayor relevancia. El algoritmo Best Match se construye con búsquedas pasadas de usuarios y con más de 150 señales de clasificación de relevancia (factores). La mayoría de estas señales se calculan a partir del número de coincidencias entre los términos de búsqueda y el registro de PubMed, mientras que otras son específicas de un registro (por ejemplo, tipo de publicación, año de publicación) o específicas de una búsqueda (por ejemplo, longitud de búsqueda).  journal.pbio.2005343.g002

Dado que generalmente los usuarios que ordenan por este nuevo algoritmo hacen clic en las citas de la primera página PubMed limita la lista de resultados a 10.000 referencias.

Si deseamos utilizar Best Match como nuestro orden predeterminado para los resultados de PubMed podemos cambiar las preferencias de nuestra cuenta de My NCBI .

Si quieres comprender mejor este nuevo algoritmo de PubMed no dejes de leer el artículo siguiente:

Fiorini N, Canese K, Starchenko G, Kireev E, Kim W, Miller V, Osipov M, Kholodov M, Ismagilov R, Mohan S, Ostell J, Lu Z. Best Match: New relevance search for PubMed. PLoS Biol. 2018 Aug 28;16(8):e2005343. doi: 10.1371/journal.pbio.2005343. eCollection 2018 Aug. PubMed PMID: 30153250.

También tienes más información aquí.