iCurbe News
  • Home
  • AI News
    Amazon Olympus IA

    Amazon Olympus IA

    ¿Qué son los agentes de IA?

    ¿Qué son los agentes de IA?

    ChatGPT no te dice la verdad ni está entrenado para ello

    ChatGPT no te dice la verdad ni está entrenado para ello

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    El Futuro ya está aquí (video)

    El Futuro ya está aquí (video)

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    Ya está aquí OpenAI o1 «Strawberry» el nuevo modelo de OpenAI (video).

    Ya está aquí OpenAI o1 «Strawberry» el nuevo modelo de OpenAI (video).

  • Proyectos
  • Ciencias de Datos
    SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos

    SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos

    La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

    La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    ¿Qué es Graph RAG?

    ¿Qué es Graph RAG?

    La Sinergia entre Ciencia de Datos e Inteligencia Artificial

    La Sinergia entre Ciencia de Datos e Inteligencia Artificial

No Result
View All Result
iCurbe News
  • Home
  • AI News
    Amazon Olympus IA

    Amazon Olympus IA

    ¿Qué son los agentes de IA?

    ¿Qué son los agentes de IA?

    ChatGPT no te dice la verdad ni está entrenado para ello

    ChatGPT no te dice la verdad ni está entrenado para ello

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    El Futuro ya está aquí (video)

    El Futuro ya está aquí (video)

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    Ya está aquí OpenAI o1 «Strawberry» el nuevo modelo de OpenAI (video).

    Ya está aquí OpenAI o1 «Strawberry» el nuevo modelo de OpenAI (video).

  • Proyectos
  • Ciencias de Datos
    SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos

    SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos

    La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

    La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    ¿Qué es Graph RAG?

    ¿Qué es Graph RAG?

    La Sinergia entre Ciencia de Datos e Inteligencia Artificial

    La Sinergia entre Ciencia de Datos e Inteligencia Artificial

No Result
View All Result
iCurbe News
No Result
View All Result

La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

Hector Curbelo Barrios by Hector Curbelo Barrios
junio 12, 2025
in Ciencias de Datos, Columna del Autor, Empresas, Inteligencia Artificial, Sociedad
0
La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual
Share on FacebookShare on Twitter
1 0
Read Time:3 Minute, 13 Second

En el mundo de la inteligencia artificial (IA), la recuperación de información es un componente crucial para cualquier sistema que busque proporcionar respuestas precisas y relevantes a las preguntas de los usuarios. Uno de los enfoques más populares para lograr esto es la Recuperación Aumentada de Generación (RAG, por sus siglas en inglés), que combina la recuperación de información con modelos generativos para proporcionar respuestas más precisas.

Sin embargo, en los últimos tiempos, algunos expertos han cuestionado la eficacia de RAG, argumentando que ha alcanzado su límite. Pero Anthropic, una empresa líder en IA, ha presentado una nueva aproximación que podría cambiar el juego: la recuperación contextual.

¿Qué es la Recuperación Contextual?

La recuperación contextual es una técnica que mejora la precisión de la recuperación de información en sistemas RAG. La idea es simple: en lugar de tratar de arreglar el mecanismo de recuperación, se mejora la información que se está recuperando. Anthropic sugiere agregar información contextual relevante a cada fragmento de información antes de almacenarlo.

Por ejemplo, si tenemos un documento que contiene informes financieros de diferentes empresas, la recuperación contextual permitiría agregar información sobre la empresa y el período de tiempo al que se refiere cada fragmento de información. De esta manera, cuando se busca información sobre la empresa «Acme» y su crecimiento en el segundo trimestre de 2023, el sistema puede proporcionar una respuesta precisa.

¿Cómo Funciona la Recuperación Contextual?

La implementación de la recuperación contextual es relativamente sencilla. Anthropic sugiere utilizar un modelo de lenguaje grande (LLM, por sus siglas en inglés) para generar automáticamente la información contextual para cada fragmento de información. El proceso es el siguiente:

  1. Se divide el documento en fragmentos.
  2. Para cada fragmento, se envía tanto el documento completo como el fragmento específico a un LLM.
  3. Se utiliza una solicitud que instruye al LLM para generar una declaración contextual concisa.
  4. Se agrega esta información contextual al fragmento original.
  5. Se generan embeddings y se actualiza el índice de búsqueda.

Beneficios y Resultados

Anthropic ha reportado resultados impresionantes con la recuperación contextual. En sus pruebas, lograron una reducción del 35% en la tasa de errores de recuperación con embeddings contextualizados. Cuando se combinó con búsqueda contextual, la mejora aumentó al 49%.

Además, cuando se agregó un re-ordenador en la parte superior, la tasa de errores de recuperación promedio cayó del 5,7% a apenas el 1,9%. Esto es un avance significativo para lo que básicamente es un paso de preprocesamiento y una ingeniosa ingeniería de solicitudes.

Desafíos y Limitaciones

Aunque la recuperación contextual es prometedora, no está exenta de desafíos. Agregar contexto significa:

  • Fragmentos más grandes: cada fragmento crece en 50-100 tokens, lo que reduce ligeramente la cantidad que se puede ajustar en la ventana de contexto del LLM.
  • Costos de procesamiento: se necesita ejecutar una llamada LLM para cada fragmento durante la indexación.
  • Sobrecarga de almacenamiento: la base de datos de vectores y los índices de búsqueda crecen.

Anthropic estima que el costo de procesamiento único es de aproximadamente $1.02 por millón de tokens. Si bien esto puede parecer pequeño, se suma cuando se trata de millones de documentos.

En resumen

La recuperación contextual es un avance significativo en la recuperación de información. Al asegurarse de que cada fragmento lleve su propio contexto, no estamos luchando contra las limitaciones de los modelos de embeddings o la búsqueda por palabras clave; estamos trabajando con ellos.

Para los desarrolladores que construyen sistemas RAG, esta técnica ofrece una forma relativamente sencilla de mejorar significativamente la precisión de la recuperación. Sí, hay costos y compensaciones, pero para aplicaciones donde la precisión importa, la inversión probablemente vale la pena.

La próxima vez que su sistema RAG devuelva una respuesta vagamente frustrante, recuerde: podría simplemente necesitar ayuda para recordar dónde puso sus claves. La recuperación contextual asegura que cada fragmento venga con su propio mapa de regreso a casa.

Share

Facebook
Twitter
Pinterest
LinkedIn

About Post Author

Hector Curbelo Barrios

hcurbelo@gmail.com
https://www.icurbe.com
Happy
Happy
0 0 %
Sad
Sad
0 0 %
Excited
Excited
0 0 %
Sleepy
Sleepy
0 0 %
Angry
Angry
0 0 %
Surprise
Surprise
0 0 %
Post Views: 214

Comparte esto:

  • Haz clic para compartir en Facebook (Se abre en una ventana nueva) Facebook
  • Haz clic para compartir en X (Se abre en una ventana nueva) X

Me gusta esto:

Me gusta Cargando...
Tags: AnthropicIcurbeInteligencia artificialLLMsRAGsociedad

Related Posts

Cómo una simple frase sobre gatos puede engañar a la inteligencia artificial
Inteligencia Artificial

Cómo una simple frase sobre gatos puede engañar a la inteligencia artificial

La inteligencia artificial (IA) es una de las tecnologías más avanzadas creadas por el ser humano, capaz de realizar...

by Editor iCurbe News
julio 7, 2025
Tencent Lanza Hunyuan-A13B: Un Nuevo Modelo de IA de Código Abierto
Empresas

Tencent Lanza Hunyuan-A13B: Un Nuevo Modelo de IA de Código Abierto

En el dinámico mundo de la inteligencia artificial, Tencent, una de las empresas tecnológicas más influyentes de China, ha...

by Editor iCurbe News
junio 30, 2025
Google presenta VideoPrism, un modelo de inteligencia artificial revolucionario para la comprensión de videos
Empresas

Google presenta VideoPrism, un modelo de inteligencia artificial revolucionario para la comprensión de videos

Google ha lanzado un nuevo modelo de inteligencia artificial llamado VideoPrism, diseñado para mejorar significativamente la comprensión de videos....

by Hector Curbelo Barrios
junio 25, 2025
SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos
Ciencias de Datos

SEAL: La Revolución de los Modelos de Lenguaje Auto-Adaptativos

Imagina por un momento que cada vez que quisieras aprender algo nuevo, tuvieras que borrar completamente todo tu conocimiento...

by Hector Curbelo Barrios
junio 23, 2025

Populares

  • Los 5 mejores modelos de texto a voz (TTS) de código abierto

    Los 5 mejores modelos de texto a voz (TTS) de código abierto

    0 shares
    Share 0 Tweet 0
  • One-Shot y Few-Shot Prompting: Potenciando el Uso de LLMs con Ejemplos Mínimos

    0 shares
    Share 0 Tweet 0
  • Los 5 mejores generadores de video AI gratuitos sin marca de agua

    0 shares
    Share 0 Tweet 0
  • Tencent Lanza Hunyuan-A13B: Un Nuevo Modelo de IA de Código Abierto

    0 shares
    Share 0 Tweet 0
  • Así es Llama 4, la nueva generación de IA que entiende texto, imágenes y más

    0 shares
    Share 0 Tweet 0
iCurbe

© 2025 - Noticias de Inteligencia Artificial.

Navegación

  • Home
  • AI News
  • Proyectos
  • Ciencias de Datos

Síguenos

No Result
View All Result
  • Buy JNews
  • Homepage
    • Home – Layout 1
    • Home – Layout 2
    • Home – Layout 3

© 2025 - Noticias de Inteligencia Artificial.

%d