iCurbe News
  • Home
  • AI News
    adopción dispareja de la IA a nivel geográfico y empresarial

    Adopción desigual de IA a nivel geográfico y empresarial en LATAM

    Amazon Olympus IA

    Amazon Olympus IA

    ¿Qué son los agentes de IA?

    ¿Qué son los agentes de IA?

    ChatGPT no te dice la verdad ni está entrenado para ello

    ChatGPT no te dice la verdad ni está entrenado para ello

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    El Futuro ya está aquí (video)

    El Futuro ya está aquí (video)

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

  • Proyectos IA
  • Libros
  • Sobre mi
No Result
View All Result
iCurbe News
  • Home
  • AI News
    adopción dispareja de la IA a nivel geográfico y empresarial

    Adopción desigual de IA a nivel geográfico y empresarial en LATAM

    Amazon Olympus IA

    Amazon Olympus IA

    ¿Qué son los agentes de IA?

    ¿Qué son los agentes de IA?

    ChatGPT no te dice la verdad ni está entrenado para ello

    ChatGPT no te dice la verdad ni está entrenado para ello

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    Gemelos digitales impulsados por IA: explorando el futuro de las relaciones humanas.

    El Futuro ya está aquí (video)

    El Futuro ya está aquí (video)

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    Llama 3.2: Impulsando la Innovación en IA con Modelos Abiertos y Personalizables

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

    LOTUS: Un Framework Innovador para Consultas Semánticas en Bases de Datos

  • Proyectos IA
  • Libros
  • Sobre mi
No Result
View All Result
iCurbe News
No Result
View All Result

La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual

Hector Curbelo Barrios by Hector Curbelo Barrios
junio 12, 2025
in Ciencias de Datos, Columna del Autor, Empresas, Inteligencia Artificial, Sociedad
0
La Revolución de la Recuperación de Información: Cómo Anthropic Resucita a RAG con la Recuperación Contextual
Share on FacebookShare on Twitter
1 0
Read Time:3 Minute, 13 Second

En el mundo de la inteligencia artificial (IA), la recuperación de información es un componente crucial para cualquier sistema que busque proporcionar respuestas precisas y relevantes a las preguntas de los usuarios. Uno de los enfoques más populares para lograr esto es la Recuperación Aumentada de Generación (RAG, por sus siglas en inglés), que combina la recuperación de información con modelos generativos para proporcionar respuestas más precisas.

Sin embargo, en los últimos tiempos, algunos expertos han cuestionado la eficacia de RAG, argumentando que ha alcanzado su límite. Pero Anthropic, una empresa líder en IA, ha presentado una nueva aproximación que podría cambiar el juego: la recuperación contextual.

¿Qué es la Recuperación Contextual?

La recuperación contextual es una técnica que mejora la precisión de la recuperación de información en sistemas RAG. La idea es simple: en lugar de tratar de arreglar el mecanismo de recuperación, se mejora la información que se está recuperando. Anthropic sugiere agregar información contextual relevante a cada fragmento de información antes de almacenarlo.

Por ejemplo, si tenemos un documento que contiene informes financieros de diferentes empresas, la recuperación contextual permitiría agregar información sobre la empresa y el período de tiempo al que se refiere cada fragmento de información. De esta manera, cuando se busca información sobre la empresa «Acme» y su crecimiento en el segundo trimestre de 2023, el sistema puede proporcionar una respuesta precisa.

¿Cómo Funciona la Recuperación Contextual?

La implementación de la recuperación contextual es relativamente sencilla. Anthropic sugiere utilizar un modelo de lenguaje grande (LLM, por sus siglas en inglés) para generar automáticamente la información contextual para cada fragmento de información. El proceso es el siguiente:

  1. Se divide el documento en fragmentos.
  2. Para cada fragmento, se envía tanto el documento completo como el fragmento específico a un LLM.
  3. Se utiliza una solicitud que instruye al LLM para generar una declaración contextual concisa.
  4. Se agrega esta información contextual al fragmento original.
  5. Se generan embeddings y se actualiza el índice de búsqueda.

Beneficios y Resultados

Anthropic ha reportado resultados impresionantes con la recuperación contextual. En sus pruebas, lograron una reducción del 35% en la tasa de errores de recuperación con embeddings contextualizados. Cuando se combinó con búsqueda contextual, la mejora aumentó al 49%.

Además, cuando se agregó un re-ordenador en la parte superior, la tasa de errores de recuperación promedio cayó del 5,7% a apenas el 1,9%. Esto es un avance significativo para lo que básicamente es un paso de preprocesamiento y una ingeniosa ingeniería de solicitudes.

Desafíos y Limitaciones

Aunque la recuperación contextual es prometedora, no está exenta de desafíos. Agregar contexto significa:

  • Fragmentos más grandes: cada fragmento crece en 50-100 tokens, lo que reduce ligeramente la cantidad que se puede ajustar en la ventana de contexto del LLM.
  • Costos de procesamiento: se necesita ejecutar una llamada LLM para cada fragmento durante la indexación.
  • Sobrecarga de almacenamiento: la base de datos de vectores y los índices de búsqueda crecen.

Anthropic estima que el costo de procesamiento único es de aproximadamente $1.02 por millón de tokens. Si bien esto puede parecer pequeño, se suma cuando se trata de millones de documentos.

En resumen

La recuperación contextual es un avance significativo en la recuperación de información. Al asegurarse de que cada fragmento lleve su propio contexto, no estamos luchando contra las limitaciones de los modelos de embeddings o la búsqueda por palabras clave; estamos trabajando con ellos.

Para los desarrolladores que construyen sistemas RAG, esta técnica ofrece una forma relativamente sencilla de mejorar significativamente la precisión de la recuperación. Sí, hay costos y compensaciones, pero para aplicaciones donde la precisión importa, la inversión probablemente vale la pena.

La próxima vez que su sistema RAG devuelva una respuesta vagamente frustrante, recuerde: podría simplemente necesitar ayuda para recordar dónde puso sus claves. La recuperación contextual asegura que cada fragmento venga con su propio mapa de regreso a casa.

Share

Facebook
Twitter
Pinterest
LinkedIn

About Post Author

Hector Curbelo Barrios

hcurbelo@gmail.com
https://www.icurbe.com
Happy
Happy
0 0 %
Sad
Sad
0 0 %
Excited
Excited
0 0 %
Sleepy
Sleepy
0 0 %
Angry
Angry
0 0 %
Surprise
Surprise
0 0 %
Post Views: 379

Comparte esto:

  • Haz clic para compartir en Facebook (Se abre en una ventana nueva) Facebook
  • Haz clic para compartir en X (Se abre en una ventana nueva) X

Me gusta esto:

Me gusta Cargando...

Relacionado

Tags: AnthropicIcurbeInteligencia artificialLLMsRAGsociedad

Related Posts

Mi hija de 10 años sabe programar
Columna del Autor

Mi hija de 10 años sabe programar

Llevo más de 15 años programando y siento que a medida que pasan los años tengo más conocimiento y...

by Hector Curbelo Barrios
octubre 2, 2025
adopción dispareja de la IA a nivel geográfico y empresarial
AI

Adopción desigual de IA a nivel geográfico y empresarial en LATAM

En un reciente artículo de Anthropic, una de las empresas más influyentes en el mundo de la Inteligencia Artificial,...

by Hector Curbelo Barrios
septiembre 19, 2025
La conspiración de “la internet muerta”
Columna del Autor

La conspiración de “la internet muerta”

Sam Altman, director ejecutivo de OpenAI escribió hace poco en X su preocupación sobre el contenido generado automáticamente, según...

by Hector Curbelo Barrios
septiembre 15, 2025
El fiasco de GPT-5 que puede transformar los asistentes de IA
Columna del Autor

El fiasco de GPT-5 que puede transformar los asistentes de IA

Cuando salió GPT-5, muchos pensaron que sería un éxito rotundo. Era más rápido, más preciso y más lógico que...

by Hector Curbelo Barrios
septiembre 8, 2025

Populares

  • Los 5 mejores modelos de texto a voz (TTS) de código abierto

    Los 5 mejores modelos de texto a voz (TTS) de código abierto

    0 shares
    Share 0 Tweet 0
  • One-Shot y Few-Shot Prompting: Potenciando el Uso de LLMs con Ejemplos Mínimos

    0 shares
    Share 0 Tweet 0
  • Los 5 mejores generadores de video AI gratuitos sin marca de agua

    0 shares
    Share 0 Tweet 0
  • Las 5 Técnicas de Ingeniería de Prompts que deberías conocer

    0 shares
    Share 0 Tweet 0
  • Tencent Lanza Hunyuan-A13B: Un Nuevo Modelo de IA de Código Abierto

    0 shares
    Share 0 Tweet 0
iCurbe

© 2025 - Noticias de Inteligencia Artificial.

Navegación

  • Home
  • AI News
  • Proyectos IA
  • Libros
  • Sobre mi

Síguenos

No Result
View All Result
  • Buy JNews
  • Homepage
    • Home – Layout 1
    • Home – Layout 2
    • Home – Layout 3

© 2025 - Noticias de Inteligencia Artificial.

%d