top of page

¿Qué es NLWeb? La tecnología que convierte tu web en un chatbot propio — sin depender de Google ni ChatGPT

  • Foto del escritor: Francisco  Acuna
    Francisco Acuna
  • 4 may
  • 7 Min. de lectura

MICROSOFT BUILD 2025  ·  PROTOCOLO ABIERTO  ·  WEB AGÉNTICA

Microsoft acaba de redefinir cómo los sitios web hablan con sus usuarios y con otros agentes de IA. Esto es lo que necesitas saber para no quedarte atrás.

NLWEB

¿Qué es NLWeb y por qué todo el mundo habla de él?

Imagina que entras a la web de tu restaurante favorito y, en vez de perderte entre menús y pestañas, simplemente escribes: "¿Tienen algo vegano sin gluten para cenar esta noche?" — y la web te responde al instante con opciones reales, con precios y disponibilidad. Eso, exactamente, es lo que hace posible NLWeb.


En mayo de 2025, durante su conferencia anual Microsoft Build, la compañía presentó NLWeb (abreviatura de Natural Language Web): un proyecto de código abierto que permite a cualquier sitio web ofrecer una interfaz conversacional propia, alimentada por inteligencia artificial, sin necesidad de contratar un servicio externo ni construir desde cero una solución de chatbot.


La comparación que hace el propio Microsoft es muy elocuente: así como el protocolo HTML en los años 90 democratizó la creación de páginas web para cualquier persona, NLWeb aspira a democratizar la creación de experiencias conversacionales con IA para cualquier editor web, desde una gran empresa hasta un pequeño blog.

"Así como el HTML hizo que casi cualquiera pudiera crear una página web, queremos que NLWeb permita a cualquier editor crear una experiencia de lenguaje natural inteligente en su sitio." — MICROSOFT, COMUNICADO OFICIAL DE BUILD 2025

No es un producto que debas comprar ni una plataforma de suscripción. Es un estándar abierto, disponible en GitHub, que cualquier desarrollador puede instalar, adaptar y desplegar con los datos y el modelo de IA que prefiera.


Cómo funciona: sin magia, solo lógica

La arquitectura de NLWeb es sorprendentemente sencilla. Toma información que tu web ya tiene publicada (feeds RSS, datos estructurados en formato Schema.org, catálogos en JSON-LD) y los combina con un modelo de lenguaje de gran escala (LLM) de tu elección. El resultado: un sistema capaz de responder preguntas sobre tu contenido en lenguaje completamente natural.


EL FLUJO PASO A PASO

1- Indexación de tu contenido

NLWeb toma tus fuentes de datos existentes (RSS, Schema.org, JSON-LD, CSV) y los procesa introduciéndolos en una base de datos vectorial. Esto permite buscar por significado semántico, no solo por palabras clave exactas.

2- Recepción de la consulta del usuario

El visitante escribe su pregunta en lenguaje natural en el campo de chat de tu sitio. NLWeb analiza si puede responderla directamente o si necesita profundizar más.

3- Búsqueda semántica + enriquecimiento con IA

El sistema recupera los fragmentos de tu contenido más relevantes y se los pasa al modelo de lenguaje (puede ser GPT-4o, Gemini, Claude, DeepSeek, o cualquier otro). El modelo enriquece la respuesta con contexto adicional cuando es útil.

4- Respuesta directa al usuario

El visitante recibe una respuesta precisa, con enlaces a las páginas más relevantes de tu sitio. No busca en Google. No sale de tu web. Interactúa contigo.

Una de sus grandes ventajas técnicas es la compatibilidad con el Model Context Protocol (MCP), el estándar abierto desarrollado originalmente por Anthropic que permite que distintas aplicaciones de IA se comuniquen entre sí. Cada instancia de NLWeb funciona automáticamente como un servidor MCP, lo que significa que tu contenido también puede ser descubierto y consultado por agentes de IA externos — si así lo decides.


  • OS: Funciona en Windows, macOS y Linux sin restricciones de sistema operativo.

  • LLM: Compatible con OpenAI, Gemini, Anthropic Claude, DeepSeek, Mistral y más.

  • DB: Conecta con Milvus, QDrant, Azure AI Search, Snowflake y otras bases de datos vectoriales.

  • {}: Disponible en GitHub. Sin licencias, sin dependencia de ningún proveedor único.


¿Qué cambia en los sitios web? El antes y el después

La web tal como la conocemos está construida para que los usuarios la exploren: hacen clic, navegan, buscan con palabras clave. NLWeb introduce un paradigma diferente: los usuarios preguntan, y la web responde.

CONCEPTO

WEB TRADICIONAL

WEB CON NLWEB

Interacción del usuario

Navegación por clics, buscador de palabras clave

Conversación directa en lenguaje natural

Descubrimiento de contenido

Depende del SEO en Google y otros motores

El propio sitio responde las preguntas sin intermediarios

Implementación de chatbot

Costoso, complejo, depende de plataformas de terceros

Unas pocas líneas de código + tus datos existentes

Accesibilidad para agentes IA

Nula o muy limitada

Nativa, a través del protocolo MCP

Propiedad de los datos

Los datos los indexan terceros (Google, etc.)

Los datos permanecen en tu infraestructura

Un ejemplo concreto que ya mostraron en las demos oficiales: la plataforma de eventos Eventbrite implementó NLWeb para que, cuando alguien pregunta "¿qué eventos hay en Seattle para alguien que viene a una conferencia de tecnología?", el sistema responda directamente con los links más relevantes, personalizados al contexto. Sin redirigir a Google. Sin perder al usuario.


Lo que debes saber si te importa el SEO, el GEO y el AEO

Aquí es donde NLWeb se vuelve especialmente relevante para cualquier persona que gestione un sitio web con objetivos de visibilidad y tráfico.

SEO (SEARCH ENGINE OPTIMIZATION)

El SEO clásico consiste en optimizar tu contenido para que los motores de búsqueda —principalmente Google— lo encuentren y lo posicionen bien. NLWeb no reemplaza el SEO tradicional, pero añade una capa nueva: ahora también necesitas optimizar para que tu propio sitio pueda encontrar y servir ese contenido de forma conversacional. La estructura semántica del contenido (Schema.org, datos estructurados, HTML bien organizado) se vuelve más importante que nunca, porque es exactamente lo que NLWeb consume para alimentar la base de datos vectorial.

GEO (GENERATIVE ENGINE OPTIMIZATION)

El GEO es el nuevo campo que nació con la irrupción de los buscadores generativos como Perplexity, el modo IA de Google o el buscador de ChatGPT. La pregunta ya no es solo "¿aparece mi contenido en los resultados?" sino "¿citan mis respuestas los sistemas de IA cuando responden preguntas?" NLWeb, al funcionar como servidor MCP, hace que tu contenido sea directamente consumible por agentes externos de IA — lo que puede multiplicar tu presencia en este ecosistema generativo sin que el usuario salga de tu sitio.

AEO (ANSWER ENGINE OPTIMIZATION)

El AEO es la optimización para motores de respuesta: sistemas que no muestran listas de links sino que responden directamente a las preguntas del usuario. NLWeb convierte tu propio sitio en un motor de respuestas. Esto significa que debes pensar tu contenido no como colecciones de páginas, sino como un banco de respuestas estructuradas a las preguntas que tu audiencia tiene. Los artículos tipo FAQ, las fichas de producto detalladas, los tutoriales paso a paso y la información local bien estructurada cobran un valor redoblado.


Checklist de preparación para NLWeb

  • Implementa Schema.org en todas tus páginas clave (productos, artículos, eventos, preguntas frecuentes)

  • Publica o actualiza tu feed RSS con metadatos ricos y descripciones completas

  • Estructura tu contenido en formato pregunta-respuesta siempre que sea posible

  • Usa JSON-LD para datos estructurados: es el formato que NLWeb consume más fácilmente

  • Piensa en qué preguntas hace tu audiencia y asegúrate de que tu contenido las responda con claridad

  • Decide qué contenido quieres que sea accesible vía MCP para agentes externos y cuál prefieres mantener privado

  • Si tienes un equipo de desarrollo, explora el repositorio de NLWeb en GitHub y evalúa una implementación piloto


¿Para quién es NLWeb y cuándo conviene adoptarlo?

La respuesta corta: para cualquier sitio que tenga contenido valioso y quiera que sus usuarios lo encuentren y lo aprovechen mejor.

La respuesta más matizada: el potencial de NLWeb varía según el tipo de negocio. Una tienda de comercio electrónico puede usarlo para que sus clientes encuentren el producto exacto que buscan sin navegar entre categorías. Un medio de comunicación puede ofrecer búsqueda periodística conversacional sobre su archivo de noticias. Un portal educativo puede permitir que los estudiantes pregunten por cursos, temarios o materiales de forma directa.

La implementación tiene una barrera técnica baja — el creador del proyecto, R.V. Guha, explicó a The Verge que basta con tomar un feed RSS, introducirlo en una base de datos vectorial y ejecutar el sistema a partir de ahí, sin necesidad de construir índices de búsqueda caros y complejos. Pero sí requiere cierto nivel de desarrollo web. No es un plugin que se activa con un clic, al menos de momento.


La visión a largo plazo: la web agéntica

NLWeb no es solo una herramienta de chatbot. Es la primera pieza de un puzzle mucho más grande que Microsoft llama la "web agéntica": un futuro en el que los agentes de IA no solo responden preguntas de los usuarios, sino que actúan en su nombre — compran, reservan, gestionan — interactuando con los sitios web de forma autónoma y directa.

En ese escenario, NLWeb es el lenguaje común que hablan los sitios web para ser accesibles a esos agentes. Del mismo modo que sin HTML no habría web visual, sin NLWeb (o un protocolo similar) no habrá web agéntica. La empresa de Redmond está apostando a que este protocolo se convierta en el estándar de ese nuevo internet.

"A medida que la web agéntica siga creciendo, NLWeb empoderará a los editores para participar en sus propios términos — asegurando que su web esté lista para interactuar, transaccionar y ser descubierta por otros agentes." — MICROSOFT, FUENTE OFICIAL NLWEB

El ecosistema ya empieza a formarse. Empresas como Eventbrite, O'Reilly Media y otras han sido adoptantes tempranos. A medida que más sitios implementen el protocolo, la red de contenido accesible por agentes de IA crecerá exponencialmente — y quienes lleguen antes estarán mejor posicionados en ese nuevo mapa.


En resumen: lo que no puedes ignorar

NLWeb es una apuesta de Microsoft tan ambiciosa como concreta. No es ciencia ficción ni una promesa vaporosa — ya tiene código, ya tiene repositorio público, ya tiene adoptantes reales. Cambia la lógica de cómo un sitio web sirve a sus usuarios y cómo se hace visible ante la IA.

Si gestionas un sitio web, ahora mismo tu tarea más urgente no es instalar NLWeb (eso vendrá), sino preparar tu contenido para que sea semánticamente rico, bien estructurado y fácil de consumir por sistemas conversacionales. Eso te servirá tanto para el SEO de hoy como para el AEO del mañana.

La web que conocemos tardó décadas en construirse sobre HTML. La web agéntica que viene está empezando a construirse ahora. Y su primer ladrillo se llama NLWeb.


Artículo informativo elaborado con fuentes oficiales de Microsoft Build 2025  ·  Tecnología en constante evolución — verifica actualizaciones en github.com/microsoft/NLWeb

Comentarios


bottom of page