¿Qué es NLWeb? La tecnología que convierte tu web en un chatbot propio — sin depender de Google ni ChatGPT
- Francisco Acuna

- 4 may
- 7 Min. de lectura
MICROSOFT BUILD 2025 · PROTOCOLO ABIERTO · WEB AGÉNTICA
Microsoft acaba de redefinir cómo los sitios web hablan con sus usuarios y con otros agentes de IA. Esto es lo que necesitas saber para no quedarte atrás.

✦
¿Qué es NLWeb y por qué todo el mundo habla de él?
Imagina que entras a la web de tu restaurante favorito y, en vez de perderte entre menús y pestañas, simplemente escribes: "¿Tienen algo vegano sin gluten para cenar esta noche?" — y la web te responde al instante con opciones reales, con precios y disponibilidad. Eso, exactamente, es lo que hace posible NLWeb.
En mayo de 2025, durante su conferencia anual Microsoft Build, la compañía presentó NLWeb (abreviatura de Natural Language Web): un proyecto de código abierto que permite a cualquier sitio web ofrecer una interfaz conversacional propia, alimentada por inteligencia artificial, sin necesidad de contratar un servicio externo ni construir desde cero una solución de chatbot.
La comparación que hace el propio Microsoft es muy elocuente: así como el protocolo HTML en los años 90 democratizó la creación de páginas web para cualquier persona, NLWeb aspira a democratizar la creación de experiencias conversacionales con IA para cualquier editor web, desde una gran empresa hasta un pequeño blog.
"Así como el HTML hizo que casi cualquiera pudiera crear una página web, queremos que NLWeb permita a cualquier editor crear una experiencia de lenguaje natural inteligente en su sitio." — MICROSOFT, COMUNICADO OFICIAL DE BUILD 2025
No es un producto que debas comprar ni una plataforma de suscripción. Es un estándar abierto, disponible en GitHub, que cualquier desarrollador puede instalar, adaptar y desplegar con los datos y el modelo de IA que prefiera.
Cómo funciona: sin magia, solo lógica
La arquitectura de NLWeb es sorprendentemente sencilla. Toma información que tu web ya tiene publicada (feeds RSS, datos estructurados en formato Schema.org, catálogos en JSON-LD) y los combina con un modelo de lenguaje de gran escala (LLM) de tu elección. El resultado: un sistema capaz de responder preguntas sobre tu contenido en lenguaje completamente natural.
EL FLUJO PASO A PASO
1- Indexación de tu contenido
NLWeb toma tus fuentes de datos existentes (RSS, Schema.org, JSON-LD, CSV) y los procesa introduciéndolos en una base de datos vectorial. Esto permite buscar por significado semántico, no solo por palabras clave exactas.
2- Recepción de la consulta del usuario
El visitante escribe su pregunta en lenguaje natural en el campo de chat de tu sitio. NLWeb analiza si puede responderla directamente o si necesita profundizar más.
3- Búsqueda semántica + enriquecimiento con IA
El sistema recupera los fragmentos de tu contenido más relevantes y se los pasa al modelo de lenguaje (puede ser GPT-4o, Gemini, Claude, DeepSeek, o cualquier otro). El modelo enriquece la respuesta con contexto adicional cuando es útil.
4- Respuesta directa al usuario
El visitante recibe una respuesta precisa, con enlaces a las páginas más relevantes de tu sitio. No busca en Google. No sale de tu web. Interactúa contigo.
Una de sus grandes ventajas técnicas es la compatibilidad con el Model Context Protocol (MCP), el estándar abierto desarrollado originalmente por Anthropic que permite que distintas aplicaciones de IA se comuniquen entre sí. Cada instancia de NLWeb funciona automáticamente como un servidor MCP, lo que significa que tu contenido también puede ser descubierto y consultado por agentes de IA externos — si así lo decides.
OS: Funciona en Windows, macOS y Linux sin restricciones de sistema operativo.
LLM: Compatible con OpenAI, Gemini, Anthropic Claude, DeepSeek, Mistral y más.
DB: Conecta con Milvus, QDrant, Azure AI Search, Snowflake y otras bases de datos vectoriales.
{}: Disponible en GitHub. Sin licencias, sin dependencia de ningún proveedor único.
¿Qué cambia en los sitios web? El antes y el después
La web tal como la conocemos está construida para que los usuarios la exploren: hacen clic, navegan, buscan con palabras clave. NLWeb introduce un paradigma diferente: los usuarios preguntan, y la web responde.
CONCEPTO | WEB TRADICIONAL | WEB CON NLWEB |
Interacción del usuario | Navegación por clics, buscador de palabras clave | Conversación directa en lenguaje natural |
Descubrimiento de contenido | Depende del SEO en Google y otros motores | El propio sitio responde las preguntas sin intermediarios |
Implementación de chatbot | Costoso, complejo, depende de plataformas de terceros | Unas pocas líneas de código + tus datos existentes |
Accesibilidad para agentes IA | Nula o muy limitada | Nativa, a través del protocolo MCP |
Propiedad de los datos | Los datos los indexan terceros (Google, etc.) | Los datos permanecen en tu infraestructura |
Un ejemplo concreto que ya mostraron en las demos oficiales: la plataforma de eventos Eventbrite implementó NLWeb para que, cuando alguien pregunta "¿qué eventos hay en Seattle para alguien que viene a una conferencia de tecnología?", el sistema responda directamente con los links más relevantes, personalizados al contexto. Sin redirigir a Google. Sin perder al usuario.
Lo que debes saber si te importa el SEO, el GEO y el AEO
Aquí es donde NLWeb se vuelve especialmente relevante para cualquier persona que gestione un sitio web con objetivos de visibilidad y tráfico.
SEO (SEARCH ENGINE OPTIMIZATION)
El SEO clásico consiste en optimizar tu contenido para que los motores de búsqueda —principalmente Google— lo encuentren y lo posicionen bien. NLWeb no reemplaza el SEO tradicional, pero añade una capa nueva: ahora también necesitas optimizar para que tu propio sitio pueda encontrar y servir ese contenido de forma conversacional. La estructura semántica del contenido (Schema.org, datos estructurados, HTML bien organizado) se vuelve más importante que nunca, porque es exactamente lo que NLWeb consume para alimentar la base de datos vectorial.
GEO (GENERATIVE ENGINE OPTIMIZATION)
El GEO es el nuevo campo que nació con la irrupción de los buscadores generativos como Perplexity, el modo IA de Google o el buscador de ChatGPT. La pregunta ya no es solo "¿aparece mi contenido en los resultados?" sino "¿citan mis respuestas los sistemas de IA cuando responden preguntas?" NLWeb, al funcionar como servidor MCP, hace que tu contenido sea directamente consumible por agentes externos de IA — lo que puede multiplicar tu presencia en este ecosistema generativo sin que el usuario salga de tu sitio.
AEO (ANSWER ENGINE OPTIMIZATION)
El AEO es la optimización para motores de respuesta: sistemas que no muestran listas de links sino que responden directamente a las preguntas del usuario. NLWeb convierte tu propio sitio en un motor de respuestas. Esto significa que debes pensar tu contenido no como colecciones de páginas, sino como un banco de respuestas estructuradas a las preguntas que tu audiencia tiene. Los artículos tipo FAQ, las fichas de producto detalladas, los tutoriales paso a paso y la información local bien estructurada cobran un valor redoblado.
Checklist de preparación para NLWeb
Implementa Schema.org en todas tus páginas clave (productos, artículos, eventos, preguntas frecuentes)
Publica o actualiza tu feed RSS con metadatos ricos y descripciones completas
Estructura tu contenido en formato pregunta-respuesta siempre que sea posible
Usa JSON-LD para datos estructurados: es el formato que NLWeb consume más fácilmente
Piensa en qué preguntas hace tu audiencia y asegúrate de que tu contenido las responda con claridad
Decide qué contenido quieres que sea accesible vía MCP para agentes externos y cuál prefieres mantener privado
Si tienes un equipo de desarrollo, explora el repositorio de NLWeb en GitHub y evalúa una implementación piloto
¿Para quién es NLWeb y cuándo conviene adoptarlo?
La respuesta corta: para cualquier sitio que tenga contenido valioso y quiera que sus usuarios lo encuentren y lo aprovechen mejor.
La respuesta más matizada: el potencial de NLWeb varía según el tipo de negocio. Una tienda de comercio electrónico puede usarlo para que sus clientes encuentren el producto exacto que buscan sin navegar entre categorías. Un medio de comunicación puede ofrecer búsqueda periodística conversacional sobre su archivo de noticias. Un portal educativo puede permitir que los estudiantes pregunten por cursos, temarios o materiales de forma directa.
La implementación tiene una barrera técnica baja — el creador del proyecto, R.V. Guha, explicó a The Verge que basta con tomar un feed RSS, introducirlo en una base de datos vectorial y ejecutar el sistema a partir de ahí, sin necesidad de construir índices de búsqueda caros y complejos. Pero sí requiere cierto nivel de desarrollo web. No es un plugin que se activa con un clic, al menos de momento.
La visión a largo plazo: la web agéntica
NLWeb no es solo una herramienta de chatbot. Es la primera pieza de un puzzle mucho más grande que Microsoft llama la "web agéntica": un futuro en el que los agentes de IA no solo responden preguntas de los usuarios, sino que actúan en su nombre — compran, reservan, gestionan — interactuando con los sitios web de forma autónoma y directa.
En ese escenario, NLWeb es el lenguaje común que hablan los sitios web para ser accesibles a esos agentes. Del mismo modo que sin HTML no habría web visual, sin NLWeb (o un protocolo similar) no habrá web agéntica. La empresa de Redmond está apostando a que este protocolo se convierta en el estándar de ese nuevo internet.
"A medida que la web agéntica siga creciendo, NLWeb empoderará a los editores para participar en sus propios términos — asegurando que su web esté lista para interactuar, transaccionar y ser descubierta por otros agentes." — MICROSOFT, FUENTE OFICIAL NLWEB
El ecosistema ya empieza a formarse. Empresas como Eventbrite, O'Reilly Media y otras han sido adoptantes tempranos. A medida que más sitios implementen el protocolo, la red de contenido accesible por agentes de IA crecerá exponencialmente — y quienes lleguen antes estarán mejor posicionados en ese nuevo mapa.
En resumen: lo que no puedes ignorar
NLWeb es una apuesta de Microsoft tan ambiciosa como concreta. No es ciencia ficción ni una promesa vaporosa — ya tiene código, ya tiene repositorio público, ya tiene adoptantes reales. Cambia la lógica de cómo un sitio web sirve a sus usuarios y cómo se hace visible ante la IA.
Si gestionas un sitio web, ahora mismo tu tarea más urgente no es instalar NLWeb (eso vendrá), sino preparar tu contenido para que sea semánticamente rico, bien estructurado y fácil de consumir por sistemas conversacionales. Eso te servirá tanto para el SEO de hoy como para el AEO del mañana.
La web que conocemos tardó décadas en construirse sobre HTML. La web agéntica que viene está empezando a construirse ahora. Y su primer ladrillo se llama NLWeb.
Artículo informativo elaborado con fuentes oficiales de Microsoft Build 2025 · Tecnología en constante evolución — verifica actualizaciones en github.com/microsoft/NLWeb











Comentarios