A febbraio 2026 il mondo SEO si è diviso su una domanda apparentemente semplice: conviene creare versioni Markdown delle pagine del tuo sito perché le AI le leggano meglio? Matt Mullenweg, co-fondatore di WordPress, ha proposto di rendere ogni pagina di WordPress.org disponibile in formato Markdown. Una settimana dopo, Cloudflare ha lanciato “Markdown for Agents”, una funzionalità che converte automaticamente l’HTML in Markdown per i crawler AI. La risposta di John Mueller di Google è arrivata in meno di 48 ore, senza mezzi termini: “Converting pages to markdown is such a stupid idea.”
E poi ci sono i dati. Un’analisi di SE Ranking su circa 300.000 domini ha concluso che il file llms.txt non ha effetti misurabili sulle citazioni AI. Chi ha ragione? Vediamo i fatti, le posizioni in campo e cosa ha senso fare in pratica.
Cos’è llms.txt e perché se ne parla
Il file llms.txt è un documento in formato Markdown che si posiziona nella root del sito (tuosito.it/llms.txt) e funziona come una mappa dei contenuti pensata per i modelli AI. Mentre robots.txt dice ai crawler “qui puoi entrare, qui no”, llms.txt dice “queste sono le mie pagine più importanti, in un formato pulito e leggero”. L’idea è nata a settembre 2024 da Jeremy Howard come risposta a un problema concreto: i modelli AI sprecano token (e quindi risorse) per interpretare l’HTML delle pagine web, pieno di menu, script e elementi di interfaccia che non contengono informazione utile.
Il formato è semplice. Un titolo H1 con il nome del sito, un blocco di testo con la descrizione, e poi sezioni H2 con i link alle pagine principali, possibilmente in versione Markdown. L’adozione è stata rapida nel mondo tech: piattaforme di documentazione, aziende SaaS e tool per sviluppatori hanno implementato llms.txt nei mesi successivi. In ambito web generalista, invece, la penetrazione resta bassa: secondo SE Ranking, solo il 10,13% dei circa 300.000 domini analizzati aveva un file llms.txt a novembre 2025.
Le posizioni in campo: chi dice sì, chi dice no
Il dibattito di febbraio 2026 ha messo in luce tre posizioni distinte. Eccole, con i relativi argomenti.
| Posizione | Chi | Argomento principale |
|---|---|---|
| A favore del Markdown | Matt Mullenweg (WordPress), Cloudflare, Dries Buytaert (Drupal) | Riduce i token dell’80%, rende i contenuti più facili da processare per le AI |
| Contrario | John Mueller (Google), Fabrice Canel (Bing), Gary Illyes (Google) | I modelli AI leggono già l’HTML, le versioni separate rischiano divergenza e cloaking |
| Dati neutrali | SE Ranking (studio 300.000 domini) | Nessuna correlazione tra llms.txt e frequenza di citazione nelle risposte AI |
La posizione di Mueller e Google
Mueller ha sollevato tre obiezioni concrete. La prima è che gli LLM sanno già leggere l’HTML, perché ci si sono addestrati fin dall’inizio. La seconda è che creare versioni parallele delle pagine raddoppia il carico di crawling senza benefici dimostrabili. La terza, più sottile, riguarda la divergenza: se mantieni due versioni dello stesso contenuto (HTML per gli utenti, Markdown per i bot), col tempo le differenze si accumulano. In un precedente scambio con Lily Ray, Mueller ha paragonato llms.txt al meta tag keywords, un formato che i motori di ricerca hanno smesso di usare da oltre quindici anni.
Anche Fabrice Canel di Bing ha espresso perplessità simili, con un commento su LinkedIn rivolto direttamente a Lily Ray: “Really want to double crawl load? We’ll crawl anyway to check similarity.” Il messaggio è chiaro: sia Google che Bing valutano le versioni per bot come un rischio operativo, non come un vantaggio.
La posizione di Cloudflare
Cloudflare ha preso la direzione opposta, lanciando il 12 febbraio 2026 la funzionalità Markdown for Agents. Il meccanismo è diverso dalla creazione di pagine Markdown separate. Funziona tramite content negotiation HTTP standard: quando un agente AI invia una richiesta con l’header Accept: text/markdown, Cloudflare intercetta la risposta HTML del server, la converte in Markdown al volo e la restituisce al bot. Nessun URL aggiuntivo, nessuna pagina duplicata.
I numeri sono interessanti. Cloudflare ha misurato che un proprio post del blog consumava 16.180 token in HTML e 3.150 in Markdown: una riduzione dell’80%. Per agenti AI che processano migliaia di pagine, il risparmio è significativo. La funzionalità è disponibile in beta gratuita per i piani Pro, Business ed Enterprise di Cloudflare, e si attiva con un semplice toggle nel pannello di controllo.
C’è un dettaglio che conta: le risposte convertite includono un header Content-Signal che dichiara le politiche d’uso del contenuto (addestramento AI, ricerca, uso agentico). È un livello di controllo più granulare rispetto a robots.txt, anche se per ora dipende dalla volontà dei singoli provider di rispettare questi segnali.
Cosa dicono i dati
L’analisi di SE Ranking su circa 300.000 domini (pubblicata a novembre 2025) resta lo studio più completo disponibile. I risultati sono netti: nessuna correlazione statistica tra la presenza di llms.txt e la frequenza di citazione nelle risposte dei principali LLM. L’analisi ha usato sia metodi statistici tradizionali sia un modello XGBoost, e ha scoperto che rimuovere la variabile llms.txt dal modello ne migliorava la precisione. In altre parole, il file introduceva rumore, non segnale.
Questo non significa che llms.txt sia inutile per sempre. Significa che oggi nessuna piattaforma AI principale lo usa come fattore nelle proprie decisioni di citazione. I modelli si affidano ancora alla qualità del contenuto, all’autorevolezza del dominio e alla struttura della pagina HTML.
La mia posizione: priorità prima di esperimenti
Dopo aver analizzato i dati, le posizioni dei vari attori e le esperienze dirette sui siti che gestisco, la mia conclusione è questa: llms.txt e le versioni Markdown non sono una priorità per le PMI italiane nel 2026. Sono un esperimento a basso costo per chi ha già la SEO di base in ordine.
Il ragionamento è semplice. Se il tuo sito ha ancora heading disordinati, meta description vuoti, pagine lente e nessun dato strutturato, aggiungere llms.txt è come mettere un tappetino nuovo in un’auto con il motore rotto. Le basi della SEO vengono prima di tutto, e sono anche le stesse basi che migliorano la visibilità nelle ricerche AI.
Detto questo, ci sono situazioni in cui vale la pena sperimentare. Se gestisci un sito con molta documentazione di prodotto, guide complete o cataloghi strutturati, e la tua SEO fondamentale è solida, un file llms.txt costa cinque minuti di implementazione e non comporta rischi. Plugin come AIOSEO (nel piano a pagamento) o il plugin gratuito Website LLMs.txt lo generano automaticamente e lo mantengono aggiornato.
Per quanto riguarda Cloudflare Markdown for Agents: se il tuo sito è già su Cloudflare con un piano Pro o superiore, attivarlo non costa nulla e potrebbe dare un vantaggio futuro. Se non usi Cloudflare, non è un motivo sufficiente per migrare.
Checklist: cosa fare e cosa ignorare
Ecco una sintesi pratica per le PMI italiane, in ordine di priorità.
Priorità alta (fai subito): heading gerarchici corretti (H1, H2, H3), meta description compilati, velocità di caricamento sotto i 2,5 secondi, dati strutturati con schema markup, contenuti che rispondono a domande specifiche del tuo target.
Priorità media (fai quando il resto è a posto): registrazione su Bing Webmaster Tools per monitorare la visibilità AI tramite la dashboard AI Performance, configurazione dei crawler AI nel robots.txt con regole granulari per ogni bot.
Priorità bassa (esperimenti): implementazione di llms.txt, attivazione di Cloudflare Markdown for Agents, creazione di llms-full.txt con versioni Markdown complete delle pagine.
Domande frequenti
Cos’è il file llms.txt e a cosa serve?
Il file llms.txt è un documento in formato Markdown posizionato nella root del sito (esempio: tuosito.it/llms.txt) che elenca le pagine più importanti del sito in un formato ottimizzato per i modelli AI. Funziona come una mappa dei contenuti pensata specificamente per gli LLM. A differenza di robots.txt che blocca o permette l’accesso, llms.txt segnala quali contenuti sono più rilevanti.
Google usa llms.txt per il posizionamento?
No. Google non supporta llms.txt e non ha piani per farlo. John Mueller di Google ha paragonato il file al meta tag keywords, un formato che i motori non usano per il ranking. Anche Gary Illyes ha confermato a Search Central Live nel luglio 2025 che Google non supporta llms.txt. I dati confermano questa posizione: un’analisi SE Ranking su 300.000 domini non ha trovato correlazione tra la presenza di llms.txt e la frequenza di citazione nelle risposte AI.
Vale la pena installare llms.txt su un sito WordPress?
Dipende dalle priorità. L’implementazione richiede pochi minuti con plugin come AIOSEO o Website LLMs.txt, e non comporta rischi. Però i dati attuali non mostrano benefici misurabili. Se il tuo sito ha ancora problemi di SEO fondamentale (struttura, contenuti, velocità), quelle attività hanno priorità assoluta. Se la SEO di base è solida e vuoi sperimentare, puoi aggiungere llms.txt come investimento a basso costo per un eventuale futuro supporto da parte delle piattaforme AI.
Cloudflare Markdown for Agents è cloaking?
No, secondo Cloudflare. La funzionalità usa la content negotiation HTTP standard: il server risponde con un formato diverso (Markdown anziché HTML) in base all’header Accept inviato dal client, senza creare URL separati. La distinzione conta: il cloaking mostra contenuti diversi allo stesso URL. La content negotiation serve lo stesso contenuto in formati diversi. Sia Mueller di Google che Canel di Bing hanno espresso perplessità, ma le obiezioni riguardano le pagine Markdown separate, non la content negotiation.
Vuoi capire se il tuo sito è già visibile nelle risposte di ChatGPT, Copilot e Google AI Overviews? Richiedi un audit di visibilità AI: analizzo la tua presenza sulle piattaforme AI e ti dico dove intervenire, partendo dalle basi che contano davvero.



