L’any 2017, el CEO de NVIDIA Jensen Huang va afirmar en una entrevista: “la IA es menjarà el software”. Ho va fer inspirant-se o homenatjant el títol d’un cèlebre article de Marc Andreessen, publicat al Wall Street Journal sis anys abans, en el qual explicava perquè el software s’estava menjant el món.
Aquests articles formen part de la història recent de la IA i sovint els faig servir per explicar com hem arribat al punt que ens trobem avui. Però al meu article d’avui no parlaré d’això. El que vull repassar són alguns reptes importants que tenim totes les empreses i organitzacions davant la revolució accelerada que està provocant la IA generativa, raonadora i agèntica; i ho faré inspirant-me en el títol d’un recent article publicat pel propi Jensen Huang. Com que ell també és molt partidari dels homenatges, segur que no li sap greu.
La IA és un edifici de 7 plantes
Si mirem els components que formen part de l’estructura tradicional dels sistemes d’informació de les nostres organitzacions, podem veure que bàsicament tenim…
- …aplicacions, orientades a diferents perfils d’usuari i que treballen amb…
- …dades, internes o externes a la nostra organització, i que funcionen sobre…
- …infraestructures, d’emmagatzematge, de xarxa o de còmput, fent servir…
- …xips, dissenyats per executar les operacions matemàtiques consumint…
- …energia, de la forma més eficient possible.
Podríem imaginar que aquests 5 nivells són com 5 plantes d’un edifici en el qual cada planta necessita recolzar-se de forma robusta sobre les inferiors per poder lliurar el valor real a l’usuari a la planta 5.
Doncs bé, com que la IA ho està canviant tot, crec que també està transformant substancialment aquest edifici. De fet, per aprofitar tot el potencial de la IA agèntica, crec que cal construir —encara que sigui mentalment— un nou edifici al costat amb 7 plantes. Dibuixem-lo.

I ara ens podem preguntar: és realment un nou edifici?
Doncs penso que sí, perquè el primer edifici, on viuen les aplicacions deterministes tradicionals, no desapareixerà; el tindrem i l’haurem de mantenir durant molts anys.
D’altra banda, el segon edifici, on viurà la IA agèntica, té uns fonaments bastant diferents. Anem a repassar breument les seves característiques, planta per planta.
1. Energia
Sovint es diu que la IA és, al final, electricitat transformada en càlculs. Sembla una obvietat i podríem pensar que les aplicacions tradicionals també són el mateix. Però hi ha una diferència d’escala tan gran que cal entendre aquest nivell com la base de quelcom nou.
Fa pocs mesos, OpenAI va tancar l’any 2025 operant amb una capacitat energètica de 2 GW per fer funcionar ChatGPT. Aquesta potència equival a 2 centrals nuclears o a les necessitats d’una ciutat com Barcelona. Segons la mateixa empresa, per al 2033 necessitaran 250 GW, equivalents a 250 reactors nuclears. Aquesta xifra representa que una única empresa requerirà més de la meitat de la capacitat instal·lada als 437 reactors que tenim actualment a tot el planeta.
Aquest canvi d’escala, amb implicacions evidents per a la sostenibilitat i la disponibilitat, farà que moltes organitzacions necessitin nou talent per analitzar i optimitzar l’impacte energètic de les seves solucions d’IA. En altres empreses, la decisió estratègica serà clara: delegar en el proveïdor el cost de l’energia via preu per token i concentrar-se en les plantes superiors. Però delegar no significa ignorar; caldrà saber quina energia mou els agents perquè cada cop més clients, reguladors i inversors ho preguntaran. A l’edifici de les aplicacions tradicionals, aquest tema era poc rellevant. Al nou edifici, és prioritari.
2. Xips
Si l’energia és el combustible, els xips són el motor. I en els darrers anys han deixat de ser un component més per convertir-se en el veritable coll d’ampolla de l’economia de la IA. Una sola GPU H100 costa uns 30.000 dòlars i els centres d’entrenament dels models de frontera n’utilitzen desenes o centenars de milers. La demanda supera de llarg l’oferta i, sovint, accedir-hi depèn més de la relació amb el proveïdor que del pressupost disponible. A l’edifici tradicional, els servidors eren un commodity que es comprava per catàleg. Al nou edifici, els xips són un actiu escàs i estratègic.
La categoria, a més, s’ha diversificat: GPUs de propòsit general (les omnipresents NVIDIA), acceleradors propietaris dels hiperescaladors (TPUs de Google, Trainium d’AWS, Maia de Microsoft), xips especialitzats en inferència amb latències extremadament baixes (Groq, Cerebras) i NPUs integrades per executar models petits a mòbils o portàtils. Però tot plegat, depenent d’una cadena de subministrament molt curta: TSMC i Samsung fabricant xips i ASML produint les màquines de litografia EUV. Pura geopolítica.
La bona notícia és que comença a aparèixer una separació saludable entre el silici d’entrenament —caríssim i amb pocs actors— i el silici d’inferència, on l’ecosistema és més obert i competitiu, i que és el que permetrà agents en temps real a cost raonable. I aquí apareix una qüestió que fa pocs anys no era a l’agenda de cap consell d’administració: la sobirania tecnològica. Les organitzacions —i els països— que vulguin tenir capacitat real de decisió al nou edifici de la IA necessitaran incorporar nou talent que avui escasseja: enginyers d’arquitectures i especialistes capaços d’esprémer cada watt i cada cicle del hardware disponible. A l’edifici tradicional, els xips eren una decisió de compra. Al nou edifici, són una decisió de futur.
3. Infraestructura
La planta 3 és la fàbrica que converteix xips i energia en capacitat consumible. Permet, per exemple, que una startup de deu persones tingui accés al mateix poder de còmput que un gran banc, simplement pagant per hora.
Aquí hi trobem els hiperescaladors clàssics, amb serveis com AWS Bedrock, Azure AI Foundry o Google Vertex AI, i les neoclouds especialitzades en IA. Per sobre d’aquests proveïdors s’hi construeixen els clústers d’entrenament, les plataformes d’inferència, les passarel·les d’IA que centralitzen enrutament i polítiques, i tota la disciplina del MLOps/LLMOps: CI/CD, observabilitat, versionat de prompts i avaluació contínua.
Les decisions crítiques en aquesta planta són, sobretot, de governança.
- Quines càrregues de treball poden anar a APIs públiques i quines requereixen desplegament privat a casa nostra?
- En quines regions acceptem operar, especialment quan parlem de dades sensibles o regulades?
- Quin model de sobirania de dades garantim als nostres clients?
- Quines plataformes estandarditzem internament per evitar la proliferació de la shadow AI? Parlo d’aquell fenomen, molt habitual, en què cada equip acaba muntant el seu conjunt d’eines al marge de l’organització, amb tots els riscos de seguretat, cost i compliment que això comporta.
També aquí caldrà nou talent. Al primer edifici, els equips de plataforma saben molt de xarxa, virtualització i contenidors. Al nou edifici, calen perfils que dominin l’orquestració de GPUs, les arquitectures d’inferència distribuïda i l’observabilitat d’agents, capaços d’avaluar-ne el rendiment des de totes les perspectives: cost, latència, qualitat i alineament.
4. Dades
Arribem a la planta on comença a haver-hi diferenciació real. Els models de propòsit general són, en gran mesura, un commodity accessible per API. Però el coneixement propi de cada organització —els contractes, la relació amb els clients, la documentació tècnica, els processos— no ho és, ni ho serà mai.
Al primer edifici ja teníem dades, ben estructurades en bases relacionals, data warehouses i data lakes. Tot això continua sent vàlid. Però el nou edifici demana, a més, saber treballar amb dades no estructurades a gran escala (PDFs, tickets, transcripcions, imatges, àudio…) i convertir-les en quelcom que un model —a la planta superior— pugui entendre i utilitzar de forma fiable, traçable i governada. Apareixen elements nous, com la ingesta i preparació específica per a IA, les bases de dades vectorials que suporten cerca semàntica i RAG, o els grafs de coneixement. Els agents les consumiran de maneres diverses: via RAG, via tool use sobre dades estructurades, amb un fine-tuning lleuger quan el domini ho justifiqui, o via la memòria del propi agent, capitalitzant les converses i decisions passades per millorar les futures.
Però la part més rellevant d’aquesta planta és novament la governança: el catàleg, el llinatge des de la font fins al prompt, la classificació (públic, intern, confidencial, personal), el compliment del RGPD, l’anonimització, etc. Un agent és tan bo i tan segur com les dades a les quals accedeix. La idea clau d’aquesta planta, i segurament de tot l’edifici, és aquesta: l’avantatge competitiu permanent en la IA gairebé mai està en el model; està en les dades pròpies de qualitat, ben governades i ben connectades.
A l’edifici tradicional, les dades són un actiu que es consulta. Al nou edifici, són un actiu que raona amb els agents d’IA i amb nosaltres.
5. Models
Si les dades són la matèria primera, els models són el cervell del nou edifici. I penso que és important entrar en aquesta planta amb una primera idea clau: ja no té sentit parlar de “triar el millor LLM o el millor proveïdor”. El que cal triar és un conjunt de models segons la tasca, cost, latència, privacitat i capacitat de raonament. Tenim:
- Els models de frontera (com Gemini, GPT o Claude), d’altes prestacions, accés per API i habitualment multimodals, combinant text, imatge, àudio i vídeo.
- Els models amb raonament estès, optimitzats per planificar o programar, adequats per als agents que encadenen múltiples passos.
- Els models de pesos oberts (com Mistral, DeepSeek, Qwen o Gemma) que permeten desplegament privat, fine-tuning i sobirania.
- Els models petits (SLMs), ràpids i barats, ideals per a tasques concretes com la classificació, l’extracció o l’enrutament dins d’un agent.
- Un bon grapat de models especialitzats: embeddings, OCR, speech-to-text, generació d’imatge o de codi.
- I els models clàssics de ML —forecasting, detecció d’anomalies, scoring—, que no han desaparegut i conviuen amb els generatius dins dels mateixos agents.
Gestionar bé aquesta planta requerirà triar el model adequat per a cada tasca —no totes necessiten un LLM de frontera—, fer enrutament multimodel per cost i capacitat, i construir avaluacions pròpies basades en els nostres casos d’ús. Els benchmarks públics són orientatius; els únics que realment importen són els que mesuren si el model fa bé la feina que necessito jo a la meva empresa.
Però la decisió arquitectònica més important és una altra: mantenir la independència de models concrets. Els models s’actualitzen cada poc, i el que avui és l’estat de l’art demà serà superat. Cal crear una bona capa d’abstracció que permeti canviar de proveïdor, barrejar models oberts i tancats, i aprofitar cada nova generació sense haver de refer les aplicacions. És, segurament, una de les millors inversions arquitectòniques que es poden fer avui.
6. Aplicacions
Aquesta és la planta on la IA agèntica es fa tangible. És on un model que genera text es converteix en un agent que observa, planifica, actua, aprèn i ret comptes. I cal tenir clar que per dissenyar un sistema agèntic, la major part de la feina —i del valor— està en els components que envolten el model, no en el model mateix.
De forma sintètica, un sistema agèntic modern té vuit peces:
- Una personalitat o persona que defineix la identitat de l’agent: el seu rol, el seu to o els límits del que pot i no pot fer. És, en certa manera, el DNI de l’agent i la primera decisió de disseny.
- Un orquestrador que decideix a cada pas si cal cridar al model, fer servir una eina, demanar confirmació a l’usuari o donar la tasca per acabada (LangGraph, Semantic Kernel, CrewAI, AutoGen…).
- Una memòria multicapa: de curt termini (la conversa en curs), de llarg termini (preferències i fets persistents), episòdica (execucions passades reutilitzables) i semàntica (coneixement estable del domini).
- Un conjunt d’eines que són les “mans” de l’agent —APIs, execució de codi, navegació web—, avui sovint connectades via l’estàndard MCP.
- Un bucle de raonament per dividir objectius en subtasques i replanificar quan quelcom falla. I, quan cal, patrons multiagent amb rols (un investigador, un redactor, un revisor i un coordinador).
- Una interfície que involucra als humans quan cal (human-in-the-loop).
- Una capa d’observabilitat i avaluació amb traces completes de cada execució (prompts, eines cridades, tokens, cost, latència) per assegurar la qualitat.
- Una capa de seguretat, compliment i control on s’assignen a l’agent els permisos i límits (de pressupost i temps), i s’implementen els sistemes d’auditoria o els guarda-rails d’entrada i de sortida.
Al primer edifici, les aplicacions són deterministes: una mateixa entrada produeix sempre la mateixa sortida, i la qualitat es valida amb proves unitàries. Al nou edifici, les aplicacions són probabilístiques: una mateixa entrada pot produir respostes diferents, i la qualitat es mesura estadísticament amb avaluacions contínues. Aquest canvi té implicacions profundes en com es construeix, es prova, es desplega i es mantenen les aplicacions.
Al primer edifici, els equips de desenvolupament dominen els frameworks clàssics, les arquitectures de microserveis i les pràctiques de DevOps. El nou edifici demana, a més, perfils experts en disseny d’agents, orquestració, context engineering, integració via MCP, observabilitat d’agents i seguretat específica de sistemes probabilístics.
A l’edifici tradicional, les aplicacions s’executen. Al nou edifici, les aplicacions decideixen.
7. Casos d’ús
Arribem a la planta més alta, que és probablement l’única que realment li importa al negoci. Totes les plantes anteriors només tenen sentit si es tradueixen en resultats concrets: productivitat, ingressos, satisfacció del client o nous productes. I també és la planta més humana de l’edifici: aquí hi conviuen persones, processos, cultura i gestió del canvi.
Tindrem dos grans tipus de casos d’ús. Els d’IA passiva —xatbots que responen o assisteixen— són enormement útils i sovint els primers que adopta una organització. Els d’IA activa —agents que planifiquen i executen tasques de principi a fi— desplacen el nostre rol humà cap al de supervisors que revisem i aprovem. Requereixen més disseny de processos, permisos i auditoria, però són els que obriran les transformacions més profundes i generaran més valor.
Aquesta nova manera d’interactuar amb la tecnologia demana una nova manera de dissenyar l’experiència d’usuari (UX). Les aplicacions AI-Native no són aplicacions tradicionals amb un xatbot enganxat a la cantonada; són una cosa diferent, amb principis de disseny propis: intenció en lloc de navegació per menús (l’usuari declara el que vol aconseguir, no busca el botó que ho fa); control humà amb capacitat d’aturar, corregir o aprovar pas a pas segons el risc; transparència sobre què farà l’agent i per què; feedback in-context que permet corregir sense trencar el flux; multimodalitat real (text, veu, imatge, documents); interfícies generatives que es construeixen dinàmicament segons la tasca; i reversibilitat de les accions sempre que sigui possible.
Però hi ha un factor diferencial, en aquesta planta, que em sembla encara més important que tots els anteriors. Són els usuaris els que identifiquen, creen i comparteixen els seus propis casos d’ús.
L’època en què un departament de TI dissenyava tots els casos d’ús s’ha acabat. Amb les eines adequades, qualsevol persona pot identificar una tasca repetitiva seva, construir un mini-agent que l’automatitzi i compartir-lo amb altres. Aquest canvi és tan rellevant com el que va suposar el full de càlcul als anys vuitanta: mou la capacitat d’automatitzar feina cap a les persones que millor la coneixen. Perquè això funcioni, l’organització ha de posar tres condicions sobre la taula:
- Una plataforma corporativa segura per crear els casos d’ús, on s’apliquin les característiques, identitat i permisos adequats.
- Un marketplace o un portal intern d’assistents i agents on els casos d’ús útils es descobreixen, es comparteixen i es reutilitzen. L’organització que millor desplega i conrea aquest entorn guanya un avantatge enorme.
- Una governança lleugera que distingeixi entre allò sensible (clients, diners, dades personals), que necessita aprovació formal, i la resta, on convé deixar espai per a l’exploració. Tot plegat acompanyat de formació en pensament agèntic i compartició de bones pràctiques, perquè l’adopció de la IA és, abans que res, un fenomen que s’ha d’instal·lar a la cultura corporativa.
També aquí caldrà nou talent, però d’una mena diferent al de les plantes inferiors. No tant perfils tècnics nous, sinó persones de negoci capaces de pensar agènticament: descomposant processos, definint objectius clars, dissenyant fluxos amb supervisió humana, mesurant resultats i iterant. Caldran també caps de producte d’IA, dissenyadors UX AI-Native i figures noves com els AI Champions que traccionaran a la resta de l’organització.
A l’edifici tradicional, els casos d’ús els especificava el negoci i els implementava TI. Al nou edifici, els casos d’ús els descobreixen, prototipen i comparteixen les pròpies persones que fan la feina.
I ara, com fem servir aquest edifici?
El nou edifici de 7 plantes no és només una metàfora descriptiva. L’objectiu d’aquest article és crear una eina de reflexió i de decisió que permeti a qualsevol Comitè de Direcció respondre quatre preguntes, en ordre.
- En quina planta competim realment? Per a la gran majoria d’empreses, les plantes 1, 2 i 5 no són el terreny de joc; són un cost delegat en els proveïdors. Les infraestructures (planta 3) tampoc són l’espai on competir per a molts, però en alguns casos, quan la sobirania o la confidencialitat ho exigeixin, caldrà assumir-ne la gestió interna.
- On tenim avantatge diferencial? En les dades pròpies (planta 4), en els casos d’ús específics del nostre negoci (planta 7) i en l’habilitat amb què connectem les dues coses a través dels agents (planta 6). Aquesta serà la “salsa secreta” del nostre negoci i és on hem de centrar els esforços.
- Què estem delegant i en qui? Energia, al sistema. Infraestructura i models, a proveïdors de referència (amb una estratègia multimodel). Però mai les dades ni els casos d’ús: això es queda a casa i no es delega. Només ens caldrà talent intern i extern, amb experts de confiança que ens acompanyin.
- Estem gestionant bé els riscos? Com hem vist, el nou edifici requereix aquest nou talent que acabem de comentar, i també implica nous riscos que cal gestionar, des de la sostenibilitat energètica de la planta 1 fins a problemes de seguretat o ètica als casos d’ús de la planta 7. Novament, caldrà acompanyar-nos d’experts de confiança per fer-hi front.
Perquè en resum, la idea que m’agradaria transmetre és aquesta:
La IA és un edifici de 7 plantes; les de baix es compren, les del mig es dissenyen seguint les recomanacions dels experts i les de dalt es desenvolupen a mida amb les persones de l’organització. El valor està a les plantes altes, però sense fonaments sòlids no s’aguantaran.
I, sobretot, cap edifici s’aixeca sol. Només s’aixeca ajuntant persones que saben construir-lo amb persones que vulguin viure-hi.