Google ha sido a lo largo de años el enorme dominador en el desarrollo de sistemas de inteligencia artificial (IA). A ello ha contribuido indudablemente la adquisición en dos mil catorce de DeepMind, la startup londinense centrada en la investigación en IA que desarrolló un programa, AlphaGo, capaz de derrotar a un enorme vencedor de Go, el complejo juego de tablero asiático, y abrir el discute sobre si las capacidades de esta tecnología terminarían superando a la psique humana.

Pero el plácido dominio de Google se vio interrumpido el año pasado por otra startup, en un caso así OpenAI. El lanzamiento de ChatGPT, la aplicación más triunfante de la historia, cogió con el pie alterado a las grandes tecnológicas, que se vieron forzadas a apresurar sus programas de IA. En abril del año en curso, DeepMind, que hasta ese momento había funcionado como un laboratorio de investigación parcialmente independiente, y Google Brain, la otra gran división de investigación de la tecnológica, se fusionaron en una organización, Google DeepMind, en la que trabajan múltiples de los mejores científicos del planeta en esta disciplina.

Colin Murdoch (Glasgow, cuarenta y cinco años) es el directivo de negocio de esta nueva superdivisión de IA de Google que termina de presentar su primer juguete: Gemini, una plataforma de IA generativa multimodal que puede procesar y producir texto, código, imágenes, audio y vídeo desde diferentes fuentes de datos. Quienes la han utilizado afirman que supera sobradamente la última versión de ChatGPT y que vuelve a poner a Google en la riña por dominar este mercado.

Ingeniero electrónico e informático de capacitación, Murdoch fichó por DeepMind hace 9 años, tras amontonar experiencia en la administración de start-ups y grandes corporaciones. Su trabajo consiste en hacer que los avances en IA cosechados por el equipo científico de Google terminen repercutiendo en el enorme público. Atiende a Forbes Hispano desde Londres por video llamada.

Pregunta. ¿Es Gemini la contestación terminante a ChatGPT? ¿Qué aporta nuevamente con respecto a la popular aplicación de OpenAI?

Respuesta. Gemini es un avance significativo en el desarrollo de la IA. Es nuestro modelo más grande y capaz hasta la fecha: comprende y razona texto, imágenes, audio, vídeo y código, por lo que puede asistir a la gente a ser más creativa o a aprender. Por ejemplo, pongamos que tu hijo te trae a casa deberes de física y precisa ayuda para comprender lo que ha hecho bien y mal. Si le haces una fotografía a la hoja, Gemini no solamente te daría la contestación adecuada al inconveniente, sino leería la letra y explicaría lo que el pequeño ha hecho bien, lo que ha hecho mal y los conceptos latentes. Los usuarios asimismo pueden interaccionar con Gemini mediante Bard, que ahora marcha con Gemini Pro y es más eficiente para entender, resumir, razonar, codificar y planear. Ya está libre en inglés en más de ciento setenta países y, en los próximos meses, lo va a estar para miles y miles de millones de personas mediante otros productos básicos de Google como Search, Ads, Chrome y Duet AI. En un largo plazo, herramientas como Gemini convertirán la manera en que miles y miles de millones de personas viven y trabajan en el mundo entero.

P. ¿Qué opina del revuelo ocasionado por la salida y siguiente reincorporación de Sam Altman como consejero encargado de OpenAI?

R. Fueron unos días bien interesantes en la industria. Pero proseguimos centrados en nuestro trabajo de lanzar productos e investigación de primera clase. Hemos tenido unos meses impresionantemente ajetreado: desde el anuncio de Lyria, nuestro modelo avanzado de generación de música por IA, que va a aumentar la inventiva y producirá nuevas formas de innovación para artistas, autores y entusiastas en el futuro, hasta la publicación de GraphCast, nuestro sistema de previsión meteorológica de nueva generación, y de Gemini. Tenemos mucha confianza en nuestra cartera tecnológica y estamos encantados con el año que tenemos por delante.

P. ¿De qué es capaz la inteligencia artificial ahora?

R. Nuestro laboratorio de investigación busca progresar la vida de la gente, y creo que la IA es buena herramienta para esto. Siempre y cuando se trabaje de manera cuidadosa, cosa que está en el ADN de DeepMind. Una de las áreas que más me emocionan es lo que llamamos ciencia a velocidad digital: que la IA asista a avanzar en el progreso científico. Le voy a dar un caso. Las proteínas son los componentes básicos de las células. Cuando marchan mal, pueden crear problemas o enfermedades. Así que la ciencia lleva años estudiando la estructura de las proteínas, en concreto la manera de esas estructuras, que es lo que verdaderamente nos afirma de qué forma marchan. El número de formas que pueden adquirir estas estructuras supera al de átomos que hay en el cosmos. Pues bien, hace un par de años, un equipo de DeepMind consiguió desarrollar un modelo algorítmico, AlphaFold, capaz de determinar la estructura y la apariencia de los aminoácidos, el factor esencial de las proteínas. Sabemos la estructura de doscientos millones de proteínas, y hemos liberado ese conocimiento. Se está empleando nuestra herramienta para apresurar la investigación sobre métodos para combatir la resistencia de los antibióticos. También se está utilizando para apresurar la investigación sobre enzimas que coman plástico en los océanos. Y en la investigación de vacunas para el cáncer.

P. ¿Han conseguido avances en otras áreas?

R. Tenemos esperanzas de que haya avances con la fusión nuclear, la fuente de energía más limpia que existe. Para conseguirla, se hace circular plasma por superconductores a altas velocidades, unas diez vueltas por segundo. Se utilizan imanes para reducir la fricción del plasma en los cilindros. Nosotros estamos utilizando IA para intentar optimar, en tiempo real, el calibrado de esos imanes a fin de que la resistencia sea la menor posible.

R. Llevamos un buen tiempo trabajando en IA generativa. De hecho, los modelos que ahora triunfan están basados en una arquitectura llamada Transformer que desarrollaron científicos de Google hace ahora 5 años. Lo que ha pasado en los últimos doce o dieciocho meses es que las cosas han escalado de forma muy rápida: tenemos modelos más grandes y más datos. El cambio esencial es que nos podemos relacionar con esos modelos con un lenguaje usual, como el que hablamos y ahora, y eso lo hace más alcanzable. Antes, solo podían relacionarse con esa tecnología los informáticos; ahora, cualquiera que sepa charlar y redactar.

La IA es poderosísima y prometedora, mas debemos tener mucho cuidado por el hecho de que se trata de una tecnología muy potente

P. Ha citado la relevancia de llevar cuidado al desarrollar IA. ¿Qué género de reglas siguen?

R. La IA es poderosísima y prometedora, mas debemos tener mucho cuidado por el hecho de que se trata de una tecnología muy potente. Tenemos una serie de principios operativos sobre de qué forma podemos hacer nuestras investigaciones. Un segundo elemento es que mismos estudiamos en áreas como los prejuicios y la equidad, para asegurarnos de que abordamos esos retos correctamente. En tercer sitio, es esencial tener una adecuada configuración institucional en la organización y la cultura conveniente. Tenemos conjuntos multidisciplinares en los que hay especialistas en moral, ingenieros y una extensa gama de profesionales con diferentes especializaciones, que prueban y examinan los beneficios y los peligros de cada sistema que desarrollamos. También invitamos a especialistas externos a fin de que nos asistan.

P. ¿De qué forma piensa que debería regularse esta tecnología?

R. La regulación es esencial. Creo que debe ser medida y proporcionada para no constreñir la innovación y que al tiempo pueda atenuar los grandes peligros, por el hecho de que creo que esta es una tecnología extraordinariamente prometedora.

P. ¿Le semeja adecuada la aproximación de la normativa sobre inteligencia artificial que la UE termina de aprobar?

R. Creo que sí, establece un enfoque proporcionado y basado en los peligros de cada herramienta. Me semeja que eso es buen punto de inicio para el discute mundial. Es esencial que tratemos de fomentar ese género de enfoque ordenado de la regulación y la política en el mundo entero a fin de que podamos aumentar al máximo las ventajas para todos —que los hay, y muchos—, y que asimismo podamos atenuar sus peligros de forma conveniente.

P. DeepMind era hasta el momento el laboratorio avanzado de IA de Google. ¿Ha alterado tras su integración empresarial con Google? ¿Tienen ahora que orientar más su trabajo cara resultados comerciales?

R. Creo que la fusión ha sido un movimiento muy atinado. Por un lado, tenemos un equipo científico sin igual en el campo de la IA; por el otro, un mercado enorme al que podemos acceder merced a Google, que nos ofrece la posibilidad de intentar solucionar inconvenientes de la gente. Mi trabajo es hallar ideas en la intersección entre estas dos esferas. Y, cuando las hallamos, incubar cada idea y sacarla adelante.

P. Deme un caso en que hayan coincidido esos dos elementos.

R. En Deepmind tenemos un software, MuZero, capaz de jugar a ajedrez, Go y otros juegos complejos. Un día, hablando con alguien de YouTube, nos afirmó que precisaban reducir el ancho de banda preciso para hacer llegar nuestros vídeos a personas de todo el planeta, de forma que puedas verlos con independencia de la velocidad de conexión de internet que tengas. Hubo un instante muy creativo en el que nos percatamos de que un vídeo, en esencia, se semeja a una partida de ajedrez: se puede ver como una sucesión de imágenes fijas individuales, y hay transiciones entre esas imágenes. Cada una de esas imágenes puede ser una situación en el tablero de ajedrez, y las transiciones, movimientos de ajedrez. Así que aplicamos MuZero a un vídeo y le dimos el propósito de reducir su tamaño, de comprimirlo. Vimos que tuvo un impacto trágico en el peso de esos vídeos y, ahora, esa tecnología ya está incorporada en YouTube.

_