Conoce de dónde viene la información de la inteligencia artificial que usas: Gemini de Google, ChatGPT, Meta y más

Guardar

Estos son los sitios que suelen consultar los modelos de IA para brindar la información que les solicitan - (Imagen Ilustrativa Infobae)

La expansión de los chatbots de inteligencia artificial y asistentes virtuales ha puesto el foco sobre un aspecto fundamental: ¿de dónde provienen las respuestas generadas por estos sistemas?

Sin acceso a experiencia o comprensión genuina, la inteligencia artificial se apoya en vastos volúmenes de datos recopilados en su entrenamiento y, en los modelos más recientes, complementados con búsquedas activas en internet.

Chatbots son entrenados con información en la web para tener los conocimientos cuando son consultados - (Imagen Ilustrativa Infobae)

Una investigación realizada por la plataforma de marketing Semrush, centrada en 150.000 respuestas generadas por sistemas de IA durante junio de 2025, arrojó resultados contundentes sobre la preeminencia de ciertas plataformas. Según el informe, Reddit encabeza ampliamente el ranking como la página con más presencia, acumulando el 40,1 % de las menciones detectadas.

La influencia de Reddit se atribuye a su esquema de foros temáticos, donde millones de usuarios comparten experiencias, consejos técnicos y valoraciones. Esa dinámica, según la información del análisis, posiciona a Reddit como una referencia central en los procesos automáticos de consulta y síntesis de información por parte de la IA.

El segundo sitio más citado en el estudio es Wikipedia, con un 26,3 %. Su modelo de enciclopedia colaborativa abierta, que permite la actualización constante de artículos y una enorme amplitud temática, explica su relevancia para la inteligencia artificial, tanto en capacitación como en consulta durante las interacciones.

La relevancia de este fenómeno fue subrayada en 2023 por un informe de The Washington Post, que analizó el impacto de páginas web específicas dentro de las bases de datos usadas para entrenar grandes modelos lingüísticos.

Los motores de IA utilizan complejos algoritmos para integrar información - (Imagen ilustrativa Infobae)

Junto con el Allen Institute for AI, el medio estadounidense examinó el conjunto de datos C4 de Google, empleado en el desarrollo de sistemas como T5 de Google y LLaMA de Meta (Facebook). El listado mostró persistencia de dominios como patents.google.com, líder por volumen de texto almacenado, seguido cercanamente por Wikipedia y la biblioteca digital Scribd.

El análisis identificó otros sitios influyentes, como foros de videojuegos y catálogos técnicos, pero destacó que el núcleo de información proviene de repositorios con alta densidad de datos, literatura digital y plataformas con uso colaborativo intensivo.

Este enfoque en el origen de las fuentes ha sido abordado recientemente por los propios desarrolladores de los modelos más populares de IA. ChatGPT, el asistente de OpenAI, sostuvo al ser consultado que el entrenamiento de su modelo “incluyó una combinación de fuentes públicas, textos con licencia y material producido por instructores humanos”.

Respecto a sitios puntuales mencionados en los recientes análisis, como Reddit, OpenAI indica que el sistema “no tiene acceso directo a bases de datos privadas, sino que pueden haberse utilizado fragmentos de datos accesibles públicamente bajo licencias apropiadas o de dominio público”.

ChatGPT y el Modo IA de Google revelan sus mecanismos de selección y divulgación de fuentes - EFE/EPA/Wu Hao

En su respuesta recogida durante noviembre de 2025, el sistema de ChatGPT añadió: “No tengo forma de citar ni recuperar publicaciones específicas de Reddit, X u otras redes”, desmarcándose del predominio absoluto que sugiere el análisis de Semrush.

Cuando se utiliza la función de búsqueda en tiempo real, ChatGPT confirma que recurre a medios de comunicación reconocidos, sitios oficiales de gobiernos, empresas, instituciones y bases de datos científicas abiertas, y que en estos casos la respuesta incorpora enlaces directos a las fuentes consultadas.

Por su parte, la descripción oficial del Modo IA de Google –parte de la experiencia de resultados generados por inteligencia artificial (AI Overviews)– precisa que las respuestas se fundamentan en el vasto índice público gestionado por Google.

Esto abarca artículos periodísticos, blogs, bases de datos públicas, contenido audiovisual y publicaciones académicas, todos sometidos a un proceso de evaluación automatizada orientado a filtrar fuentes confiables y actuales antes de generar el resumen mostrado al usuario.

El sistema proporciona enlaces visibles a los sitios originales y ajusta el procesamiento mediante modelos propios, como Gemini, para descomponer la consulta, evaluar fiabilidad y sintetizar información de manera coherente.

La identificación de fuentes en inteligencia artificial revela la diversidad y escala del conocimiento digital utilizado. El cruce entre análisis externos y exposiciones de las empresas desarrolladoras pone de evidencia la multiplicidad de referencias y la evolución continua del ecosistema de datos en la era de los sistemas automatizados.

Últimas Noticias

La batalla financiera de la inteligencia artificial: Anthropic apuesta por la eficiencia mientras OpenAI arriesga con inversiones récord

Las estrategias divergentes de estas empresas sacuden Silicon Valley. Una busca equilibrio y clientes corporativos, la otra apuesta por la expansión agresiva y la innovación disruptiva. El desenlace podría redefinir el liderazgo tecnológico global

Estos son los riesgos de descargar Magis TV y Xuper TV en el televisor

Las apps ilegales solicitan más acceso de lo necesario y pueden robar información sensible, dejando sin soporte técnico ni actualizaciones a los usuarios de televisores inteligentes

El código secreto de WhatsApp que nunca debes enviar por mensaje o decir por llamada: perderás acceso a tu cuenta

Ciberdelincuentes se hacen pasar por el soporte de la aplicación de Meta o simulan errores inocentes, con el objetivo de obtener este número y suplantar la identidad de la víctima ante familiares o amigos

Experimento en Harvard demuestra que los tutores con IA mejoran el aprendizaje y la motivación

Los investigadores han advertido que el éxito de este método no reemplaza a los maestros humanos. Señalan la importancia de no depender de esta tecnología para evitar perder el pensamiento crítico

El Fury realiza con éxito su primer vuelo semiautónomo en Estados Unidos

El avión no tripulado de Anduril Industries supera su primera prueba bajo control autónomo, marcando un avance clave en el programa de Aviones de Combate Colaborativos de la Fuerza Aérea estadounidense y la integración de inteligencia artificial

Conoce de dónde viene la información de la inteligencia artificial que usas: Gemini de Google, ChatGPT, Meta y más

Desde foros y portales académicos hasta repositorios legales, la inteligencia artificial construye su conocimiento a partir de una amplia y cambiante red de fuentes digitales

Cuáles son las fuentes utilizadas por la inteligencia artificial

Qué dicen OpenAI y Google sobre el origen de los datos

Últimas Noticias

La batalla financiera de la inteligencia artificial: Anthropic apuesta por la eficiencia mientras OpenAI arriesga con inversiones récord

Las estrategias divergentes de estas empresas sacuden Silicon Valley. Una busca equilibrio y clientes corporativos, la otra apuesta por la expansión agresiva y la innovación disruptiva. El desenlace podría redefinir el liderazgo tecnológico global

Estos son los riesgos de descargar Magis TV y Xuper TV en el televisor

Las apps ilegales solicitan más acceso de lo necesario y pueden robar información sensible, dejando sin soporte técnico ni actualizaciones a los usuarios de televisores inteligentes

El código secreto de WhatsApp que nunca debes enviar por mensaje o decir por llamada: perderás acceso a tu cuenta

Ciberdelincuentes se hacen pasar por el soporte de la aplicación de Meta o simulan errores inocentes, con el objetivo de obtener este número y suplantar la identidad de la víctima ante familiares o amigos

Experimento en Harvard demuestra que los tutores con IA mejoran el aprendizaje y la motivación

Los investigadores han advertido que el éxito de este método no reemplaza a los maestros humanos. Señalan la importancia de no depender de esta tecnología para evitar perder el pensamiento crítico

El Fury realiza con éxito su primer vuelo semiautónomo en Estados Unidos

El avión no tripulado de Anduril Industries supera su primera prueba bajo control autónomo, marcando un avance clave en el programa de Aviones de Combate Colaborativos de la Fuerza Aérea estadounidense y la integración de inteligencia artificial

El camionero asesino de Azul y su víctima serán sometidos a una pericia toxicológica

Se descarriló una formación del tren Sarmiento en Liniers: hay heridos y el servicio está interrumpido

Cuál es el beneficio secreto por el que tres grandes fabricantes de autos entrarán en la Fórmula 1 en 2026

La actividad en los restaurantes cayó 30% en un año: cuáles son los nuevos hábitos de consumo

En medio del debate por la reforma tributaria, Mercado Libre recibió un 50% más de exenciones impositivas del Estado

Rusia condenó a prisión por tercera vez a una artista de 18 años por cantar canciones críticas hacia el Kremlin

El líder opositor turco tilda de “golpista” la petición de 2.352 años de cárcel contra el alcalde de Estambul

La actriz Gal Gadot recibió el Premio Génesis

Nuevo temblor en Chile hoy 11 de noviembre: magnitud y epicentro que reporta en CSN

El nuevo Gobierno de Bolivia ratificó que marcará distancia con la dictadura de Nicolás Maduro

La foto de Wanda Nara y Johnny Depp que podría enfurecer a Mauro Icardi: “Gracias por tus amables palabras”

Cinthia Fernández compartió su proyecto contra los deudores de alimentos y causó revuelo entre sus seguidores

Después de 5 meses en Turquía, Mauro Icardi volvió a encontrarse con sus hijas: “Fue hermoso”

Charlotte Caniggia habló de los planes para su boda: lejos de los medios y sin la familia completa

El gesto de Natalie Pérez a su suegra Linda Peretz luego de su histórico regreso al teatro: “Cambió mi suerte”

Cuáles son las fuentes utilizadas por la inteligencia artificial

Qué dicen OpenAI y Google sobre el origen de los datos

Temas Relacionados

Últimas Noticias

La batalla financiera de la inteligencia artificial: Anthropic apuesta por la eficiencia mientras OpenAI arriesga con inversiones récord

Las estrategias divergentes de estas empresas sacuden Silicon Valley. Una busca equilibrio y clientes corporativos, la otra apuesta por la expansión agresiva y la innovación disruptiva. El desenlace podría redefinir el liderazgo tecnológico global

Estos son los riesgos de descargar Magis TV y Xuper TV en el televisor

Las apps ilegales solicitan más acceso de lo necesario y pueden robar información sensible, dejando sin soporte técnico ni actualizaciones a los usuarios de televisores inteligentes

El código secreto de WhatsApp que nunca debes enviar por mensaje o decir por llamada: perderás acceso a tu cuenta

Ciberdelincuentes se hacen pasar por el soporte de la aplicación de Meta o simulan errores inocentes, con el objetivo de obtener este número y suplantar la identidad de la víctima ante familiares o amigos

Experimento en Harvard demuestra que los tutores con IA mejoran el aprendizaje y la motivación

Los investigadores han advertido que el éxito de este método no reemplaza a los maestros humanos. Señalan la importancia de no depender de esta tecnología para evitar perder el pensamiento crítico

El Fury realiza con éxito su primer vuelo semiautónomo en Estados Unidos

El avión no tripulado de Anduril Industries supera su primera prueba bajo control autónomo, marcando un avance clave en el programa de Aviones de Combate Colaborativos de la Fuerza Aérea estadounidense y la integración de inteligencia artificial

El camionero asesino de Azul y su víctima serán sometidos a una pericia toxicológica

Se descarriló una formación del tren Sarmiento en Liniers: hay heridos y el servicio está interrumpido

Cuál es el beneficio secreto por el que tres grandes fabricantes de autos entrarán en la Fórmula 1 en 2026

La actividad en los restaurantes cayó 30% en un año: cuáles son los nuevos hábitos de consumo

En medio del debate por la reforma tributaria, Mercado Libre recibió un 50% más de exenciones impositivas del Estado

Rusia condenó a prisión por tercera vez a una artista de 18 años por cantar canciones críticas hacia el Kremlin

El líder opositor turco tilda de “golpista” la petición de 2.352 años de cárcel contra el alcalde de Estambul

La actriz Gal Gadot recibió el Premio Génesis

Nuevo temblor en Chile hoy 11 de noviembre: magnitud y epicentro que reporta en CSN

El nuevo Gobierno de Bolivia ratificó que marcará distancia con la dictadura de Nicolás Maduro

La foto de Wanda Nara y Johnny Depp que podría enfurecer a Mauro Icardi: “Gracias por tus amables palabras”

Cinthia Fernández compartió su proyecto contra los deudores de alimentos y causó revuelo entre sus seguidores

Después de 5 meses en Turquía, Mauro Icardi volvió a encontrarse con sus hijas: “Fue hermoso”

Charlotte Caniggia habló de los planes para su boda: lejos de los medios y sin la familia completa

El gesto de Natalie Pérez a su suegra Linda Peretz luego de su histórico regreso al teatro: “Cambió mi suerte”