arturo camargo, catalina moreno y juan camilo velandia- Perplexity
¿Qué datos recopila la herramienta (texto, voz, imágenes)?
Perplexity AI recopila principalmente los textos que los usuarios escriben, junto con información técnica como la dirección IP, el tipo de dispositivo, la ubicación aproximada y la interacción que se tiene con la plataforma. También puede guardar archivos o imágenes que el usuario suba durante una búsqueda, aunque no utiliza grabaciones de voz ya que actualmente no ofrece una función de entrada por audio. Estos datos se emplean para analizar el rendimiento del servicio, detectar abusos, personalizar resultados y mejorar la precisión de las respuestas que ofrece el sistema. En las versiones empresariales, la información subida se conserva por un tiempo limitado (alrededor de siete días) y después se elimina de los servidores.
¿Cómo se usan esos datos para entrenar los modelos?
Perplexity señala que los datos de los usuarios pueden ser utilizados para mejorar la calidad del servicio y, en algunos casos, para el entrenamiento de sus modelos internos. Esto significa que las preguntas o textos introducidos pueden alimentar procesos de aprendizaje que ayudan a refinar las respuestas y reducir errores futuros. Sin embargo, en las versiones empresariales o de pago, la compañía garantiza que la información de los clientes no se usa para entrenar los modelos, protegiendo así la confidencialidad del contenido. En otras palabras, los datos de los usuarios gratuitos pueden contribuir al desarrollo del sistema, mientras que los de usuarios empresariales se mantienen separados con fines únicamente operativos.
¿Qué derechos tiene la empresa sobre los contenidos generados?
De acuerdo con los Términos de Servicio de Perplexity, los usuarios conservan la propiedad de los textos que envían, pero al utilizarlos otorgan a la empresa una licencia global, gratuita y sublicenciable para usar ese contenido con el fin de operar, mantener y mejorar el servicio. En cuanto al contenido generado por la IA, la empresa no declara de forma totalmente explícita que pertenezca al usuario, por lo que la propiedad del resultado final puede considerarse compartida o limitada según la jurisdicción. Además, el uso gratuito está restringido a fines personales y no comerciales, lo que significa que, para utilizar los resultados con fines de lucro, se requiere una licencia o suscripción especial.
¿Existen limitaciones en los tipos de uso (educativo, comercial, político)?
Perplexity impone varias limitaciones en función del tipo de cuenta. En la versión gratuita, el uso está limitado a fines personales y no comerciales, por lo que no se permite emplear sus resultados con objetivos empresariales o lucrativos sin autorización. Las versiones de pago o empresariales sí permiten un uso comercial, siempre que se respeten las leyes de propiedad intelectual y los términos de servicio. En cuanto al uso político, la plataforma no lo prohíbe explícitamente, pero establece que no puede emplearse para difundir desinformación, manipular audiencias o violar derechos de terceros, lo que en la práctica restringe su empleo en campañas partidistas o propaganda. El uso educativo, en cambio, es plenamente válido siempre que respete estas condiciones generales.
¿Qué nivel de transparencia tiene el servicio sobre sus algoritmos y fuentes de datos?
El nivel de transparencia de Perplexity AI es parcial. Por un lado, la herramienta destaca por mostrar las fuentes de donde obtiene la información, algo que la diferencia de muchos otros modelos de lenguaje y genera confianza en el usuario. Sin embargo, la empresa no revela con detalle qué modelos específicos utiliza, cómo pondera las fuentes ni qué criterios sigue para priorizar la información en sus respuestas. Tampoco publica una lista completa de los conjuntos de datos con los que entrena sus modelos, lo que mantiene parte del funcionamiento como una “caja negra”. En resumen, Perplexity ofrece transparencia al citar fuentes visibles en cada respuesta, pero sigue siendo opaca respecto al funcionamiento interno de su algoritmo y los datos de entrenamiento que utiliza.

