Anonimiza tus documentos antes de enviarlos a una IA.
Detectamos nombres, DNI/NIE, IBAN, direcciones, emails y teléfonos en tus PDF, Word o texto. Pega lo anonimizado en ChatGPT, Claude o Gemini sin filtrar datos personales. Con la clave, recupera los originales después.
cómo funciona
- 01
Cargas tu documento
Arrastra un fichero o pega texto. Aceptamos .txt, .md, .pdf y .docx.
- 02
Revisas lo detectado
Te mostramos los datos personales resaltados por colores. Puedes añadir, quitar o cambiar cualquier detección a mano.
- 03
Descargas y compartes
Te llevas el documento sin datos personales y, opcionalmente, una clave cifrada para recuperar el original.
empieza aquí
Carga tu documento
el estudio
Detrás de Ocultia
Una herramienta de Lostium Innovation Studio. Diseñamos y desarrollamos productos digitales innovadores y hechos a medida, integrando IA para automatizar procesos y dar a cada negocio las herramientas que necesita para crecer.
preguntas frecuentes
Lo que debes saber
Pulsa cada pregunta para abrirla. Puedes dejar varias abiertas a la vez.
¿Por qué tengo que anonimizar antes de pasar un documento a una IA?
Cuando pegas información en una IA como ChatGPT, Claude o Gemini, esos datos pueden quedarse en sus sistemas: para entrenar futuros modelos, para revisión humana o simplemente almacenados en logs. Si tu documento contiene nombres reales, DNIs, direcciones o datos médicos, estás compartiendo información de personas que probablemente no han dado su permiso.
Anonimizar antes evita ese problema: la IA recibe el contexto que necesita pero sin saber a quién pertenece.
¿Y qué dice la ley? ¿Esto tiene que ver con el RGPD?
Sí. El Reglamento General de Protección de Datos (RGPD) considera dato personal cualquier información que identifique a una persona: un nombre, un DNI, un email, una matrícula, una dirección. Compartir esos datos con un tercero (incluida una IA externa) sin base legal puede ser una infracción.
Anonimizar correctamente convierte el documento en algo que ya no es dato personal y, por tanto, queda fuera del ámbito del RGPD. Esto es lo que la AEPD llama "anonimización irreversible". Con Ocultia es reversible solo para ti, gracias al fichero clave que se guarda en local.
¿Usar Ocultia garantiza el cumplimiento del RGPD?
No. Ocultia es una herramienta de apoyo que facilita la anonimización de documentos antes de pasarlos a una IA externa, pero no es un servicio de asesoría legal ni garantiza el cumplimiento normativo.
La responsabilidad del tratamiento de datos personales recae siempre en la persona u organización que los gestiona. Ocultia no puede garantizar que detecte el 100 % de los datos personales de cada documento. Los modelos de IA cometen errores, y ciertos formatos (PDFs escaneados, imágenes, tablas complejas) pueden eludir la detección. Por eso es imprescindible revisar el resultado antes de exportar.
En ningún caso Ocultia ni Lostium serán responsables de los daños o perjuicios que puedan derivarse del uso de la herramienta, de la información procesada, ni de las decisiones tomadas a partir de sus resultados.
Si gestionas datos especialmente sensibles o en contextos regulados, consulta a un profesional especializado en protección de datos.
¿Mis documentos llegan a algún servidor?
No. Ni el documento ni los datos detectados salen de tu ordenador. Todo el procesamiento ocurre en este navegador, dentro de un Web Worker aislado.
Lo único que se descarga desde fuera es el modelo de IA la primera vez que lo usas (unas decenas de MB). Luego queda guardado en la cache del navegador para funcionar sin conexión.
¿La información está totalmente a salvo en mi navegador?
Sí, siempre que tu navegador no tenga extensiones que analicen el contenido de las páginas con IA. Ocultia no envía nada a internet, pero algunas extensiones (asistentes con IA, correctores, traductores automáticos, capturadores de notas) sí pueden leer lo que escribes en cualquier web y mandarlo a sus propios servidores.
Si vas a manejar datos especialmente sensibles, revisa los permisos de tus extensiones o usa Ocultia en una ventana de incógnito con las extensiones desactivadas.
¿Cómo funciona Ocultia por dentro?
Combinamos dos técnicas complementarias:
1. Expresiones regulares para datos con formato fijo y verificable: DNI y NIE (con dígito de control), IBAN, número de tarjeta, email, teléfono, dirección IP, código postal, fecha. Estas detecciones son rápidas y muy precisas.
2. Reconocimiento de entidades con IA (NER) para datos sin patrón fijo: nombres de personas, organizaciones, lugares, colegios, empresas. Usamos un modelo Transformer pequeño entrenado para español que se ejecuta directamente en tu navegador con WebAssembly.
Lo detectado se sustituye por etiquetas como [NOMBRE_1], [DNI_2], [EMAIL_3]… preservando el formato original del documento.
¿Por qué el resultado se descarga en Markdown?
Porque Markdown es prácticamente el formato nativo que mejor entienden las IAs como ChatGPT, Claude o Gemini. Mantiene la estructura del documento (títulos, listas, negritas, enlaces) con muy poca sintaxis, sin el ruido visual de PDF o Word, ocupa menos tokens y la IA lo interpreta sin esfuerzo extra.
Además es texto plano: puedes abrirlo en cualquier editor, copiarlo y pegarlo donde necesites, o seguir editándolo a mano. Cuando recuperes los datos personales, la respuesta de la IA seguirá viniendo en Markdown; la rehidratación funciona igual.
¿Qué tipos de datos personales reconoce?
De forma automática: DNI, NIE, IBAN, número de tarjeta, email, teléfono, IP, URL, fecha, dirección postal, código postal, nombre de persona, organización, lugar y colegio.
Además, puedes definir tipos personalizados sobre la marcha; útil para términos sensibles del contexto de tu negocio (por ejemplo PROYECTO, CLIENTE, MEDICAMENTO, ALIAS). Solo selecciona el texto en el documento y elige "+ nuevo tipo".
¿Y si la detección falla o se equivoca?
Por eso te dejamos revisar antes de exportar. Verás el texto resaltado por colores en función del tipo detectado, y podrás:
• Hacer clic en cualquier resaltado para cambiar su tipo o quitarlo.
• Seleccionar texto nuevo para marcarlo manualmente con un tipo existente o uno propio.
• Consultar la tabla completa con todas las detecciones, sus apariciones y su origen (regex, IA o manual).
Nada se exporta hasta que tú lo decides.
¿Puedo recuperar los datos personales después?
Sí. Guarda el fichero clave que descargas junto con el documento anonimizado y ve a la pestaña Recuperar. Sube el texto que tengas (el original o uno reescrito por la IA, mientras conserve las etiquetas [NOMBRE_1], [DNI_2]…) junto con la clave, y reinyectamos los datos personales donde correspondan.
Te recomendamos cifrar la clave con contraseña al exportarla si los datos son sensibles. Sin la contraseña no se podrán recuperar los datos: ni por ti, ni por nadie.
¿Qué formato es el ideal? ¿Y si tengo un PDF, un Word o un documento con imágenes?
El formato ideal es Markdown (.md) o texto plano (.txt): la estructura llega intacta, no hace falta convertir nada y el resultado anonimizado se puede pegar directamente en la IA. Si tu fuente está en Word, exportarla a Markdown desde el propio editor te dará la mejor calidad.
También aceptamos .pdf y .docx: los convertimos a Markdown en tu navegador antes de analizarlos. Funciona bien con texto digital y formato sencillo, pero ten en cuenta sus límites:
• PDFs escaneados o con texto incrustado en imágenes: no llevamos OCR, así que ese contenido no se ve, no se anonimiza y no aparece en el documento exportado. Si tu PDF es una foto o un escaneo, pásalo antes por una herramienta de OCR.
• PDFs complejos (varias columnas, tablas grandes, pies de página): el orden de lectura puede salir mezclado y los títulos no siempre se reconocen bien.
• Word (.docx): extraemos el texto y el formato básico (títulos, listas, negritas, enlaces). Lo que no se procesa: imágenes embebidas, cuadros de texto, formas, encabezados/pies, comentarios y marcas de control de cambios. Nada de eso llega al texto anonimizado: si ahí había datos personales, no los detectaremos, pero tampoco quedarán en el resultado.
• Imágenes en general (firmas, fotos de DNI, capturas de pantalla, gráficos con texto): se ignoran por completo en cualquier formato. No se analizan y no estarán presentes en el texto anonimizado que exportes: el resultado contiene solo el texto que sí pudimos extraer.
En cualquier caso, antes de exportar revisa el documento en la pantalla de revisión y marca a mano lo que falte.
¿Funciona sin conexión? ¿Es gratis?
Una vez descargado el modelo (la primera vez que detectas algo), Ocultia funciona completamente sin conexión. Puedes incluso instalarla como aplicación desde tu navegador.
Es gratis, no requiere registro y no hay límite de uso más allá de la memoria de tu propio navegador. Documentos muy grandes (cientos de páginas) pueden tardar más en analizarse.
¿Por qué no aparece ningún aviso de cookies?
Porque no usamos cookies ni ningún sistema de seguimiento de usuarios. No hay analíticas, no hay píxeles de publicidad, no hay scripts de terceros que registren tu actividad. Al no recopilar ningún dato personal tuyo como visitante, no existe nada que consentir y el banner sería innecesario.
Ocultia es coherente con lo que promete: una herramienta que respeta la privacidad de principio a fin, también en la propia web.