por W H Inmon, Forest Rim Technology

 

El valor de la seguridad es incuestionable. Cuando se produce un accidente y hay daños materiales, existe el costo de la reparación, el costo de la pérdida de negocios y la pérdida de oportunidades.

 

Además, existe el efecto disruptivo en el día a día a las actividades rutinarias de la organización. Y, si hay pérdida de vidas, es difícil poner un valor en dinero ante esa desafortunada ocurrencia. Así que cuando surge el tema de la seguridad, nadie cuestiona su valor. Simplemente es muy difícil poner un precio al valor de la seguridad.

Pero la seguridad es peculiar, en el sentido de que, si bien todo el mundo está de acuerdo en su importancia, casi nadie está de acuerdo en lo que se puede hacer para mejorarla.

Algunas industrias son más peligrosas que otras. En muchas industrias la seguridad no es realmente un problema candente, ya que en cincuenta años no ha habido un accidente grave, pero en otras la seguridad es realmente un tema vital. Algunas de las industrias en las que la seguridad es importante incluyen:

  • Exploración, producción, refinación y distribución de petróleo y gas.
  • Administración de tuberías.
  • Líneas aéreas.
  • Minería.
  • Fabricación química, y así sucesivamente.

Estas industrias han sido peligrosas durante mucho tiempo y es probable que lo sigan siendo en el futuro. El peligro es simplemente un factor inherente a estas industrias. Una de las formas en que se ha intentado mejorar la seguridad es inspeccionar rigurosamente la instalación y analizar y documentar religiosamente cada accidente y avería. Hay muchas razones por las que estos accidentes, análisis e inspecciones se toman en serio:

  • Mejorar la seguridad reduce la probabilidad de que se repita el mismo accidente o peligro similar.
  • Las partes inocentes pueden ser protegidas de litigios, y así sucesivamente.

Un resultado de esta actitud hacia la seguridad es que hay una amplia y larga documentación con respecto a cada incidente. En muchas empresas estos incidentes de seguridad se colocan en una cinta de registro, la que contiene el registro diario de todas las actividades relacionadas con la seguridad que se han producido en la institución durante un período de 24 horas determinado. Una vez que se ha escrito la cinta de registro diaria, la organización puede ir y encontrar incidentes seleccionados y crear un análisis o informe sobre la infracción de seguridad. Estos análisis y descripciones se llevan a cabo según los informes basados en los datos que se encuentran en la cinta de registro. Es una práctica normal que estos informes relacionados con la seguridad se escriban verbalmente, en un formato textual.

Los tipos de datos que se encuentran en el registro de seguridad diario incluyen informes de accidentes, informes de averías y fallos, informes de inspección, informes de reparación, informes de garantía, etc. Hay una amplia variedad de actividades que encuentran su camino en el registro de seguridad diario.

Una pregunta interesante entonces es: ¿qué sucede con estos informes que se encuentran en la cinta de registro a lo largo del tiempo? En realidad, en muchas organizaciones estos informes de incidentes de seguridad se acumulan en una esquina y rara vez se leen o se utilizan para el análisis.

Si bien es normal no buscar información en estas cintas de registro de seguridad diarias a menos de que haya una necesidad urgente de hacerlo, es desafortunado porque hay una gran cantidad de información importante que está atada a la cinta de registro. En particular, puede haber información sobre patrones recurrentes de accidentes, averías u otros incidentes que están enterrados en el registro de seguridad diario.

Con el tiempo, puede comenzar a haber patrones relevantes para la seguridad que se están acumulando. Desde una perspectiva a corto plazo no es evidente que haya un problema que se está desarrollando. Cuando se mira un solo incidente, nada parece extraordinario o fuera de lugar, pero cuando se examina con el tiempo, el problema recurrente o patrón sale de los registros de una manera muy distintiva. Hay mucha información importante sobre la seguridad que funciona de esta manera. El problema es que hay tantos datos y tantos informes en la cinta de registro que nadie presta mucha atención al informe de todos estos incidentes a lo largo del tiempo. El gran volumen de texto que se encuentra en el registro hace que la información sobre estos patrones se pierda o nunca se detecte. Estos patrones importantes relacionados con las prácticas y procedimientos de seguridad se “ocultan” detrás de remansos de datos y texto a lo largo del tiempo.

La conclusión es que hay mucha información importante que se encuentra en los informes de accidentes y reparaciones que simplemente escapa de los avisos.

Como ejemplo del valor de los datos de seguridad, recientemente hubo una refinería de petróleo que explotó en Houston, Texas. La refinería fue destruida. El equipo que fue destruido valía unos USD 100.000.000 y cinco trabajadores perdieron la vida. Además, la compañía petrolera apareció en los titulares de los principales periódicos de una manera muy poco halagadora. Si este accidente hubiera sido capaz de evitarse, el valor de evitarlo es casi incalculable.

Unos años más tarde, la misma compañía petrolera hizo estallar una plataforma de pozos de petróleo en el Golfo de México, donde se perdieron once vidas y todo el Golfo de México se vio dañado por el petróleo derramado.

Luego, hay una mina de oro esperando por la información de seguridad que una empresa recoge regularmente en un registro (pero con el que hace muy poco).

Sin embargo, el gran volumen de los datos relacionados con la seguridad es solo el comienzo del problema. El segundo aspecto del problema es que los incidentes de seguridad en el registro están escritos en texto.

Hay muchos desafíos que se relacionan con la información que está enlazada en el texto. Algunos de los problemas con los informes textuales se muestran en la figura 6.

Entonces, hay una gran oportunidad para hacer que las corporaciones peligrosas sean más seguras (y operen a una tasa más alta de rentabilidad) mirando la información mundana que se encuentra en los registros de seguridad diarios.

El primer paso para lograr este objetivo muy valioso es automatizar la recopilación y el almacenamiento de los registros diarios de seguridad. Mientras los datos del registro de seguridad se depositen en un montón de papeles, no va a ser muy útil.

Para que la información sea útil es necesario transferir el texto del papel a un formulario electrónico. Esto se hace a través de OCR, si la información no existe ya en un formato electrónico (OCR significa reconocimiento óptico por su sigla en inglés). El proceso de OCR toma el papel y convierte el texto en formato electrónico.

Una vez que el texto está en formato electrónico, se reconoce que el texto sigue siendo muy en bruto. OCR es el primer paso y solo se necesita cuando los datos no existen ya en un formato electrónico. Para dar sentido al texto sin formato que se encuentra en el diario de seguridad es necesario leer el texto sin formato e “integrar” (o “desambiguar”) el texto.

Existe un software para recopilar e integrar datos textuales y colocar el texto en un formato de base de datos donde se pueden utilizar herramientas analíticas estándar para analizar esos datos. Es la herramienta de transformación textual de Forest Rim Technology: Textual ETL. Una vez que los datos se integran y pasan a través de Textual ETL, se pueden insertar en una plataforma de base de datos estándar, como DB2, Teradata, Oracle, NT SQL Server u otro sistema de administración.

Hay mucho valor en poder colocar datos textuales —en un formato integrado— en una base de datos estándar. Tal vez el mayor valor es el de poder acceder y analizar los datos textuales de forma automatizada. Las consultas se pueden ejecutar en la base de datos donde los resultados se producen muy rápidamente y donde hay precisión de las respuestas. Además, la base puede almacenar datos durante un largo período de tiempo.

Otra ventaja de almacenar datos textuales integrados en una base es que estos se pueden actualizar periódicamente de forma perfecta. Cada mes o cada semana a medida que se crean nuevos registros relacionados con la seguridad, se pueden agregar sin problemas a la base de datos.

Una vez que el texto se integra y se coloca en una base de datos, la etapa se establece para el procesamiento analítico. A pesar de que la gente lo da por sentado, hay muchas ventajas de tener un almacén de datos que se puede analizar desde un computador. Algunas de las ventajas son:

  • Los datos se pueden analizar rápidamente.
  • Los datos se pueden analizar con flexibilidad.
  • Muchos datos se pueden analizar.
  • Los datos se pueden añadir periódicamente.
  • Diferentes tipos de datos se pueden analizar en comparación con otros datos, y así sucesivamente.

Cuando se trata de los tipos de análisis que se pueden hacer, en realidad la limitación está en la imaginación del analista. El analista ágil puede ver cualquier cosa que esté en los datos. Aquí, una breve lista de preguntas que se pueden abordar de seguridad:

  • ¿Hay algún tipo de actividad que sea particularmente peligrosa?
  • ¿Hay algún lugar que sea particularmente peligroso?
  • ¿Hay algún producto en particular que es peligroso?
  • ¿Hay un fabricante de un producto que es peligroso?
  • ¿Hay momentos del día o épocas del año que son más peligrosos que otros?
  • ¿Cuáles son las ocupaciones más peligrosas?
  • ¿Hay algún tipo de accidente que se repite más de lo esperado?
  • ¿Qué tipos de accidentes son los más letales?y así sucesivamente.

La realidad de la creación de una base de datos de seguridad es que hay MUCHAS vías de interés más interesantes que se pueden explorar. Y una vez que el texto ha sido desambiguado y colocado en una base de datos relacional estándar, el análisis es algo fácil de hacer.

Otro factor muy positivo acerca de la creación de una base de datos basada en tecnología DBMS estándar para el procesamiento analítico para la seguridad es que el análisis se puede hacer con herramientas estándar. En la mayoría de los casos, la organización ya ha comprado e instalado un software analítico y los usuarios finales han sido entrenados para hacer inteligencia empresarial. Simplemente es muy conveniente utilizar la infraestructura analítica que ya existe cuando los datos de seguridad se capturan, integran y colocan en una base de datos relacional estándar.

Pero quizás la parte más valiosa de la capacidad de analizar datos textuales en una base de datos estándar es la de poder combinar datos textuales con datos estructurados clásicos. Hacer una combinación de este tipo es fácil. Por ejemplo, los datos textuales se pueden combinar con datos financieros, datos de producción o datos de recursos humanos, etc.

La capacidad de combinar datos textuales con datos estructurados mejora en gran medida la capacidad del analista para crear consultas muy innovadoras y de amplio alcance. Ahora el analista puede tener una gama de consultas potenciales que está limitada solo por su imaginación.

Y hay otra ventaja, una arquitectónica que surge de esta capacidad. Existe la posibilidad de crear un almacén de datos verdaderamente integrado que contenga datos cuyos orígenes no están estructurados y donde otros datos tienen orígenes no estructurados.

Entonces, hay una gran oportunidad en la capacidad del analista para hacer consultas sofisticadas cuando el texto se puede integrar significativamente en la forma de una base de datos estándar.


Forest Rim Technology fue formada por Bill Inmon con el fin de proporcionar tecnología para cerrar la brecha entre los datos estructurados y no estructurados. Se encuentra en Castle Rock, Colorado.