por W H Inmon, Forest Rim Technology

Para muchas organizaciones la voz del cliente se escucha en internet. Los clientes de las organizaciones dejan comentarios en internet. Otro lugar donde se puede escuchar la voz del cliente es el call center que tienen muchas corporaciones.

Dondequiera, lo importante es darse cuenta de la valía de obtener la voz del cliente. El desafío es cómo tomar el análisis más allá de simplemente leer sus opiniones.

Combine las reseñas de los clientes con los números conocidos

El texto siempre ha presentado un desafío para el profesional de TI. Hay muchas razones por las que el texto es un reto. El primer y mayor desafío es el hecho de que el texto no se ajusta cómodamente a la tecnología de base de datos estándar. Tratar de colocar texto no estructurado en una base de datos altamente estructurada es como tratar de poner la clavija cuadrada en un agujero redondo. El texto dentro de una base de datos es un ajuste incómodo en las mejores circunstancias.

Otra razón por la que el texto es tan desafiante es que el lenguaje es muy complejo. La sintaxis y las reglas del lenguaje son numerosas y enrevesadas. Para dar sentido al lenguaje, la organización tiene que ocuparse no solo del texto, sino también del contexto. Y hay MUCHAS otras complicaciones que surgen al tratar con texto.

Debido a estos factores es que la mayoría de las organizaciones ha ignorado el texto como fuente de información durante muchos años. Esto es desafortunado porque:

  • El texto representa el mayor volumen de datos, con diferencia, en la corporación.
  • Algunos de los datos más importantes de la corporación vienen en forma de texto.

Afortunadamente, hay una nueva tecnología que mitiga los problemas de lectura e interpretación de texto en la corporación.

Esa tecnología se llama Textual ETL (o desambiguación textual)

Con Textual ETL el texto ahora se puede leer y convertir en una base de datos estándar. Esto abre puertas que nunca antes se habían abierto.

La base de datos en la que se reestructura el texto es cualquiera regular: SQL Server, Oracle, Teradata, DB2, Hadoop y otros. No hay sesgo en contra de cualquier base de datos estándar. Textual ETL funciona con todos ellos.

Al llevar el texto al procesamiento estándar de la base de datos, la puerta se abre a muchos tipos de análisis. Uno de los tipos de análisis más importantes que es posible es la audición de la voz del cliente. Las organizaciones que escuchan la voz del cliente prosperan simplemente afirmando.

¿Y dónde se encuentra la voz del cliente? Para muchas organizaciones la voz del cliente se escucha en internet. Los clientes de las organizaciones dejan comentarios en internet. Otro lugar donde se puede escuchar la voz del cliente es el centro de llamadas que tienen muchas corporaciones.

Como ejemplo de escuchar la voz del cliente, una cadena de restaurantes tomó datos disponibles públicamente de internet y alimentó los datos en Textual ETL. Se creó una base de datos y se realizó un análisis simple.

El análisis fue creado contando las quejas (sentimiento negativo) que provenían de las diferentes tiendas de la cadena de restaurantes. El diagrama muestra que la tienda 228 tenía la mayoría de las quejas, seguido de la tienda 87, luego la tienda 135, y así sucesivamente. De hecho, un recuento sin procesar de mensajes de texto por almacén produce información interesante. Mirar los datos generados por el examen de texto es bastante útil. Una conclusión que podría extraerse es que la gestión de las tiendas 228, 87 y 135 necesita ser reemplazada o al menos reentrenada. Algo está pasando en esos lugares.

El problema es que esta información se recopiló mirando únicamente el texto. Para obtener una perspectiva más incisiva de la información, es necesario combinar datos tanto del mundo del texto no estructurado con el mundo estructurado clásico.

La razón por la que mirar el recuento bruto de quejas en una tienda es engañoso, es el hecho de que el volumen de clientes atendidos por cada tienda es muy diferente. La tienda 228 se encuentra en el centro de Manhattan, Nueva York. La tienda 135 está en San Francisco. Store 45 está en Roswell, Nuevo México. La tienda 127 está en Pueblo, Colorado. Es lógico que la tienda en Manhattan va a tener más quejas que una tienda en Roswell, Nuevo México, simplemente basado en la diferencia en el número de clientes.

Es necesario tener en cuenta el tamaño de la tienda. Una forma de hacerlo es dividir el número de quejas por los ingresos mensuales de la tienda. Como ejemplo, la tienda 228 de Manhattan tenía un número total de 656 quejas y unos ingresos mensuales de  USD 1.260.473. En Roswell, la tienda 45 tenía 125 quejas e ingresos de USD 75.209 dólares.

La relación para Manhattan es de .000520 y la relación para Roswell Nuevo México es de .00166. Cuando se mira así, la relación de competencia de gestión de las tiendas en Manhattan y Roswell se ve de manera completamente diferente. De esta forma, la administración de la tienda Roswell, no la tienda de Manhattan, es la que debiera ser prudente.

Una vez que los datos estructurados clásicos se combinan con datos textuales, la perspectiva es completamente diferente.

Una medida muy distinta basada en las relaciones desarrolladas para cada tienda se ve como:

Combinando tanto texto como datos estructurados, se logra una comparación mucho más ilustrada de las tiendas y la competencia de su gestión. Otra forma de ver los datos es:

Mediante un análisis de las relaciones, la gestión de la cadena de restaurantes ahora sabe qué tiendas necesitan atención de alta dirección.

Tan importante como la información derivada del texto puede ser aun más perspicaz cuando se combina con información estructurada clásica.

Se observa que sin la capacidad de leer texto y convertir texto en una base de datos, las ideas que se han discutido simplemente no serían posibles.

Forest Rim Technology fue formada por Bill Inmon con el fin de proporcionar tecnología para cerrar la brecha entre los datos estructurados y no estructurados. Se encuentra en Castle Rock, Colorado.


Forest Rim Technology fue formada por Bill Inmon con el fin de proporcionar tecnología para cerrar la brecha entre los datos estructurados y no estructurados. Se encuentra en Castle Rock, Colorado.