por W H Inmon, Forest Rim Technology

 

Casi todas las corporaciones tienen un centro de llamadas. Pregunte a un ejecutivo si su organización tiene un centro de llamadas y hay buenas  probabilidades de que diga que sí.

Luego, pregúntele al ejecutivo si sabe o no lo que está pasando en el centro de llamadas. Le asegurará que sabe lo que está pasando. Entonces, pregúntele qué es lo que realmente está pasando en el centro de llamadas. El ejecutivo dirá que la corporación está recibiendo 6.000 llamadas al día y la duración promedio de la llamada es de 4 minutos y medio.

Ahora, conocer el número de llamadas y saber cuánto tiempo han durado es una medida interesante de la actividad que pasa por el centro de llamadas, pero este tipo de información no dice nada sobre el contenido de lo que está pasando en el centro de llamadas.

¿Qué le gustaría saber?

El tipo de información que le gustaría averiguar sobre el centro de llamadas es sobre:

  • ¿De qué se quejan los clientes?
  • ¿Sobre qué hacen preguntas los clientes/prospectos?
  • ¿Los clientes/prospectos quieren comprar algo?
  • ¿Los clientes necesitan más información sobre los equipos operativos?
  • ¿Los clientes tienen problemas de instalación?
  • ¿Los clientes están interesados en otras opciones asociadas con los equipos?
  • Y así sucesivamente.

La información del centro de llamadas que es valiosa para la corporación no es cuánto se está utilizando el centro de llamadas, sino cuál es el contenido de las conversaciones que se están produciendo.

Cuando le preguntas al ejecutivo si conoce el contenido de lo que se está discutiendo en el centro de llamadas, la respuesta clásica es: “no es posible saber ese tipo de información”.

TEXTUAL ETL

Pero en el mundo de hoy se puede conocer ese tipo de información. Existe la desambiguación textual (o Textual ETL), con la que es absolutamente posible saber con precisión lo que se está diciendo en el centro de llamadas.

Para ver cómo Textual ETL crea la oportunidad para que la corporación comience a utilizar la información que se encuentra en el centro de llamadas para una mejor toma de decisiones, considere el siguiente ejemplo.

En la figura a continuación se encuentra la sinopsis de la actividad del call center que una compañía telefónica tiene con sus clientes. En un día, la compañía telefónica recibirá miles de peticiones en su centro de llamadas. Las llamadas versarán de los muchos aspectos del funcionamiento diario de la compañía telefónica. Además, la compañía también presta servicios de programación de televisión.

No hay manera de que un individuo pueda leer los mensajes y asimilar lo que está diciendo el cliente. Simplemente hay demasiados mensajes.

Así que el Textual ETL se utiliza para leer la información textual de lo que ha ocurrido en el centro de llamadas y para asimilar esa información.

La información de conversación es leída por Textual ETL y convertida en una base de datos que se puede leer y analizar.

El flujo de datos

La figura siguiente muestra el flujo de datos que se está produciendo.

Algoritmos TEXTUAL ETL

Dentro de Textual ETL hay un procesamiento algorítmico significativo. Dependiendo del texto se producen diferentes tipos de procesamiento algorítmico. Algunos requieren un tipo de procesamiento y otros de otro tipo de procesamiento.

Algunos de los tipos de procesamiento que se producen dentro de Textual ETL incluyen:

Detener el procesamiento de textos. Es el procesamiento de palabras vacías como “a”, “y”, “el”, “para”, “desde”, etc. Se eliminan antes de que se escriba el registro de la base de datos.

Derivados. La derivación se produce reduciendo las palabras a su raíz griega o latina. Se reconoce la relación entre “mover”, “moviendo”, “muevo”, “movimiento” y “movido”.

Ortografía alternativa. Un ejemplo simple de ortografía alternativa es reconocer que la ortografía británica de “colour” es la misma que la ortografía americana de “color”.

Resolución taxonómica/algorítmica. La resolución taxonómica permite clasificar las palabras. Como ejemplo simple de resolución taxonómica es el reconocimiento de que “Honda”, “Volkswagen”, “Porsche”, “Chevrolet” y “Toyota” son todos “autos”.

Resolución homográfica. La resolución homográfica se produce cuando se reconoce que la misma palabra o frase tiene significados diferentes para diferentes audiencias. Por ejemplo, “ha” significa un ataque cardíaco para un cardiólogo, hepatitis A para un endocrinólogo y dolor de cabeza al médico general.

Análisis de proximidad. El análisis de proximidad es el reconocimiento de que las palabras cercanas entre sí tienen significados diferentes a cuando las palabras se separan. Por ejemplo, “Dallas Cowboys” se refiere a un equipo de fútbol, mientras que “Dallas” en la página 1 y “cowboys” en la página 4 transmiten un significado completamente diferente.

Resolución de la negación. La resolución de la negación se refiere a la práctica de inferir la negación del significado al encontrar un término negativo, como “no”, “jamás”, “nunca”, etc.

Estandarización de fechas. Un documento tiene escrito “5 de junio de 2016” y otro documento tiene “06/05/2016”. Para ser colocadas en una base de datos, las fechas deben estandarizarse.

Y hay MUCHAS otras prácticas algorítmicas que deben tenerse en cuenta a medida que el texto se lee y se convierte en una base de datos.

Visualización

Una vez que el texto se lee y se convierte en una base de datos, esta se puede leer e introducir en una herramienta de visualización. La herramienta de visualización se puede utilizar para crear un panel.

En la ilustración siguiente se muestra un panel que se puede crear (nota: el panel visto aquí fue creado por Boulder Insight).

El panel muestra las actividades que se producen dentro del centro de llamadas.

El panel

En la parte superior izquierda está la visualización del tipo de llamadas que se producen en el centro de llamadas clasificado por el número de llamadas. Típico de las llamadas son quejas, preguntas, consultas sobre ventas, preguntas de instalación, etc. Esta información indica a la dirección la actitud general de las actividades que pasan por el centro de llamadas.

En la parte inferior derecha está el análisis de las llamadas telefónicas por hora del día. Este diagrama muestra que hay poca o ninguna actividad durante las horas de 2:00 am y 3:00 am. Sin embargo, durante el horario estelar —9:00 am a 4:00 pm— hay mucha actividad. Además, las actividades están codificadas por colores. El analista puede profundizar en el color y la hora. Para ir a un nivel de detalle más bajo es necesario un análisis más profundo.

Por encima del análisis por hora está el análisis diario. El análisis diario muestra que se han producido diferentes tipos de actividad del centro de llamadas en diferentes días de la semana.

Por encima del análisis diario está el análisis mensual. El análisis mensual muestra que para los 31 días del mes hay patrones de actividad.

Y, finalmente, en el centro del tablero están los temas que estaban contenidos en el análisis del centro de llamadas. Los diferentes temas que se mencionaron por las conversaciones que ocurrieron en el centro de llamadas se enumeran de manera demográfica. La caja más grande y oscura muestra los temas más mencionados. Las cajas más pequeñas y ligeras muestran los temas menos señalados.

El panel que se ve en la figura muestra que una organización puede saber lo que está ocurriendo en el centro de llamadas. Cuando la administración dice: “No puedes saber lo que está pasando en el centro de llamadas” es que no ha visto uno de estos paneles que te indican con precisión lo que está ocurriendo en el centro de llamadas.

Procesamiento de texto

Es interesante mirar el texto en el procesamiento de la base de datos desde el punto de vista de lo que el equipo ve y lo que el equipo tiene que hacer para crear la base de datos que está detrás del panel.

En primer lugar, ¿cómo se ve un documento textual para el equipo?

En una frase, un documento textual parece una larga cadena de texto para el equipo. Es una palabra o carácter seguido de otra palabra o carácter seguido de otra palabra o carácter.

Una imagen de lo que el ordenador ve se aprecia en la siguiente figura.

Depende del equipo leer e interpretar la larga cadena de texto y tomar ese texto como entrada en la creación de una base de datos.

Hay (en este momento) aproximadamente 67 algoritmos diferentes y separados que se requieren para leer e interpretar el texto que se encuentra dentro de Textual ETL. Hace las cosas aun más complejas el hecho de que los 67 algoritmos diferentes tienen que ser secuenciados correctamente para su ejecución. Por ejemplo, en algunos casos para que el algoritmo A se ejecute correctamente, el algoritmo B debe haberse ejecutado. Y en otras ocasiones el algoritmo A tiene que ser ejecutado antes de que se ejecute el algoritmo B, todo dependiendo del texto que se está procesando.

Hay muchos algoritmos muy diversos que tienen que ser tenidos en cuenta por Textual ETL.

Algunos de los algoritmos más comunes incluyen:

  • Análisis de proximidad
  • Estandarización de fechas
  • Formato de variables personalizadas
  • Contextualización en línea
  • Resolución de taxonomía/ontología

La figura siguiente muestra la aplicación del algoritmo al texto que se introduce en Textual ETL.

La base de datos relacional

El resultado del procesamiento del texto por Textual ETL es una base de datos relacional. Si bien la creación de una base de datos relacional simple no es nueva, para la organización que lucha con el texto la capacidad de crear una base de datos de este tipo representa un hito significativo.

La importancia de la capacidad de convertir texto en una base de datos relacional es la siguiente. Una vez que el texto se convierte en una base de datos:

  • No hay límite en el número de documentos que se pueden leer y analizar.
  • El análisis se puede realizar mediante un software analítico estándar.

Estas dos características son realmente significativas. Dicho de otra manera, al tener los documentos en un formato textual, los documentos deben ser leídos y analizados manualmente, y no hay ningún software analítico que se pueda utilizar para analizar texto.

La figura siguiente muestra la base de datos relacional que se ha creado a partir del procesamiento de texto por Textual ETL.

Algunas de las características de la base de datos relacional incluyen:

  • Identificación del documento (o el registro del centro de llamadas)
  • Dirección de bytes de la palabra que se está analizando
  • La palabra real que se está analizando
  • El contexto de la palabra que se está analizando

La figura siguiente muestra algunas de las características de la base de datos.

Contexto

Aunque hay muchos aspectos de los datos encontrados en la base que son importantes, una de las características únicas y más relevantes es la identificación del contexto en el que se encuentra el centro de llamadas. Dicho de manera diferente, mientras que el texto es importante, si vas a analizar el texto, también necesitas estar analizando el contexto del mismo.

Y el contexto del texto es una característica estándar de la base de datos producida por Textual ETL.

Como ejemplo del valor del contexto, supongamos que un par de mujeres llevan a su amiga al hospital porque tiene fiebre y una de ellas le dice al doctor que “Ella está caliente”.

¿Cuál es el significado de “ella está caliente”?

Una interpretación es que la paciente tiene una fiebre notable y al tocar su frente la amiga dice al médico con emoción, “¡Ella está caliente!” Podemos inferir que físicamente, ella tiene calor.

Otra interpretación es que la paciente no quiere estar en la clínica, y una de las amigas dice “Ella está caliente” porque la paciente está allí contra su voluntad, y está enojada.

Y por último, resulta que el médico atendiendola es bien atractivo, entonces una de las amigas le dice a la otra “Ella está caliente”, implicando que a la paciente le gustaría salir en una cita con el doctor.  

Así que cuando alguien dice “ella está caliente”, la única manera de entender lo que significa es a través del contexto. Es el contexto el que deduce el significado del texto.

Dicho de manera diferente, el texto sin contexto no tiene sentido.

Textual ETL controla el texto y el contexto

La figura siguiente muestra que tanto el texto como el contexto se encuentran en la base de datos creada por Textual ETL.

En la figura se ve que el centro de llamadas ha mencionado las palabras  “Condado de Maricopa”. El contexto de estas palabras es un lugar donde se ha registrado una escritura inmobiliaria.

Tenga en cuenta que el condado de Maricopa (en Arizona) podría haberse referido a muchas cosas. El contexto del condado de Maricopa podría ser:

  • Un lugar donde los equipos de béisbol profesional practican a principios de temporada
  • Un lugar donde se registró algún hecho
  • Un lugar donde ocurrió un asesinato
  • Un lugar donde tomaste vacaciones
  • Un lugar donde se rodó una película

Y así sucesivamente.

Desde un punto de vista analítico, es crucial capturar el contexto y el texto. Textual ETL, entonces, es valioso en el desbloqueo de los secretos del centro de llamadas.

Amplia aplicabilidad

La aplicabilidad del Textual ETL está muy extendida. Esto se debe a que el texto está muy extendido. Textual ETL se convierte en la clave para desbloquear la información que se encuentra en el texto de la corporación.

La siguiente figura muestra que hay muchos lugares donde el texto se encuentra en la corporación.

________________________________________________________________________

Forest Rim Technology fue formada por Bill Inmon con el fin de proporcionar tecnología para cerrar la brecha entre los datos estructurados y no estructurados. Se encuentra en Castle Rock, Colorado.