RudderStack vs. Segment vs. Snowplow
in Posts
Cuando un usuario navega por un sitio web, esa sesión del navegador genera eventos que necesitan ser registrados, validados, enriquecidos y almacenados. Las plataformas de recopilación de datos sirven precisamente para almacenar estos eventos y la analítica que generan estos usuarios. Estos datos de usuarios requieren un stack completo de herramientas. El lado del cliente recopila los datos, el middleware transporta esos datos y el lado del servidor almacena y carga los datos en los almacenes y otras aplicaciones destino. Los eventos de los usuarios son las acciones y actividades que los usuarios hacen cuando interactúan con el producto. Los datos de los usuarios son usados para múltiples tareas dentro del negocio como construir y ejecutar un roadmap de producto de forma eficiente, la tabla de precios o el diseño de la experiencia del usuario.
Segment tiene el problema de que no se puede fraccionar el envío de eventos sin enviar toda la secuencia de eventos a una aplicación destino en la nube porque no ofrece una capa de software para poder desplegarla en el propio entorno, es decir no se integra tan fácilmente con cualquier stack existente. Otro problema viene cuando se quiere combinar múltiples fuentes de datos. Segment funciona mejor para capturar eventos y generar reglas encima de la herramienta para la activación de esos eventos pero no ofrece una combinación de secuencia de datos. Por ejemplo, combinar datos de aplicaciones con el sistema backend interno de facturación y el CRM interno. RudderStack, en cambio, sí ofrece esta combinación de secuencia de los eventos con otra información del cliente para generar esa vista única del cliente que se busca. Esta funcionalidad permite controlar el flujo de los eventos en el propio entorno. La otra ventaja es que RudderStack vende una solución de código abierto, lo que permite desplegarlo en el propio ecosistema. Esto proporciona flexibilidad para integraciones internas que puedan surgir. Para el caso de uso de configurar un pipeline de eventos y enviarlos todos a las aplicaciones destino, Segment funcionaría y haría su trabajo a la perfección como, por ejemplo, enviar a Facebook Custom Audiences una audiencia personalizada con todos los usuarios que hayan llegado a la página de checkout pero no hayan terminando comprando. Para este caso de uso, Segment cuenta con el producto Personas pero hay empresas que tienen otras fuentes de datos que no precisan necesariamente enviar a Segment como pueden ser datos de pagadores o tickets de soporte creados en herramientas SaaS como ServiceNow. Al mismo tiempo, con RudderStack se podrían combinar los datos de la interacción de los usuarios con la web con sus datos de facturación para saber si se trata de un usuario de una gran empresa o de una PYME. Esa combinación de datos solo es posible en el almacén de datos con Segment porque ahí viven pero con RudderStack sí se podría hacer sin la necesidad de hacerlo en el almacén.
El modelo de precios de Segment es un problema también para algunas empresas porque cobran en base a “monthly tracked users” o usuarios únicos mensuales y hay empresas que reciben muchos usuarios pero no perciben un valor inmediato por ellos. Con el modelo de Segment el coste exponencial por el crecimiento en volumen se hace poco asumible para este tipo de empresas. Lo anterior, unido al problema de no poder separar la secuencia de eventos, hace que la solución de RudderStack sea más adecuada en general. Otro punto interesante de RudderStack es que combina una arquitectura de nodo único (gestiona entre 1.500 y 3.000 eventos por segundo) con una multinodos ofreciendo la posibilidad de escalar a un volumen de eventos muy alto (millones) y alta disponibilidad para poder correr inmediatamente cualquier nodo si se cae uno. RudderStack lo hace de tal manera que resulte en paralelo manteniendo un orden de los eventos. Otra cuestión interesante de RudderStack y Snowplow vs. Segment es que ofrece tanto una versión SaaS (para probarla como demostración) como una on-premise, pudiendo quedar alojados en los equipos y servidores que se encuentran dentro de la empresa. A nivel de seguridad, las tres soluciones cumplen las condiciones. Snowplow soporta tanto los servicios principales de AWS y GCP pero claramente es la que menos ha desarrollado la parte de las aplicaciones destino de las tres soluciones, limitándose a las herramientas más populares en cada categoría. RudderStack, por su lado, es la que cuenta con un mayor número de integraciones posibles con almacenes de datos. En concreto, RudderStack se integra con Snowflake, BigQuery, Redshift, PostgreSQL y Clickhouse. Al igual que RudderStack, Snowplow no puede controlar cómo está siendo usado en todos los casos al ser de código abierto pero todas las soluciones se han ajustado a la normativa vigente. La diferencia fundamental entre Snowplow/RudderStack y Segment es el foco porque están pensados como SaaS privados, de código abierto en su núcleo. Segment, en cambio, ha estado más enfocado en crear pipelines de principio a fin en un catálogo de destinos muy amplio. Snowplow, a diferencia de las otras dos alternativas, solo se enfoca en ser un motor que recopila datos de comportamiento, pero no captura eventos de herramientas SaaS. Snowplow recomienda a sus clientes optar por soluciones como Stitch o Fivetran para eso. Snowplow está más dirigido a los equipos de ingeniería de datos, similar a RudderStack, y Segment está mucho más enfocado a las áreas de marketing, ventas y atención al cliente.