Las habilidades precognitivas de los inspectores del Sistema Precrimen de la película Minority Report han dejado de ser un asunto de ciencia ficción gracias a la nueva ciencia de los datos y su principal protagonista, el data scientist, un perfil que se encuentra a medio camino entre el matemático y el informático y cuya misión es obtener conocimiento a través del análisis de los datos.
Estos profesionales tienen profundos conocimientos en estadística, matemáticas y computación científica, pueden trabajar con datos no estructurados procedentes de medios sociales, vídeos y audios y son capaces de transformar los problemas de negocio en modelos matemáticos tratables mediante algoritmos. También tienen grandes dotes de comunicación para transmitir con claridad los resultados relevantes para la toma de decisiones. Como explica Harvard Business Review, “el data scientist es un profesional con entrenamiento y curiosidad para tomar decisiones en el mundo del big data”.
Los 2,5 trillones de bites generados cada día en el mundo sugieren definir nuestra época como “la era del dato”. Pero los datos por sí solos no tienen mucho valor, al igual que el oro o la plata sirven de poco cuando están formando parte de la acantita o la silvanita. Se necesita un procedimiento capaz de transformar esos datos en información y conocimiento, al igual que se requiere un procedimiento para transformar los minerales en las diferentes sustancias químicas útiles para la industria.
Gracias al uso de tecnologías de analítica de negocio, como el data science y el big data, las empresas pueden transformar la enorme cantidad de datos almacenados en conocimiento útil para su negocio. Además, estas tecnologías no se utilizan solo en el sector privado para incrementar las ventas de productos y servicios sino que, en algunos países, el sector público también las está aplicando para conocer a los ciudadanos, promoviendo una relación más cercana con las personas y luchando contra el fraude fiscal.
Uno de los aspectos más relevantes, aunque muy poco señalado, de la ciencia de datos es su contribución a la clasificación de perfiles, detectando y monitorizando, por ejemplo, el comportamiento de los defraudadores y ayudando a reducir drásticamente su número. Los científicos de datos trabajan sobre millones de contribuyentes caracterizados por miles de variables vinculadas con los modelos de declaración de los impuestos y con cientos de millones de relaciones entre personas y/o empresas recogidas en las bases de datos.
Generalmente se trabaja sobre la hipótesis de que los defraudadores se parecen entre sí y se distinguen de los honrados, lo que supone la implementación de algoritmos basados en estadística multivariante que, mezclados con las técnicas inteligencia artificial, forman los algoritmos de machine learning o aprendizaje automático. Estos algoritmos se utilizan, por ejemplo, para reconocer los perfiles de empresas que emiten facturas falsas, agrupándolas y clasificándolas, lo cual nos puede ayudar a detectar este tipo de fraude con un porcentaje de acierto de en torno al 90%.
Otra hipótesis sobre la que trabaja el científico de datos y que afecta principalmente a tramas de blanqueo de capitales procede de la famosa teoría criminológica de la asociación diferencial, según la cual a medida que un individuo está más expuesto al delito (tanto por la cantidad de delincuentes con los que se relaciona, como por la duración y estabilidad de estas relaciones) aumentan las probabilidades de que dicho individuo se convierta en un delincuente. En efecto en nuestro caso asumimos que los defraudadores colaboran entre sí y aprenden unos de otros, lo que trae consigo la realización de análisis de redes formadas por cientos de millones de relaciones.
Por ejemplo, para detectar un tipo particular de tramas de blanqueo de capitales, se buscan grupos de empresas con una enorme cantidad de relaciones comerciales entre ellas y muy pocas con el exterior, calculándose un índice de aislamiento para cada trama, que de ser suficientemente alto puede ser seleccionada para su estudio en detalle. Si además la trama está constituida por personas jurídicas estrechamente relacionadas más allá de sus transacciones comerciales, la posibilidad de estar ante una trama de blanqueo de capitales se multiplica. De este modo se detectan unas 200 tramas anuales que mueven cientos de millones de euros en nuestro país.
En general el inspector tiene que basarse en su experiencia e instinto, encontrar diferencias notables al cruzar datos de diferentes impuestos o tener suerte para detectar las anomalías que mediante el uso de los algoritmos adecuados pueden ser detectadas automáticamente y de forma masiva. Así, la tecnología no solo permite ahorrar dinero, sino también una cantidad considerable de horas de trabajo y esfuerzo.
Fuente: Retina