Data driven já é passado?
Jhonata Emerick, cofundador da Datarisk
O data driven já é “coisa” do passado? Na minha opinião a resposta é sim. Sei que muitas empresas se posicionam como tal – defendendo o modelo como uma vantagem competitiva – porém, muitas outras ainda não conseguiram evoluir como deveriam.
Para a introdução de um ponto de vista assertivo em relação aos aspectos evolutivos, imaginem comigo o seguinte cenário: um ciclo de desenvolvimento de produto que tenha modelos estatísticos como base, permitindo a captura de dados superiores e, consequentemente, novos modelos de machine learning em constante evolução, melhorando, assim, o produto e gerando um ciclo virtuoso. Isso tudo cria um processo – quase sem fricção – de melhoria contínua em vez de ser impulsionado por avaliações e avanços humanos, como ainda é feito no modelo data driven.
Para facilitar o entendimento, podemos comparar os modelos de machine learning com uma criança que está aprendendo a falar. Da mesma forma que ela – no que se diz à cognição, os algoritmos de machine learning aprendem a primeira vez e depois generalizam. Por exemplo, quando você mostra uma foto de um cachorro para uma criança pela primeira vez, é preciso explicar o que de fato é esse animal. Na sequência, quando mostrar a mesma imagem, ela terá a capacidade de identificar aquilo, sem a necessidade de grandes informações. Assim, ela saberia separar cães de gatos, da mesma forma que um modelo saberia diferenciar um fraudador de um não fraudador.
Apresentado este raciocínio, podemos dizer que um negócio orientado por modelos é algo que vai além de uma empresa direcionada por dados. Em um comparativo, uma empresa orientada por dados coleta e faz análises estatísticas para ajudar pessoas a tomarem as melhores decisões para seus empreendimentos. Nela, os mesmos ajudam os negócios. Já em negócio orientado por modelos, os mesmos são o próprio negócio. Esse é o cenário da vez dentro das empresas e startups.
Atualmente, muito se ouve falar sobre inteligência artificial e big data, contudo, os modelos são a fonte do poder por trás dessas ferramentas. Um modelo em sua definição é um conjunto de equações matemáticas ou regras que tentam explicar algum fenômeno ou prever algum fato, como, por exemplo, a possível inadimplência ou até mesmo seu próximo cliente.
A grande beleza nessa criação é o fato de não precisar haver intervenção humana – “viés humano” – que por muitas vezes toma ações baseadas em intuição e não em dados. Esses algoritmos são treinados para sempre otimizarem os resultados e observarem características que nenhuma pessoa conseguiria fazer por meio de centenas de milhares ou, até mesmo, milhões de informações. Uma vez desenvolvido, um modelo pode aprender com seus sucessos e fracassos em uma velocidade e sofisticação que os humanos normalmente não conseguem acompanhar.
Um negócio orientado por modelos, então, usa os mesmos para impulsionar as principais decisões em seus processos de negócios, criando linhas de receita ou redução de custos baseado no aumento da eficiência. Construir este sistema requer um mecanismo, muitas vezes fundamentado em software, para coletar dados, criando processos claros para o desenvolvimento a partir deles e, ainda, um mecanismo para atuar na sugestão dos próprios modelos.
Empresas como Netflix, Tecent e Amazon demonstram essa característica como descreveram Steven A. Cohen e Matthew W. Granade no artigo “Models Will Run the World“, no WSJ. No caso da Netflix, seu algoritmo de recomendação é famoso, sendo responsável por 80% do consumo de conteúdo. Sempre que um cliente aceita ou rejeita uma recomendação, o algoritmo da marca em questão melhora. Esta transformação está tomando forma em vários setores, incluindo alguns descritos como “tradicionais”, sendo: agricultura, logística e serviços.
Quem vai ganhar esse jogo? Provavelmente quem tem a melhor capacidade de construir, integrar e fazer gestão dos modelos estatísticos aos seus negócios, ou seja, quem coletar os melhores dados sobre clientes e se manter no círculo virtuoso. Na busca pela vantagem competitiva, as empresas guiadas por modelos vão acelerar o processo nos próximos anos e a aposta é nos negócios orientados por modelos: “model-driven”.
Jonata Emerick é cofundador da Datarisk. Graduado em Engenharia Aeronáutica pela Escola de Engenharia de São Carlos da Universidade de São Paulo (USP), mestre em Finanças Quantitativas pela FGV – Fundação Getúlio Vargas e autor do livro “Econometria com Eviews – Guia Essencial de Conceitos e Aplicações”. Professor de Machine Learning na Fundação Instituto de Administração lecionando nos cursos de MBA e pós-graduação em Data Mining e Big Data.