Gatos, IA e storage: A reflexão que você não sabia que precisava
Paulo de Godoy, country manager da Pure Storage no Brasil
Sejam memes, vídeos fofos ou jogos temáticos, a Internet está inundada de gatos. Não importa se você está nas redes sociais ou buscando notícias e entretenimento, algum conteúdo de gato vai chegar à sua tela. Inclusive, você pode até ter um ou dois gigas de armazenamento de telefone dedicados ao seu próprio gato – não julgo.
Por isso, hoje trago aqui uma reflexão curiosa: Quanto dos dados do mundo são relacionados a esse fenômeno felino?
Tráfego de gatos na Internet
Uma pesquisa de 2015 apontou que conteúdos relacionados a gatos geram cerca de 15% do tráfego total da Internet. Muitos anos se passaram – e os registros só aumentam – mas se usarmos essa porcentagem como base, dos cerca de 5,19 bilhões de pessoas que utilizam regularmente a Internet, 778,5 milhões acessam, em algum momento, gatos e/ou conteúdos relacionados a eles todos os meses. Agora, a questão que importa é: lembre-se que todos esses dados precisam ser armazenados em algum lugar.
Conteúdo de gatos são dados não estruturados – que também estão bombando
Os gatos não podem estar fisicamente em um data center – são muitos cabos para mastigar – mas, virtualmente, eles se sentem em casa. Você provavelmente já leu muito sobre dados não estruturados em meus artigos – são os dados que não possuem um modelo predefinido ou que não são facilmente organizados em tabelas. Cerca de 90% dos dados do mundo são dados não estruturados e esse número só vai crescer.
O conteúdo felino é praticamente todo não estruturado – vídeos, fotos e áudio. É muito parecido com pelos de gato em casa; você não percebe o quanto existe até começar a tentar controlar esse caos.
Então, quantos dados não estruturados de gatos existem?
Em 2010, estimou-se que havia cerca de 1,3 bilhão de fotos de gatos na internet. Hoje, esse número deve ser superior a 6,5 bilhões. O tamanho médio da imagem JPEG varia entre 3,5 MB e 7 MB – faça as contas! Mais de 2 milhões de vídeos de gatos foram postados no YouTube somente em 2014, o que representou mais de 26 bilhões de visualizações. Agora, quase uma década depois, o número de vídeos de gatos no YouTube já se multiplicou muito. E o TikTok está explodindo com esse tipo de conteúdo – incluindo a página de um gato chamado Paquito, que traz diversos vídeos com dezenas de milhões de visualizações.
Os gatos estão até criando seus próprios vídeos agora. O New York Times noticiou: “A ascensão da tecnologia de câmeras vestíveis, embora usada com mais frequência por esportistas do que por animais de estimação, trouxe um novo estilo de nicho de conteúdo para gatos”. Esses vídeos em alta resolução acoplados aos animais permitem que os gatos transmitam suas aventuras, como o Mr. Kitters e seus amigos, que têm mais de 1 milhão de seguidores no Instagram.
É difícil afirmar hoje quanto dos dados não estruturados do mundo são conteúdo de gatos, mas aqui vai uma noção: se você começasse agora, ainda não seria capaz de consumir todo o conteúdo de gatos da Internet durante a sua vida.
Gatos e inteligência artificial
Todos nós sabemos que os dados estão explodindo – ainda mais agora com a IA generativa nos ajudando a criar conteúdo, imagens e possivelmente até GIFs de gatos. O CatGPT – Cat mesmo, você não está lendo errado – está afundando suas garras em grandes modelos de linguagem (LLMs) alimentados por IA com recursos como GPT-Meow (faça uma pergunta, ele mia de volta) e GPT-Furr, um modelo integrado ao ChatGPT para obter respostas reais de IA e GIFs animados de gatos.
Testei o CatGPT perguntando se os ratos mastigam fios em data centers e parece que os gatos estão firmes na missão de dar respostas robustas:
Ou seja, a IA generativa com foco na realidade alternativa felina está fornecendo respostas às nossas perguntas e criando sua própria arte de IA para ajudar a aumentar a adoção da ferramenta.
Por que isso é importante para os negócios?
Embora os gatos possam ser criaturas misteriosas, uma coisa é certa: o conteúdo e os dados sobre gatos estão se multiplicando – e isso não vai parar. Os números deste artigo representam uma porcentagem de uma imensidão de dados não estruturados com os quais lidamos todos os dias e continuarão aumentando em alta velocidade.
Isso significa que a preocupação com o armazenamento desses dados, principalmente dentro de empresas, nas quais se consome dados pessoais e corporativos simultaneamente, deve ser colocada no topo das discussões das lideranças. Esse aumento exponencial e contínuo dos dados precisa estar apoiado em tecnologia avançada e simplificada para que seja possível armazenar, movimentar e até mesmo proteger todo conteúdo existente e o que ainda está por vir, principalmente quando estão relacionados aos negócios.
Paulo de Godoy tem 20 anos de experiência no mercado de TI, com foco em vendas de soluções para empresas de armazenamento, segurança, integração e interconectividade. O executivo ocupou cargos de liderança em empresas de destaque no setor tecnológico, como Hitachi, IBM e NetApp. Paulo iniciou as atividades na Pure Storage como gerente de vendas em 2014, e em 2016 assumiu a gerência geral da companhia no Brasil.