Construindo uma arquitetura centrada em dados para uma IA de sucesso
A arquitetura centrada em dados elimina a necessidade de as informações serem movidas entre sistemas antigos e novos e mantém os dados e aplicativos corporativos funcionando enquanto a tecnologia é construída em torno deles.
Paulo de Godoy, gerente geral de vendas da Pure Storage Brasil
A quarta revolução industrial, alimentada pela IA – inteligência artificial e o machine learning, não apenas transformará a nossa sociedade, mas já a revoluciona. A IA já está tendo um impacto incrível em alguns setores, como na área da saúde, em testes genômicos, maior entendimento das doenças em lavouras e melhoria do gerenciamento de tráfego nas cidades.
IA não é uma tecnologia nova. Ela existe desde 1950, mas até recentemente estava restrita a projetos acadêmicos e a um punhado de pequenas organizações do mundo. De fato, muitos smartphones e outras tecnologias que utilizamos adotam IA. Assistentes de voz e texto preditivo são usados diariamente por milhões de pessoas. No entanto, agora, a tecnologia avançou ao ponto em que ela é viável para que empresas de todos os portes a adotem.
Este novo “big bang” da adoção da IA é alimentado por uma tempestade perfeita de três tecnologias principais: DL – deep learning, GPUs – unidades de processamento gráfico e big data.
Colocando as fundações
Inspirado pelo cérebro humano, o deep learning usa redes neurais maciçamente paralelas, efetivamente escrevendo o seu próprio software e aprendendo com um grande número de exemplos.
A tecnologia já provou ser altamente útil em campos onde os dados são menos numéricos e requerem uma abordagem mais cognitiva. Tarefas como reconhecimento de fala e áudio, processamento de linguagem ou compreensão visual, provavelmente, não teriam progredido tão rapidamente usando técnicas padrão de machine learning.
As GPUs são a segunda tecnologia por trás da IA. As GPUs modernas, com milhares de núcleos, são adequadas para executar algoritmos que representam o cérebro humano. Usar a GPU certa significa que cientistas de dados e acadêmicos são capazes de executar projetos de IA cada vez mais complexos e detalhados.
Deep learning e GPUs são grandes avanços e tecnologias que mudam o jogo. Quando aplicadas à terceira peça do quebra-cabeça, o big data, o potencial de inovação é incrível. No entanto, enquanto DL e GPUs estão progredindo, muitas tecnologias de armazenamento ficaram para trás. Consequentemente, existe uma lacuna de desempenho entre o elemento de cálculo (DL e GPUs) e o armazenamento, limitando a capacidade em que as empresas podem capitalizar os dados que têm crescido a uma taxa exponencial.
Desbloquear o potencial dos dados por meio da inovação de infraestrutura
É fundamental que as organizações invistam em tecnologias equipadas para lidar com o crescimento explosivo de dados dos últimos anos. Na medida em que o tamanho dos conjuntos de dados aumenta, movê-los e replicá-los se torna uma despesa proibitiva e um obstáculo à inovação. E para isso, um novo modelo é necessário: a arquitetura centrada em dados.
Uma arquitetura centrada em dados é um design moderno que coloca os dados no centro da infraestrutura de uma organização. Isso elimina a necessidade de as informações serem movidas entre sistemas antigos e novos e mantém os dados e aplicativos corporativos funcionando enquanto a tecnologia é construída em torno deles. O objetivo é trazer o elemento de computação para os dados, em vez do contrário. Isso significa que as organizações podem gastar menos tempo e despesas movendo dados e mais tempo inovando e fazendo uso de conjuntos de dados.
Para realmente se beneficiar dessa arquitetura, o sistema precisa trabalhar em tempo real, fornecendo o desempenho necessário para a próxima geração de análises que tornam a IA tão poderosa. Ele também tem de estar disponível sob demanda e ser autônomo, ou seja, não requer gerenciamento constante, permitindo que a operação de TI atue como um provedor de serviços de armazenamento para a organização. Ao consolidar e simplificar isso, por meio do flash, fica muito mais fácil para as equipes suportarem a tecnologia que está alimentando o crescimento de amanhã.
Aproveitando big data, GPU e DL por meio do armazenamento
Ao otimizar o emparelhamento de computação e armazenamento dessa maneira, as organizações podem definir uma arquitetura de referência de implantação que forneça às GPUs a infraestrutura de armazenamento ideal, combinando velocidade do armazenamento conectado localmente com a simplicidade, capacidade e consolidação do armazenamento compartilhado.
Organizações como Paige.AI e Global Response já estão usando essa abordagem otimizada em computação e armazenamento para suportar os seus projetos de IA.
Paige.AI é uma organização focada em revolucionar o diagnóstico clínico e o tratamento em oncologia com o uso da IA. Patologia é a pedra angular da maioria dos diagnósticos de câncer. No entanto, a maioria dos diagnósticos patológicos se baseia em processos manuais e subjetivos, desenvolvidos há mais de um século. Ao alavancar o potencial da IA, a Paige.AI pretende transformar a indústria de patologia e diagnóstico de altamente qualitativa para uma disciplina quantitativa mais rigorosa.
Com acesso a um dos maiores arquivos de patologia tumoral do mundo, a organização precisava da infraestrutura de DL mais avançada disponível para transformar rapidamente grandes quantidades de dados em aplicativos de IA validados clinicamente.
Para organizações como a Global Response, a IA representa uma oportunidade para reinventar modelos de negócios existentes. A Global Response iniciou o desenvolvimento de um sistema de centro de atendimento de última geração que permite a transcrição e análise em tempo real de chamadas de suporte ao cliente. Isso trará experiências superiores para o cliente e soluções mais rápidas – ambas cada vez mais importantes na medida em que as expectativas do consumidor mudam em direção a experiências personalizadas.
A Global Response chegou a um ponto de inflexão no qual a integração da IA em toda a organização era fundamental para o sucesso contínuo do negócio. Ao usar uma solução que integra software e hardware de última geração, ela permitiu que as equipes de resposta global funcionassem em horas, não em semanas ou meses.
Colocando dados no centro de sua operação
Até 2020, o Gartner prevê que a IA será difundida em quase todos os produtos e serviços baseados em software disponíveis. Para que isso seja uma realidade, as organizações precisam garantir que os dados estejam no centro de sua abordagem de TI. Sem a adoção de uma arquitetura centrada em dados, as organizações ainda podem tentar utilizar o poder de computação que o DL e as GPUs oferecem, mas com pouco efeito.
A IA verdadeiramente bem-sucedida depende dessa parceria perfeita entre poder de computação e armazenamento. Sem isso, todo o potencial dos dados não será realizado.