O avanço tecnológico e a transformação digital levam, todos os dias, vários setores e segmentos corporativos e criativos a outros patamares de produção. Impulsionados por criações mais ágeis e complexas, o agente humano passa a atuar agora em posições ainda mais reflexivas e analíticas, enquanto a máquina executa as atividades operacionais. Essa é a possibilidade colocada pela generative adversarial networks (GAN). Você já ouviu falar?
Bem, o desenvolvimento da GAN nesse contexto tecnológico apresenta um novo cenário e novas possibilidades de uso das máquinas e da inteligência artificial de forma mais consolidada em vários setores, do atendimento digital à criação de imagens para filmes publicitários, por exemplo.
Percebemos, com isso, que a sociedade se encaminha para uma vivência cada vez mais mediada, com as máquinas tornando-se os principais operadores na geração de dados – insumos para uma série de setores e que influenciam diretamente na tomada de decisões.
Dada a importância da generative adversarial networks, este artigo vai explorar o conceito e sua origem, como funciona, que setores podem se beneficiar e já utilizam para, por fim, compreendermos como elas são geradas. Quer saber mais? Então confira!
Boa leitura!
O que é generative adversarial networks (GANs)?
Partimos do princípio que GANs são arquiteturas de redes gerativas adversárias, uma tecnologia criada em 2014 pelo norte-americano Ian Goodfellow. Dessa forma, uma GAN consiste em uma rede neural do tipo geradora que consegue gerar uma nova informação (uma imagem, por exemplo), a cada vez que é requisitada.
A garantia da informação criada e validada por uma outra rede neural digital denominada discriminadora que determina se a informação é real ou falsa.
A relação das duas redes, geradora e discriminadora, está no fato de que enquanto a discriminadora busca identificar a veracidade da imagem, por exemplo, a geradora tem como função enganar a discriminadora, criando informação a partir de fontes aleatórias. O nome redes adversárias origina-se dessa “disputa” que há entre elas, inclusive.
“Mas como isso é colocado em prática pelas empresas?”
A GAN abre um caminho para que as organizações possam melhorar o atendimento, a experiência dos clientes e os processos internos operacionais, por exemplo, gerando dados cada vez mais qualificados.
Além disso, a novidade das GANs está na complexidade desse tipo de arquitetura para rede neural de modo mais profundo a ser aplicado em inteligência artificial, representando um nível mais avançado para o aprendizado de máquina.
Já que sabemos que a inteligência artificial faz parte de uma série de estratégias corporativas, desde no auxílio da gestão de setores, controle de máquinas, atendimento ao cliente, entre outras possibilidades, dando mais celeridade aos processos, bem como permitindo que gestores voltem sua força de trabalho para questões mais complexas ainda.
Essa reorganização dá maiores condições de se manter competitivo no mercado em que atua. Afinal, é normal que as maiores do mercado estejam sempre atentas em como é possível melhorar cada processo dentro e fora da empresa.
Quais áreas estão sendo beneficiadas?
As generative adversarial networks são potencialmente importantes para o desenvolvimento de um aprendizado de máquina mais eficiente, o que torna possível auxiliar na criação de imagens, vídeos, textos, interação com pessoas, na criação de conteúdos, de aplicativos com capacidade de auto programação, criação de artes visuais, design, cinema e outras tantas possibilidades.
Dessa forma, como mencionado, a GAN pode contribuir principalmente para o aprendizado de máquina aplicado em uma tecnologia com inteligência artificial, bem como em dispositivos com base em IoT.
Das diversas áreas em que as GANs já são aplicadas, temos:
Generative adversarial networks em Gráficos
Aqui a máquina poderá abstrair padrões visuais e aplicá-los no rastreamento de imagens fotográficas com as mesmas características.
Além disso, o algoritmo da rede neural pode criar desenhos com alto nível de qualidade, imitando a capacidade humana de realizá-los. Dessa forma, é possível fazer esboços e transformar em imagens super realistas.
Generative adversarial networks em Fotos
Além de poder corrigir fotos de forma automática, a IA pode ainda gerar e sobrepor elementos visuais na imagem original, transformando uma imagem de baixa resolução em alta, recuperando detalhes e restaurando elementos na imagem que já não se visualizam mais.
Na produção de fotos, a GAN ainda consegue criar fotos de aparência bem natural, a partir de várias referências de rostos existentes, criando uma imagem única e bastante realista.
Generative adversarial networks em Áudio
Com o áudio, a IA consegue renderizar qualquer voz e gerar outras vozes a partir dela, em tom e timbre semelhante à voz humana. Dessa forma, é possível usá-la para criar discursos, músicas, entre outras aplicações.
Além disso, a inteligência pode ser aplicada em serviços de atendimento ao consumidor por comando de voz, por exemplo, em um dos canais disponíveis na estratégia omnichannel. Dessa forma, cria-se várias linhas de atendimento que conseguem dar continuidade às conversas, mesmo estando em diferentes canais e sem interferência.
Generative adversarial networks em Vídeo
Aqui, a IA com rede neural é capaz de ajustar uma imagem em relação à iluminação, coloração ou outro efeito que se queira melhorar. Assim, pode ser utilizada tanto na recuperação de imagens antigas, como adicionar detalhes no processo de edição, dando mais praticidade ao processo de montagem e criação de vídeos.
A GAN já é realidade no cinema. A Pixar, produtora de filmes animados, por exemplo, usa o recurso da rede neural adversária para aumentar a resolução de suas produções.
Generative adversarial networks em texto
Aqui, a rede neural possibilita que a máquina gere texto em linguagem natural em grande velocidade, com riqueza linguística e pode ser usada também para interação com humanos, geração de legenda, construção de narrativas e outras possibilidades, bem como criar novos projetos a partir de textos já existentes.
Como são geradas as variáveis aleatórias?
As variáveis aleatórias são elementos importantes para que possamos compreender o funcionamento de uma GAN. Nesse caso, existem diversos métodos para gerar essas variáveis e mais especialmente o método de transformação inversa que permite gerar variáveis aleatórias complexas a partir de variáveis aleatórias uniformes simples.
Dessa forma, as variáveis aleatórias são o resultado que uma GAN geradora ou discriminadora produz. Elas podem ser classificadas em uniformes e complexas, onde as uniformes têm um desenvolvimento mais simples e as complexas, como o nome sugere, partem de um processo mais robusto.
Existem diferentes técnicas que tem por objetivo criar variáveis aleatórias mais complexas. Entre as quais destacamos: o método da transformada inversa, amostragem de rejeição, algoritmo Metropolis-Hasting e outros.
Todos esses métodos contam com diferentes esquemas oriundos da matemática que voltam-se, essencialmente, para a função de representar a variável aleatória que queremos gerar como o resultado de uma operação (sobre variáveis aleatórias mais simples) ou de um processo.
Assim, a amostragem de rejeição expressa a variável aleatória como o resultado de um processo que consiste em amostrar não a partir de uma distribuição complexa, mas de uma distribuição simples bem conhecida e aceitar ou rejeitar o valor amostrado dependendo de alguma condição.
Após repetir esse processo até que o valor amostrado seja aceito, podemos mostrar que, com a condição certa de aceitação, o valor que será efetivamente amostrado seguirá a distribuição correta.
No algoritmo Metropolis-Hasting, a ideia é encontrar uma Cadeia de Markov (MC) tal que a distribuição estacionária deste MC corresponda à distribuição da qual gostaríamos de mostrar a variável aleatória.
Uma vez que este MC encontrado, podemos simular uma trajetória longa o suficiente sobre este MC para considerar que atingimos um estado estacionário e então o último valor que obtemos desta forma pode ser considerado como tendo sido extraído da distribuição de interesse.
Conclusão
Como vimos neste material, a generative adversarial network é uma tecnologia que otimiza os processos de aprendizado de máquina, e isto pode ser usado em vários setores do meio corporativo ao criativo.
Cabe reforçar que, por mais que a rede neural seja composta de uma rede geradora e outra discriminadora, o objetivo dessa tecnologia não é criar imagens falsas para uso indevido, como construção de fake news, embora tecnicamente possa ser usado com esse fim.
As possibilidades de uso são diversas. Designers, desenvolvedores de sites podem criar imagens originais para compor as páginas. Artistas podem ter outra ferramenta de criação de trabalhos, assim como os trabalhos na indústria cinematográfica podem ser otimizados, em relação ao tempo e ao custo.
Entusiastas já vislumbram um futuro próximo em que esse tipo de tecnologia será aplicada de forma mais efetiva, tanto que a Gartner apontou a GAN como uma tecnologia que pode ajudar na geração e processamento de dados.