Alimentando Aplicativos de IA Generativa com dados em Tempo Real

Alimentando Aplicativos de IA Generativa com dados em Tempo Real

Tornou-se uma crença onipresente na comunidade tecnológica que reunir dados em um repositório central como um data lake é a melhor abordagem para gerenciamento de dados, e é verdade que essa arquitetura ajuda a eliminar silos de dados e torna a governança menos complexa. No entanto, ela não aborda o principal obstáculo ao construir pipelines de IA generativa: movimentação de dados.

Muitos dos casos de uso corporativo mais poderosos para IA generativa exigem acesso oportuno a dados internos da empresa. A geração aumentada por recuperação (RAG) e os bancos de dados vetoriais receberam a maior parte da atenção quando se trata de habilitar esses aplicativos, mas esses não são os únicos requisitos. Também é essencial ter acesso a dados oportunos e precisos.

Aplicativos de IA Generativa Exigem Dados em Tempo Real

Imagine um site de viagens que fornece um assistente de IA generativo que pode ajudar os clientes a planejar férias e reservar hotéis e voos. Este assistente virtual requer informações atualizadas de uma variedade de fontes para fornecer informações precisas. E ele precisa responder em tempo real, porque informações como disponibilidade de hotéis e ofertas especiais mudam com frequência.

Limitações dos Data Lakes e Aplicativos SaaS

A maioria dos data lakes e outros repositórios de dados centralizados funcionam com o princípio de que os dados "pousam" em algum lugar e são então preparados para uso, mas esse processo é muito lento para assistentes inteligentes como o exemplo de viagem acima. Muitas aplicações de IA generativas precisam de dados entregues a um prompt de modelo LLM em tempo real, e data warehouses e data lakes não são adequados para isso.

Dados armazenados em aplicativos SaaS são ainda menos prontos para IA generativa. Por exemplo, os principais fornecedores de gerenciamento de relacionamento com o cliente (CRM) estão competindo para "possuir" toda a jornada do cliente. Mas para muitos casos de uso de IA generativa, esses dados precisarão ser combinados com dados não relacionados ao cliente para responder a perguntas sobre o negócio. Armazenar dados em uma plataforma SaaS não permite a rápida movimentação e unificação de dados que são necessárias para IA generativa.

Streaming de Eventos: A Solução para IA Generativa

Não é que essas arquiteturas não sejam úteis. Cloud data lakes e aplicativos SaaS claramente podem gerar benefícios comerciais significativos. Mas, por si só, eles não são adequados para alimentar os pipelines RAG que alimentam aplicativos de IA generativa com os dados contextuais de que precisam para produzir resultados precisos e oportunos.

A abordagem que funciona melhor para esses aplicativos é o streaming de eventos, porque ele é projetado para circular feeds de dados em uma empresa em tempo real. No exemplo de viagem acima, o sistema precisa recuperar dados de uma variedade de sistemas para chegar à resposta certa, incluindo aplicativos proprietários, aplicativos SaaS, bancos de dados e outros repositórios. Os dados nesses sistemas podem ser normalizados ou não bem contextualizados, e o problema é que esses sistemas devem ser consultados interativamente em tempo real e os dados não podem ser facilmente consolidados. Outros casos de uso incluem videogames multijogador, recomendações de compras personalizadas, aplicativos de compartilhamento de viagens e negociações de ações, onde fornecer informações e atualizações em tempo real com base no contexto é essencial para a experiência do usuário.

Uma arquitetura de streaming de eventos aborda esse problema porque é projetada precisamente para esse tipo de trabalho. Ela reúne constantemente atualizações de sistemas individuais e as apresenta como feeds de dados em tempo real que podem ser entregues a um aplicativo. Quando todas essas fontes de dados são apresentadas como uma visão unificada, elas podem ser conectadas a cada prompt e ajudar a interface de IA generativa a fornecer a resposta certa.

Como Começar

À medida que os casos de uso de IA generativa se expandem, mais startups de IA integrarão dados empresariais em tempo real em suas ofertas. Para ajudar as startups a aprender as habilidades necessárias para integrar a tecnologia de streaming de dados em tempo real em seus aplicativos de IA, a Confluent está lançando um programa de aceleração de IA. Este programa virtual de 10 semanas inclui cursos, acesso antecipado à tecnologia e mentoria da Confluent, créditos Confluent Cloud e outros suportes.

À medida que chatbots e outros assistentes virtuais se tornam mais difundidos, essa necessidade de combinar dados em tempo real de várias fontes aumentará. O RAG fornece o padrão para alimentar dados contextuais em um aplicativo de IA, mas uma plataforma de streaming de eventos garante que todos os dados mais valiosos possam ser fornecidos aos LLMs e entregar experiências atraentes.

Conteúdo Relacionado

Torna al blog

Lascia un commento

Si prega di notare che, prima di essere pubblicati, i commenti devono essere approvati.