O que são os embeddings no Machine Learning?
Compreender os embeddings DE ML
Explore o conceito de integração no aprendizado de máquina, seu papel e como eles melhoram a representação e a análise de dados em aplicações de IA.
Conteúdo
Páginas relacionadas
Bem-vindo ao nosso Centro de Aprendizagem, onde explicamos “o que são embutidas” no aprendizado de máquina. Explorando vetores multidimensionais, redes neurais, e para entender melhor como as incorporações estão moldando o futuro da inteligência artificial.
Os modelos de aprendizagem automática estão continuamente a ultrapassar os limites do que é possível. Um dos elementos fundamentais que impulsionam esses avanços é a incorporação. Estas representações de valores ou objetos, quer sejam texto, imagens ou áudio, servem de base para modelos de aprendizagem automática e algoritmos de busca semântica. Nesta exploração abrangente, vamos aprofundar o mundo dos embeddings, deciframos o seu significado, como eles funcionam, e o seu papel crucial na formação do futuro da IA, incluindo a sua integração na plataforma de borda de Edgio .
A essência dos embeddings
Na sua essência, os embeddings podem ser pensados como os tradutores do mundo digital. Eles tomam entidades, sejam palavras, documentos, ou mesmo cidades, e convertem-nas numa forma matemática que as máquinas conseguem entender. Esta transformação está enraizada na captura das caraterísticas e caraterísticas essenciais destes objetos, encapsulando-os em vetores que representam as suas qualidades e relações únicas.
Em essência, os embeddings capacitam os modelos de aprendizado de máquina a distinguir a semelhança entre os objetos. Quer se trate de encontrar documentos, imagens ou cidades semelhantes, os embeddings abrem caminho para que os computadores compreendam a intrincada teia de relações que existe no nosso mundo digital. Como tal, eles são os blocos de construção da inteligência artificial, permitindo que as máquinas compreendam e raciocinem sobre os dados. Para explorar mais sobre a IA e as suas capacidades, considere ler sobre o que é a Inteligência Artificial .
O conceito principal: Vetores no aprendizado de máquina
Para compreender verdadeiramente o conceito de embeddings, temos primeiro de compreender o conceito fundamental sobre o qual são construídos: Vetores. Em matemática, um vetor é um conjunto de números que define um ponto num espaço multidimensional. No domínio da aprendizagem automática, os vetores servem como bússola que nos guia através deste espaço multidimensional, permitindo-nos navegar e fazer sentido a dados complexos.
Em termos mais práticos, um vetor é uma lista de valores numéricos, como 1989, 22, 9, 180. Cada número nesta lista representa a posição de um objeto ao longo de uma dimensão específica. Este conceito torna-se inestimáveis quando procuramos encontrar semelhanças ou relações entre objetos, semelhantes à forma como utilizamos a IA preditiva para antecipar tendências e comportamentos futuros.
Exemplo de como usar um vetor em ML
Consideremos o exemplo das coordenadas de latitude e longitude. Estas duas dimensões, norte-sul (latitude) e leste-oeste (longitude), indicam sucintamente qualquer localização na Terra. Por exemplo, a cidade de Vancouver, Colúmbia Britânica, Canadá pode ser representada como as coordenadas de latitude e longitude [15’40″N, 49 123 06’50″W]. Esta lista concisa de dois valores forma um vetor simples, definindo a localização geográfica de Vancouver.
Agora, imaginem a tarefa de encontrar uma cidade perto de Vancouver. Um observador humano pode consultar um mapa, enquanto um modelo de aprendizagem automática pode examinar os vetores de latitude e longitude. Ao identificar um local com coordenadas semelhantes, como Burnaby a 49 16’N, 122 58’W, o modelo deduz que Burnaby está muito próximo de Vancouver. Este exemplo ilustra como os vetores permitem às máquinas compreender as relações espaciais.
Adicionando dimensões aos vetores
Para ilustrar ainda mais o poder dos vetores, vamos expandir o nosso exemplo geográfico. Imaginem que desejamos identificar uma cidade semelhante a Vancouver, não apenas em termos de proximidade, mas também em tamanho populacional. Aqui, introduzimos uma terceira dimensão ao nosso vetor, que representa o tamanho da população.
O vetor de Vancouver passa a ser 49 15’40″N, 123 06’50″W, 662 248*). Neste espaço tridimensional, o vetor de Burnaby (49-16’N, 122-58’W, 249 125*) já não aparece particularmente perto de Vancouver. Em vez disso, o modelo de aprendizagem automática pode identificar Seattle, Washington, EUA, como uma correspondência mais adequada com um vetor de 47 36’35″N, 122 19’59″W, 749 256**.
Neste cenário, adicionámos uma terceira dimensão aos nossos vetores, análoga à introdução de um eixo Z às nossas coordenadas de latitude e longitude. Isto permite-nos considerar a proximidade geográfica e o tamanho da população quando procuramos locais semelhantes.
*Dados populacionais a partir de 2021.
** Dados populacionais a partir de 2022.
Além de três dimensões: Vetores multidimensionais complexos
No mundo da aprendizagem automática, os vetores não se limitam a apenas três dimensões. Eles podem abranger uma infinidade de dimensões, cada uma capturando um aspeto único de um objeto. Considerem o desafio de determinar a semelhança entre dois programas de TV. Inúmeros fatores entram em jogo, como a duração do episódio, o género, a demografia dos espetadores e muito mais.
Neste intrincado espaço multi-dimensional, cada programa de TV pode ser representado como um ponto ao longo de inúmeras dimensões, semelhantes à latitude, longitude e tamanho da população. Aqui está um exemplo que ilustra como isto funciona:
- Seinfeld (Sitcom) – Vetores: 1989, 22-24 minutos por episódio, 9 temporadas, 180 episódios
- Quarta-feira (horror) – Vetores: 2022, 46-57 minutos por episódio, 1 temporada, 8 episódios
Nesta representação, Seinfeld e quarta-feira ocupam pontos muito diferentes no espaço multidimensional dos programas de TV. Diferem não só no género e no ano de estreia, mas também na duração do episódio e no número de estações e episódios. Esta abordagem multidimensional permite que os modelos de aprendizagem de máquina percebam as nuances intrincadas que definem a semelhança ou a dissimilaridade entre objetos.
Embora os nossos exemplos acima incorporem apenas algumas dimensões, na prática, os modelos de aprendizagem de máquina funcionam frequentemente em espaços muito mais elevados, por vezes abrangendo centenas ou até milhares de dimensões. Estes complexos vetores multidimensionais servem de base para aplicações avançadas de IA.
Desvendar a magia: Como funcionam os embeddings
Os embeddings são o produto de modelos de aprendizagem profunda, particularmente redes neurais. Eles são criados através de um processo que envolve converter objetos em vetores usando técnicas de aprendizagem profunda. Uma “incorporação” representa essencialmente a saída deste processo – um vetor meticulosamente criado por um modelo de aprendizagem profunda com o propósito expresso de facilitar pesquisas de similaridade.
Eis como funciona:
Redes neurais e camadas escondidas
As redes neurais, inspiradas na estrutura do cérebro humano, formam a base da incorporação da criação. Estas redes compreendem múltiplas camadas, incluindo uma camada de entrada, uma camada de saída e, mais crucialmente, camadas escondidas. É dentro dessas camadas ocultas que os embeddings são trazidos à vida, semelhante à forma como a computação sem servidor aproveita os recursos da nuvem para uma implementação eficiente de aplicativos.
Camadas ocultas em redes neurais possuem a notável capacidade de transformar dados de entrada de várias maneiras, com base na arquitetura e design do modelo. A criação de embeddings normalmente ocorre dentro dessas camadas ocultas, antes que as camadas subsequentes processem a entrada mais longe.
Imaginem que queriam criar embeddings para programas de TV. Em vez de especificar manualmente a posição de cada programa de TV ao longo de uma infinidade de dimensões, a camada oculta de uma rede neural assume esta tarefa. Gera automaticamente embutidas que captam os atributos essenciais de cada programa de TV, aproveitando os ricos dados inseridos na rede.
Inicialmente, um programador pode guiar a rede fornecendo exemplos de como criar embeddings, quais dimensões considerar, e outras informações relevantes. No entanto, à medida que a rede neural treina, a camada de incorporação gradualmente torna-se proficiente em operar de forma independente, refinando a sua capacidade de gerar incorporações que capturam a essência de cada objeto.
Embeddings em modelos de linguagem grande (LLMs)
O conceito de embeddings tem uma viragem fascinante quando aplicado a grandes modelos de linguagem (LLM), como aqueles que alimentam ferramentas de IA como o ChatGPT. Nestes modelos avançados, a incorporação estende-se para além dos objetos individuais para abranger contextos inteiros.
Em essência, cada palavra ou símbolo numa frase, parágrafo ou artigo torna-se uma incorporação, capturando não só o significado de palavras individuais, mas também as intrincadas relações e nuances semânticas dentro do texto. Este nível de análise é semelhante ao sofisticado processamento de dados encontrado nas melhores práticas do DevOps , onde múltiplas variáveis são consideradas para resultados ótimos.
Conclusão
Em conclusão, os embeddings servem como a pedra angular da capacidade do aprendizado de máquina de decifrar os meandros do nosso mundo digital. Estas representações matemáticas permitem que as máquinas compreendam, raciocinem e descubram relações entre vários objetos, do texto às imagens e muito mais. À medida que continuamos a explorar a inteligência artificial, é essencial reconhecer o profundo significado das incorporações, não só na formação do presente, mas também na condução das inovações do futuro.
Para obter mais informações e melhores práticas sobre como aproveitar a Inteligência Artificial , explore o nosso centro de aprendizagem.
Páginas relacionadas
- O que é a Inteligência Artificial?
- Aproveitando a IA para otimização de desempenho
- Centro de Aprendizagem de Inteligência Artificial
Tem perguntas?
Para quaisquer dúvidas ou mais informações sobre como o Edgio pode ajudá-lo a usar a IA para otimizar a sua aplicação e segurança, entre em contato com os nossosespecialistas . A nossa equipa dedica-se a fornecer as informações e o suporte de que necessita para navegar pelas complexidades do desenvolvimento do ciclo de vida das aplicações web.
Tópicos em destaque
Últimas ameaças de segurança cibernética 2023