Home 학습 센터 AI 학습 센터 홈 ML에 포함되는 것은 무엇입니까?
애플리케이션

기계 학습에 포함되는 것은 무엇입니까?

ML 임베딩 이해

머신 러닝에 포함되는 개념과 역할, AI 애플리케이션에서 데이터 표현 및 분석을 향상시키는 방법에 대해 알아봅니다.

내용

관련 페이지

학습 센터에 오신 것을 환영합니다. 여기서 기계 학습의 “임베딩이란 무엇입니까?”에 대해 설명합니다. 다차원 벡터, 신경망을 탐구하고 임베딩이 인공 지능의 미래를 어떻게 형성하고 있는지 더 잘 이해합니다.

기계 학습 모델은 가능한 것의 경계를 끊임없이 밀어 붙이고 있습니다. 이러한 발전을 추진하는 기본 요소 중 하나는 임베딩입니다. 텍스트, 이미지 또는 오디오 등 값이나 객체의 이러한 표현은 기계 학습 모델과 의미 검색 알고리즘의 기초가 됩니다. 이 포괄적 인 탐구에서 우리는 임베딩의 세계를 깊이 탐구하여 그 중요성, 작동 방식 및 Edgio의 에지 플랫폼 에 통합되는 것을 포함하여 AI의 미래를 형성하는 데 중추적인 역할을 해독합니다.

임베딩의 정수

그 핵심에서 임베딩은 디지털 세계의 번역가로 생각할 수 있습니다. 단어, 문서, 심지어 도시를 포함한 개체들을 기계가 이해할 수 있는 수학적 형태로 변환한다. 이러한 변환은 이러한 객체의 본질적인 특성과 특성을 포착하여 고유한 특성과 관계를 나타내는 벡터로 캡슐화하는 데 뿌리를 두고 있습니다.

기본적으로 임베딩은 기계 학습 모델이 개체 간의 유사성을 식별할 수 있도록 합니다. 비슷한 문서, 이미지, 도시 등 어떤 것을 찾아내든, 임베딩은 컴퓨터가 디지털 세상 내에 존재하는 복잡한 관계의 웹을 파악할 수 있는 길을 열어줍니다. 이와 같이, 그들은 인공 지능의 구성 요소이며, 기계가 데이터를 이해하고 추론할 수 있도록 합니다. AI와 AI의 기능에 대해 자세히 알아보려면 인공 지능이란 무엇인가 를 읽어보십시오 .

핵심 개념: 머신 러닝의 벡터

임베딩의 개념을 진정으로 이해하기 위해서는 먼저 그것들이 만들어지는 기본 개념인 벡터를 이해해야 한다. 수학에서 벡터는 다차원 공간에서 점을 정의하는 숫자 배열입니다. 기계 학습의 영역에서 벡터는 다차원 공간을 통해 우리를 안내하는 나침반 역할을 하여 복잡한 데이터를 탐색하고 이해할 수 있게 합니다.

좀 더 실용적인 용어로, 벡터는 {1989, 22, 9, 180}과 같은 숫자 값의 목록입니다. 이 목록의 각 숫자는 지정된 차원을 따르는 개체의 위치를 나타냅니다. 이 개념은 우리가 미래의 추세와 행동을 예측하기 위해 예측 AI를 활용하는 방법과 마찬가지로 객체 간의 유사점이나 관계를 찾을 때 매우 중요합니다.

ML에서 벡터를 사용하는 방법의 예

위도 및 경도 좌표의 예를 생각해 보십시오. 이 두 차원, 남북 (위도)과 동서 (경도)는 지구상의 모든 위치를 간결하게 정확히 지적합니다. 예를 들어, 캐나다 브리티시 컬럼비아 주 밴쿠버시는 위도 및 경도 좌표 {49°15’40″N, 123°06’50″W}로 나타낼 수 있습니다. 이 두 값의 간결한 목록은 밴쿠버의 지리적 위치를 정의하는 간단한 벡터를 형성합니다.

이제 밴쿠버 근처의 도시를 찾는 작업을 상상해보십시오. 인간 관찰자는 지도를 참조할 수 있지만 기계 학습 모델은 위도와 경도 벡터를 조사할 수 있습니다. 버나비가 {49°16’N, 122°58’W}의 좌표와 같은 유사한 위치를 식별함으로써, 모델은 버나비가 밴쿠버에 근접해 있음을 추론한다. 이 예제는 벡터가 어떻게 기계가 공간 관계를 이해할 수 있도록 하는지를 보여준다.

벡터에 치수 추가하기

벡터의 힘을 더 설명하기 위해, 우리의 지리적 예를 확장해 봅시다. 우리가 밴쿠버와 비슷한 도시를 식별하고 싶다고 상상해 봅시다. 근접성뿐만 아니라 인구 규모도 마찬가지입니다. 여기서 우리는 인구 크기를 나타내는 벡터에 3차원을 소개합니다.

밴쿠버의 벡터는 이제 {49°15’40″N, 123°06’50″W, 662,248*}이 됩니다. 이 3차원 공간에서 버나비의 벡터 {49°16’N, 122°58’W, 249,125*}는 더 이상 밴쿠버에 가깝게 나타나지 않는다. 대신 기계 학습 모델은 미국 워싱턴주 시애틀을 {47°36’35″N, 122°19’59″W, 749,256**}의 벡터와 더 적합한 일치로 식별할 수 있습니다.

이 시나리오에서는 벡터에 3차원을 추가했습니다. 위도와 경도 좌표에 Z축을 추가하는 것과 유사합니다. 이를 통해 유사한 위치를 찾을 때 지리적 근접성과 인구 크기를 모두 고려할 수 있습니다.

* 2021년 기준 인구 데이터.
** 2022년 기준 인구 데이터.

3차원 이상: 복잡한 다차원 벡터

기계 학습의 세계에서 벡터는 단지 3차원으로 제한되지 않습니다. 다양한 차원을 포함할 수 있으며, 각 차원은 개체의 고유한 측면을 캡처합니다. 두 TV 프로그램 간의 유사성을 확인하는 과제를 고려하십시오. 에피소드 길이, 장르, 시청자 인구 통계 등 다양한 요인이 작용합니다.

이 복잡한 다차원 공간에서 각 TV 쇼는 위도, 경도 및 인구 크기와 유사한 다양한 차원의 점으로 표현될 수 있습니다. 다음은 이러한 작동 방식을 보여주는 예입니다.

  1. Seinfeld (시트콤) – 벡터: {[시트콤], 1989, 에피소드당 22-24분, 9시즌, 180화}
  2. 수요일 (공포) – 벡터: {[공포], 2022, 46-57 에피소드 당 분, 1 시즌, 8 에피소드}

이 표현에서 Seinfeld와 수요일은 TV 쇼의 다차원 공간에서 매우 다른 지점을 차지합니다. 그들은 장르와 데뷔 년도뿐만 아니라 에피소드 길이와 계절과 에피소드의 숫자도 다릅니다. 이러한 다차원적 접근 방식을 통해 기계 학습 모델은 객체 간의 유사성 또는 비유사성을 정의하는 복잡한 뉘앙스를 식별할 수 있습니다.

위의 예제는 소수의 차원만 포함하지만, 실제로 기계 학습 모델은 종종 훨씬 더 높은 차원의 공간에서 작동하며 때로는 수백 또는 수천 차원에 걸쳐서 작동합니다. 이러한 복잡한 다차원 벡터는 고급 AI 애플리케이션의 기반이 됩니다.

마법 발표: 임베딩의 작동 방식

임베딩은 딥 러닝 모델, 특히 신경망의 산물입니다. 딥 러닝 기술을 사용하여 객체를 벡터로 변환하는 과정을 통해 생성됩니다. “임베딩”은 본질적으로 이 프로세스의 출력을 나타내며, 유사성 검색을 용이하게 하기 위한 명시적인 목적으로 딥러닝 모델에서 세심하게 제작된 벡터입니다.

작동 방법은 다음과 같습니다.

신경망 및 숨겨진 계층

인간의 두뇌의 구조에서 영감을 받은 신경망은 창조물의 기초를 형성한다. 이러한 네트워크는 입력 레이어, 출력 레이어 및 가장 중요한 숨겨진 레이어를 포함한 여러 레이어로 구성됩니다. 서버리스 컴퓨팅이 효율적인 애플리케이션 구축을 위해 클라우드 리소스를 활용하는 방식과 유사하게 이러한 숨겨진 계층 내에 임베딩이 구현됩니다.

신경망의 숨겨진 계층은 모델의 아키텍처와 설계를 기반으로 입력 데이터를 다양한 방식으로 변환하는 놀라운 능력을 가지고 있습니다. 임베딩의 생성은 일반적으로 후속 레이어가 입력을 더 처리하기 전에 이러한 숨겨진 레이어 내에서 이루어집니다.

TV 쇼에 대한 임베딩을 만들고 싶다고 상상해 보십시오. 여러 차원을 따라 각 TV 쇼의 위치를 수동으로 지정하는 대신 신경망의 숨겨진 레이어가 이 작업을 수행합니다. 각 TV 쇼의 필수 특성을 캡처하는 임베딩을 자동으로 생성하여 네트워크로 공급되는 풍부한 데이터를 활용합니다.

초기에 프로그래머는 임베딩을 생성하는 방법과 고려해야 할 차원 및 기타 관련 정보의 예를 제공함으로써 네트워크를 안내할 수 있습니다. 그러나 신경망이 훈련됨에 따라, 임베딩 레이어는 점차 독립적으로 작동하는데 능숙해지고, 각 객체의 본질을 포착하는 임베딩을 생성하는 능력을 개선한다.

LLM(대규모 언어 모델)에 임베딩

임베딩의 개념은 ChatGPT와 같은 AI 도구를 구동하는 LLM(Large Language Models)에 적용될 때 매혹적인 전환이 일어납니다. 이러한 고급 모델에서 임베딩은 개별 객체를 넘어 전체 컨텍스트를 포괄합니다.

본질적으로 문장, 단락 또는 기사의 각 단어나 토큰은 임베딩이 되어 개별 단어의 의미뿐만 아니라 텍스트 내의 복잡한 관계와 의미론적 뉘앙스를 포착합니다. 이러한 수준의 분석은 DevOps 모범 사례 에서 발견되는 정교한 데이터 처리와 유사합니다 . 여기서 최적의 결과를 얻기 위해 여러 변수를 고려합니다.

결론

결론적으로, 임베딩은 우리의 디지털 세계의 복잡성을 해독하는 기계 학습 능력의 초석이 됩니다. 이러한 수학적 표현을 통해 기계는 텍스트에서 이미지 등에 이르는 다양한 객체 사이의 관계를 이해하고 추론하며 발견 할 수 있습니다. 인공 지능에 대한 탐구를 계속함에 따라 현재를 형성하는 것뿐만 아니라 미래의 혁신을 주도하는 데에도 임베딩의 심오한 중요성을 인식하는 것이 필수적입니다.

인공 지능 활용에 대한 더 많은 통찰력과 모범 사례를 보려면 학습 센터를 방문하십시오.

관련 페이지

질문이 있으십니까?

Edgio가 AI를 사용하여 애플리케이션 및 보안을 최적화하는 데 도움이 될 수 있는 방법에 대한 문의 사항이나 추가 정보는 당사 전문가에게문의하십시오. Akamai 팀은 웹 애플리케이션 라이프사이클 개발의 복잡성을 해결하는 데 필요한 통찰력과 지원을 제공하기 위해 최선을 다하고 있습니다.

트렌드 주제

최신 사이버 보안 위협 2023