Today I Run

[GoogleStudyJam] Introduction to Generative AI

조핑구 2024. 5. 9. 10:32

정리

수업의 목표 : Gen AI란 무엇인가?

일단 Gen AI를 알기 전에 AI에 대해 알아보자!

  • AI와 머신러닝(ML)의 차이점은? : AI는 인간처럼 생각하고 행동하는 기계를 만드는 학문. 머신러닝은 AI의 하위로 기계를 훈련하는 모델을 만드는 것이다.
  • 머신러닝의 모델은 레이블(label)의 유무로 나뉘는데 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)로 구분한다.
    • 지도학습모델은 레이블이 지정된 데이터를 이용해 모델을 학습시킨다. 질문과 정답이 주어지고, 이후 새로운 데이터가 주어졌을 때 적절한 출력을 생성할 수 있다. 예측값과 실제값이 먼 것이 오류라고 볼 수 있다. 오차를 줄여내는 것이 "최적화" 이다.
    • 비지도학습은 레이블이 지정되지 않은 데이터를 사용해 모델을 학습시킨다. 데이터의 그룹화, 패턴발견 등을 한다.레이블이 뭐야?
      "레이블(Label)"은 지도 학습에서 사용되는 용어로, 각각의 데이터 포인트에 대한 정답 또는 클래스를 나타냅니다. 즉, 입력 데이터와 해당 데이터에 대한 원하는 출력(예측하려는 값) 사이의 매핑을 나타냅니다.
  • ML의 하위집합으로 딥러닝도 알아보자 :
    • 딥러닝은 인공신경망을 사용해 복잡한 문제를 처리할 수 있다. 여러 계층의 뉴런이 있어 기존 기계학습보다 어려운 문제를 해결할 수 있다. 신경망은 레이블의 유무와 상관 없이 훈련이 가능하다.(준지도학습) 소량의 레이블데이터와 대량의 비레이블데이터를 학습하여 일반화시킨다.준지도 학습에 대해 자세히 알아보자
      일반적으로, 지도 학습에서는 레이블이 지정된 데이터가 필요하지만 이러한 데이터를 수집하는 것은 비용이 많이 들기 때문에 데이터가 부족할 수 있습니다. 반면에, 비지도 학습에서는 레이블이 지정되지 않은 데이터를 사용하여 모델을 학습합니다. 그러나 이러한 방법으로는 데이터의 숨겨진 구조나 패턴을 학습할 수는 있지만, 예측이나 분류와 같은 명확한 작업에는 한계가 있습니다. 준지도 학습은 이러한 문제를 해결하기 위해 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 모두 사용하여 모델을 학습합니다. 즉, 레이블이 지정된 데이터를 사용하여 명확한 패턴을 학습하고, 이러한 패턴을 기반으로 레이블이 지정되지 않은 데이터를 분류하거나 예측합니다. 이를 통해 데이터를 효과적으로 활용하여 모델의 성능을 향상시킬 수 있습니다.
  • 결론적으로 Gen AI란? : GenAI는 기존 콘텐츠에서 학습한 내용을 기반으로 새로운 콘텐츠를 만든다. 딥러닝의 하위 집합으로 인공 신경망을 사용하고, 지도/비지도/반지도방법을 사용해 레이블의 유무와 상관없이 데이터를 처리할 수 있다. 메시지가 주어지면 GenAI는 모델을 사용하여 응답을 예측하고 이를 통해 새로운 콘텐츠를 생성합니다.
  • 생성모델과 판별모델
    • 생성모델은 비슷한 데이터를 기반으로 새 데이터를 생성한다. 데이터의 설명을 이해하고 예시가 가능성이 있는지, 다음 단어를 예측한다.
    • 판별모델은 예측 또는 식별에 사용된다. 라벨 데이터로 일반화 훈련을 한다. 데이터 포인트의 특징과 라벨 같의 관계를 학습한다.
  • 환각(Hallucinations)은 모델이 입력 데이터에 대한 부정확, 잘못된 정보를 생성하는 현상을 가리킨다. 데이터 불균형 및 노이즈, 과적합, 학습 데이터 부족, 모델이나 데이터의 복잡성 때문에 발생한다.
  • 과적합이란 무엇일까?
    모델이 학습 데이터에 지나치게 적합되어 새로운 데이터에 대한 일반화 능력이 저하될 경우, Hallucinations이 발생할 수 있습니다. 이는 모델이 학습 데이터의 노이즈나 이상치까지 학습하여 새로운 데이터에 대해 부정확한 예측을 할 수 있기 때문입니다.
  • Prompt : LLM(Large language model)에 input되는 짧은 텍스트 데이터. Prompt design은 LLM이 원하는 output을 생성할 수 있도록 하는 prompt를 만드는 프로세스이다.

오늘은 어땠냐면요

짜잔 통과 짜잔(물론 재시험 봐도 된다 ㅎㅎ) 

영어 수업에 영어 자료에 영어영어여ㅇㅇㅓ.. 일단 강의는 귀로 듣고 늑김만 파악한 다음 다시 스크립트를 읽었다 ㅎㅎ 설명자료는 구글번역기가 도와주심ㅎㅎ 하지만 너무 재밌었다. 말로만 듣던 AI가 이런거였다니! 다음강의 기대하는 중