Diary

[카카오 테크밋] 스팸콘텐츠의 처리 (+사옥구경)

조핑구 2024. 6. 16. 17:37

 

https://tech.kakao.com/posts/619

 

제6회 Kakao Tech Meet에 초대합니다! - tech.kakao.com

Kakao Tech Meet #6 Kakao Tech Meet은 작년부터 이어온...

tech.kakao.com

 

모든 개발자들의 발할라(얼마전에 매드맥스 보고옴) 카카오.. 테크밋에 당첨되어 카카오 사옥을 구경 갈 기회가 생겼다!

회사에서 차타고 20분 거리라서 편안하게 다녀올 수 있었다. (주차지원도 해줬다!!)

주차장 입구부터 으리으리하고요... 퇴근이 좀 늦어서 살짝 지각할 뻔 했기때문에 달려가느라고 사진을 잘 못찍었지만, 전체적으로 우드톤의 인테리어와 푸른 식물이 어루러져 큰 공간임에도 따뜻하고 활기있는 사옥이 정말 마음에들었다! 캌카오 목걸이 걸고있는 직원들이 부러워진....... 저도 데려가줘요

헤메지 않게 포인트마다 서있는 안내판
카카오 곳곳에 있는 라이언

 

오늘의 주제는 스팸컨텐츠에 대한 대응방법인데 모든 세션이 흥미롭고 재미있었다.

첫 번째 세션에서는 메일서비스에 대한 설명과, 어떻게 스팸메일을 거르는지 이야기를 들을 수 있었다. MIME를 디코딩해서 스팸메일을 분류하고 있었는데 점점 교묘하게 방패를 피해가는 스팸이 있고, 앞으로는 ML을 통한 해결책도 연구할거라고 하셨다.

두 번째 세션에서는 성인 이미지 세계에서 살아남는 법 이라는 제목으로 발표를 해주셨다. 이미 이미지 기반 스팸은 ML을 이용하고 있었는데, 모델을 사용하면서 겪었던 어려움과, 어떻게 해결해나갔는지 얼마나 공부를 열심히 하셨는지(!) 들을 수 있었다. 아직까지는 사람이 라벨링에 많이 관여한다고 하셨고, 이에 대해 스트레스가 있냐는 질문에도 그렇다고 하셨다ㅜㅜ 발표자께서는 사무실에서 성인 이미지를 보다가 블라인드에 회사에서 음란물보는 사람이라고 글이 올라온 적도 많다고 하셨다ㅋㅋ

세 번째 세션에서는 LLM을 이용한 스팸차단에 대해서 들을 수 있었다. 재미있었던 지점은 교묘한 욕설이나 음란물 등 스팸콘텐츠 자체가 구하기 쉽지 않아서(미루어 짐작하건데 유저의 신고로 받은 데이터를 활용하는 것 같았다) 훈련이 쉽지 않다고 하셨다. 하지만 fine tuning된 모델이 우수한 성능을 보이기 때문에 여러가지 방법으로 모델을 개발하고 있다고 했다.

 

구글 스터디 잼에서 이론으로 배운 LLM이나 AI를 어떻게 실무에서 활용하는지 들을 수 있는 시간이어서 매우 즐거웠다. 설명해주시는 내용을 이해할 수 있어서 배움의 보람이 있었다. 카카오 테크밋은 유튜브에서 자주 들었었는데 이렇게 사옥 구경도 하고 열정있는 개발자구경도 하고 현장감을 느끼니 더 재미있었다.

다음에도 또 가야지~

 

귀여운 핫라이언도그