▶ 사람 눈의 작동원리 모방한 딥러닝 방식 ‘회선신경망’, 작게 쪼개 이미지 입력받아 정보 조합해 얼굴전체 인식
▶ MS, 오류율 3%로 인간 추월… 동영상으로까지 확장 중
지난해 12월 마이크로소프트는 이미지나 영상 속 물체를 파악하는 기술이 ‘ 인간 수준을 넘어섰다(exceedshuman-level performance)’고 선언했다. 매년 열리는 세계 최대 이미지인식 기술 대회 ‘ILSVRC(ImagenetLarge Scale Visual Recognition Challenge)2015’에서 마이크로소프트연구소가 우승을 차지한 뒤였다.
이 대회에서 마이크로소프트연구소는 이미지 분류 등 몇몇 영역에서오류율을 3%대로 줄였다. 보통 사람의 오류율을 5% 안팎으로 보면 큰진전이다. 이렇게 오류를 줄여가면 무인 자율주행차가 갑작스레 등장하는 사람을 인식하고 동선과 속도를 계산해 사고를 피하는 일도 가능해질 것이라는 기대도 나온다.
이미지 인식 기술은 인공지능(AI)딥러닝 방식의 하나인 회선신경망(CNN·Convolutional Neural Networks)방식을 채택하면서 현재 수준에 이르렀다. 이미지 인식 기술은 사람 눈의 작동 원리와 닮아 있다. 사람은 물체에서 반사된 빛이 눈의 각막과 수정체를 거치는 동안 꺾이면서 망막에서 상을 만들고 이 정보가 뉴런을 타고 뇌에 전달되면서 물체를판단한다.
CNN은 뉴런의 구조를 모방해 물체의 정보에 관한 네트워크를 쌓아올리는 방식으로 이미지를 판별한다.
김성훈 홍콩과학기술대 교수는 강의를 통해 “전체 이미지를 하나의 입력으로 받지 않고 입력을 작은 단위로 나누어 받는다는 아이디어에서 착안한 모델”이라고 말했다. 얼굴을 인식한다면 선이나 점 등 가장 기본적인 형태를 훑어본 뒤 타원형·다각형 등조금 더 복잡한 형태를 인식한다. 그다음 선과 타원형 등의 조합까지 인식해 얼굴 전체를 정확하게 파악하게 된다.
CNN은 이미지가 입력되면 신경망의 첫 번째 층에 색깔별 픽셀값(밀도)이 입력으로 들어와 각 단위(노드)가 특정 색의 특정 방향의 선이나 점을 감지하도록 학습된다. 빨간색의수직 방향 선이 이미지에 나타났는지 감지하는 식이다. 한 이미지를 얼마만큼 읽어낼 것인지를 정해서 5×5형태의 이미지로 보게 되면 이들 색깔이 만들어내는 패턴을 모아 눈과코, 눈썹 등이 특정된다. 세세한 이목구비도 이러한 방식으로 인식돼 기계는 얼핏 본 하관의 모습으로도 대상을 판별해 사람보다 오류를 줄일 수있게 되는 셈이다.
최근 인공신경망을 채택한 구글포토는 키워드별로 구글 검색으로 노출되는 수만장에서 수천장에 달하는 이미지를 통해 학습을 진행했다. 이를 통해 구글 포토 검색창에 런던을 입력하면 런던에 있는 랜드마크 등과 관련된 사진들이 검색 결과로 나온다. 국내 스타트업인 루닛은 이미지를 정교하게 인식하는 딥러닝 모델을 대량의 의료 데이터로 학습시켜 사람의 시각만으로는 한계가 있던 기존 의료영상 판독의 정확성과 객관성을 높일 수 있는 핵심기술들을 개발해 소프트뱅크벤처스로부터 20억원의 투자를 유치했다.
최근 글로벌 업체들은 이미지 인식뿐 아니라 동영상으로도 그 안의내용을 인식하는 기술까지 개발하고있다. 샤오우엔 혼 마이크로소프트연구소 아시아 소장은 최근 기자간담회에서 “사진뿐만 아니라 영상에도 이 기술을 적용해 효율적으로 시각적 인식을 하게 했다”며 “현재 구글·IBM 등이 그런 접근을 하고 있다”고 말했다.
한편 한국의 NHN엔터테인먼트가 지난 12일 공개한 ‘운수도원’ (運數挑源) 애플리케이션에 박근혜 대통령의 얼굴을 넣어봤다.
이 앱은 스마트폰 카메라로 얼굴을찍으면 관상을 봐주고, 손바닥을 찍으면 손금을 봐준다. 사진을 읽으면 불과 2∼3초 만에 복채 없이 결과를 알려준다.
박 대통령의 지난달 29일 3차 대국민 담화 때 정면 사진을 입력하자즉시 얼굴형, 눈썹, 눈, 코, 인중, 입으로 나눠 관상을 풀어냈다.
앱은 박 대통령의 얼굴형에 대해 “매사 적극적이고 불의를 용납하지않는 성격으로 모든 일에 앞장서기를 좋아한다”며 “간혹 일에 실패할 우려가 있으나 이를 잘 극복하면 말년에는 운이 좋다”고 분석했다.
눈썹에 대해선 “ 눈썹 머리가 깨끗하고 꼬리로 가면서 흩어지는 모양”이라며 “눈썹 끝이 흩어지더라도 또렷하게 보인다면, 일찍 명성을 떨치고 부자로 살아갈 수 있다”고 봤다.
눈, 인중, 입술도 관상이 상당히 좋은 쪽으로 나왔다. 앱은 “평생 복이많고 영화로운 삶과 함께 장수할 눈” ,“결혼 적령이 되면 배필을 만나 결혼할 인중” “, 평생 부귀영화를 누릴 수있는 입술”이라며 종합적으로 ‘사업가형’ 얼굴이라 했다.
다만, 박 대통령의 코를 두고는 나쁜 말이 많았다. 앱은 “이런 코를 가진 사람은 잔꾀가 많고 남에게 베푸는 것에 인색하다”며 “ 끝없는 욕심으로 착실히 재물을 쌓을 수 있지만, 주변 사람들을 적으로 만드는 경향이있다”고 풀이했다.
[
운수도원의 관상·손금 기능은 인공지능(AI)의 핵심 기술인 딥러닝(Deep learning)을 기반으로 한다. 특히 심층 신경망(deep neural network)을 통해 일반인 수천명의 얼굴을 학습한 관상 기능은 얼굴 이미지를 부위별로 분할해 특정 관상 타입을 구분할 수 있도록 설계됐다.
이미 촬영된 사진을 입력해도 무리 없이 관상을 볼 만큼 인식률과 정확도가 높다. 개발자들은 관상 전문서적을 바탕으로 분석 데이터를 쌓았고, 실제 사람들의 얼굴로 데이터분석 시험을 거쳤으며, 앞으로 관상전문가들의 도움도 받을 예정이라고한다.
운수도원 앱은 구글 플레이스토어나 애플 앱스토어에서 다운로드할수 있다. 간편결제 서비스 ‘페이코’(PAYCO) 가입자는 이용료가 무료다.
<
서울경제 정혜진 기자>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x