카메라가 사람을 지키는 방법 – 딥러닝 비전 AI 입문
CCTV는 많은데, 왜 사고는 줄지 않았을까
국내 산업 현장에 설치된 CCTV는 수백만 대에 달합니다.
공장, 건설 현장, 물류 창고 어디를 가도 카메라가 없는 곳을 찾기 어렵습니다.
그런데 카메라가 늘어난 만큼 산업재해가 줄었냐고 하면, 솔직히 그렇지 않습니다.
이유는 단순합니다. 기존 CCTV는 찍기만 하고, 보지 않습니다.
아니 정확히는, 볼 수 있는 사람이 없습니다.
카메라 100대를 관제실 한 명이 모니터링한다는 건 현실적으로 불가능합니다.
사고가 나면 영상을 돌려보는 용도. 그게 전부였습니다.
그렇다면 카메라가 스스로 볼 수 있다면 어떨까요. 사람이 놓치는 순간을 카메라가 직접 잡아낸다면.
그것이 딥러닝 비전 AI가 현장에 들어온 이유입니다.
눈이 생긴 카메라
기존 영상 분석 기술이 없었던 건 아닙니다. 모션 감지, 라인 크로싱 같은 기능들은 이전에도 있었습니다. 하지만 이런 기능들의 한계는 명확했습니다.
움직임은 감지하지만, 의미는 읽지 못했습니다.
사람이 지나가도 반응하고, 나뭇잎이 흔들려도 반응하고, 빛이 변해도 반응했습니다. 오탐이 너무 많아서 결국 아무도 알람을 신뢰하지 않게 됐습니다.
딥러닝 비전 AI는 다릅니다. 픽셀의 변화가 아니라 의미를 읽습니다.
쉽게 설명하면 이렇습니다. 우리가 사진을 보고 “저 사람이 안전모를 쓰고 있다”고 인식하는 것처럼, 딥러닝 모델도 수십만 장의 이미지를 학습한 결과로 같은 인식이 가능해집니다.
“저건 안전모가 없는 작업자다”, “저 연기는 화재의 초기 징후다” – 이런 판단을 카메라가 실시간으로 할 수 있게 된 겁니다.
사람처럼 보는 카메라. 그게 딥러닝 비전 AI의 핵심입니다.

현장에서 가장 많이 찾는 것들
실제로 고객들이 가장 많이 찾고, 현장 반응이 가장 좋았던 기능은 크게 두 가지입니다.
화재 감지와 PPE(개인보호구 개별 착용감지)입니다.
화재 감지는 반응이 즉각적입니다.
연기나 불꽃의 초기 징후를 포착하는 순간 알람이 발생합니다.
스프링클러가 작동하기 전, 관제 요원이 전화를 받기 전에 시스템이 먼저 움직입니다.
몇 초, 몇 분의 차이가 피해 규모를 완전히 바꿀 수 있다는 걸 담당자들은 알고 있기 때문에 반응이 빠릅니다.
PPE(개인보호장구) 감지는 수요가 꾸준합니다.
안전모, 안전화, 보안경, 안전장갑, 페이스쉴드 – 작업자가 이것들을 제대로 착용했는지를 카메라가 실시간으로 확인합니다.
안전관리자가 현장을 직접 돌아다니며 확인하던 것을 카메라가 대신하는 셈입니다.
중대재해처벌법 시행 이후 이 기능에 대한 문의가 특히 많아졌습니다.
이 두 가지 외에도 침입·배회 감지, 작업자 쓰러짐 감지, 수신호 인식, 안전고리 미체결 감지 등 다양한
기능들이 있지만, 현장의 첫 반응은 항상 “화재랑 안전모 먼저”였습니다.
하지만 시간이 흐를수록 현장에 맞는 다양한 기능에 대한 문의가 들어오고 있습니다.
현장에 나가면 달라지는 것들
개발 환경에서 잘 작동하던 모델이 실제 현장에 나가면 정확도가 떨어지는 경우가 있습니다.
처음 이 일을 시작할 때 그게 가장 당황스러운 부분이었습니다.
가장 예상치 못했던 변수는 날씨였습니다.
비가 내리면 카메라 렌즈에 빗방울이 맺히고, 시야가 흐려지면서 감지 정확도가 떨어집니다.
안개가 끼는 날은 더 심각합니다. 야간에 작업이 이루어지는 현장이라면 조명 조건에 따라 모델의 반응이 완전히 달라지기도 합니다.
모델은 학습한 환경에서 잘 작동합니다. 하지만 현장은 매일 다릅니다.
계절이 바뀌고, 날씨가 변하고, 조명 각도가 달라집니다.
이런 이유로 저희 AURON-i 솔루션에는 날씨와 시간 변화에 따라 최적화된 모델로 자동 전환되는 기능을 곧 선보일 예정입니다. 비가 온다고 AI의 눈이 멀어서는 안 되니까요.
카메라 각도와 설치 위치도 생각보다 중요한 변수입니다.
안전모를 정면에서 보는 것과 측면에서 보는 것, 아래에서 올려다보는 것은 모델 입장에서 완전히 다른 데이터입니다. 현장 환경에 맞는 사전 조사와 최적 설치가 성능에 직결됩니다.
그래서 현장 데이터가 중요합니다. 다양한 환경에서 쌓인 현장 데이터를 많이 가진 쪽이 결국 더 강한 모델을 만들 수 있습니다.
“오탐이 너무 많다” – 첫 반응의 진실
고객이 딥러닝 비전 AI를 처음 접했을 때 가장 많이 나오는 말이 있습니다.
“오탐이 너무 많은 거 아닌가요?”
처음에는 이 말이 불만처럼 들렸습니다. 하지만 지금은 다르게 받아들입니다.
오탐에 대한 불만이 나온다는 건, 그 전에 알람을 확인했다는 뜻입니다. 확인하지 않는 시스템에 대해서는 불만도 나오지 않습니다.
그리고 오탐과 미탐 사이에는 근본적인 긴장 관계가 있습니다.
오탐(False Positive)은 실제 이상이 없는데 알람이 울리는 것입니다. 미탐(False Negative)은 실제 이상이 있는데 알람이 울리지 않는 것입니다.
산업안전 환경에서는 미탐이 훨씬 위험합니다.
화재가 났는데 알람이 안 울리는 것, 작업자가 쓰러졌는데 감지를 못 하는 것 – 이게 진짜 문제입니다.
그래서 초기 배포 시에는 오탐이 다소 발생하더라도 민감도를 높게 설정하는 경우가 많습니다.
그리고 현장 피드백을 받으면서 임계값을 조정하고, 현장 환경에 맞는 추가 학습을 통해 오탐을 줄여갑니다. 이 과정이 실제 AI 도입의 핵심입니다. 설치로 끝나는 게 아니라, 함께 성장하는 과정입니다.
고객의 목소리는 크게 2가지 입니다.
오탐이 많아 업무에 지장이 있으니, 줄여달라와 오탐이 많이 나도 상관없다. 미탐이 발생하지 않게 해 달라는 목소리 2가지가 거의 100% 요구사항입니다.
그런데 2가지 요구사항 모두 목적지는 하나입니다.
정탐을 늘리고 오탐과 미탐을 줄여나가는 과정이라는 것입니다.
일시적인 민감도 조정의 문제가 아니라, 지속적인 학습을 통한 성능의 향상이라는 것입니다.
사람과 AI가 함께 일하는 방식
딥러닝 비전 AI가 현장에 들어왔다고 해서 관제 요원이 사라지는 게 아닙니다.
오히려 역할이 명확하게 분리됩니다.
AI는 감지합니다. 24시간 집중력이 흔들리지 않고 화면을 봅니다. 사람이 놓칠 수 있는 순간을 잡아냅니다.
사람은 판단합니다. AI가 올린 알람이 실제로 대응이 필요한 상황인지, 어떻게 대응할지를 결정합니다.
시스템은 기록합니다. 어떤 이벤트가 언제, 어디서 발생했는지 VMS(영상관제시스템)와 연동해 쌓아갑니다. 이 데이터가 쌓이면 어느 구역에서 어떤 유형의 위험이 반복되는지 패턴을 파악할 수 있습니다.
이 세 가지가 잘 맞물렸을 때, AI는 단순한 알람 장치를 넘어 현장의 안전 수준을 진짜로 높이는 시스템이 됩니다.
앞으로의 방향
딥러닝 비전 AI는 지금도 빠르게 발전하고 있습니다.
최근에는 VLM(Vision Language Model) 기술이 현장에 적용되기 시작했습니다.
단순히 “안전모가 없다”를 감지하는 것을 넘어, “3번 구역 작업자 A가 오후 2시에 안전모를 착용하지 않고 위험 구역에 진입했습니다”처럼 자연어로 상황을 설명하는 수준까지 왔습니다.
Re-ID 기술을 활용한 영상 요약도 발전하고 있습니다.
여러 카메라에 찍힌 동일 인물을 추적해 하루 동안의 행동 패턴을 요약하는 것이 가능해졌습니다.
카메라가 사람을 지킨다는 것의 의미가 조금씩 달라지고 있습니다.
단순히 보는 것에서, 이해하는 것으로. 기록하는 것에서, 분석하는 것으로.
그 변화의 한가운데에서 일하고 있다는 것이, 여전히 흥미롭습니다.
2026. 05. Rhapsody
카테고리: AI in the Field
