AI가 불량을 잡아도, 출하 버튼은 사람이 누른다
2026년 6월 12일, 산업통상부와 국가기술표준원은 싱가포르·영국·호주·캐나다와 AI 표준화 협력 MoU를 맺었다. 제조와 헬스케어 같은 AI 활용 분야를 국제표준 논의와 연결하겠다는 내용이다.
뉴스만 보면 표준 정책이다. 하지만 검사 라인에서는 더 실무적인 신호다. AI 품질검사가 장비 구매를 넘어, 출하 책임과 증거 로그 설계의 문제로 옮겨가고 있다.
공장 검사 라인에 AI 카메라를 붙이는 일은 이제 “불량을 더 잘 찾는다”에서 끝나지 않는다. AI가 불량 후보를 찍어내면 곧바로 다음 질문이 나온다.
이 제품을 출하할 것인가. 보류할 것인가. 고객에게 알릴 것인가. 리콜 후보로 올릴 것인가. 여기서부터는 카메라가 아니라 조직의 문제다.
30초 요약
- 제조 품질검사 AI의 핵심 역할은 최종 책임을 대신 지는 것이 아니라, 이미지·측정 데이터에서 재검과 격리 후보를 먼저 좁히는 것이다.
- 경제성은 “정확도 몇 퍼센트”보다 오탐, 미탐, 재검, 라인 통합, 로그 보존, 사람의 최종 권한 설계에서 갈린다.
- 한국 기업이 봐야 할 질문은 솔루션 구매가 아니다. AI가 남긴 증거를 누가 어떤 기준으로 출하 판단까지 연결하느냐다.
지금 벌어지는 일
제조 AI는 정책의 중심으로 들어오고 있다. 산업통상부와 국가기술표준원은 2026년 6월 12일 AI 표준화 협력을 발표했다. 국가기술표준원은 2026~2030년 국가표준기본계획에서 AI와 미래차, 로봇 같은 미래 핵심산업의 표준 개발도 강조했다.
2026~2028년 제품안전관리 종합계획도 같은 방향이다. 데이터와 AI를 제품안전 전주기 관리와 시장감시에 쓰겠다고 밝힌 상태다.
이 흐름은 제조 품질검사 AI를 단순한 장비 옵션으로 보지 않는다는 뜻이다. AI 카메라, 비전센서, 모델, 조명, 라인 설비, 품질경영시스템, 제품안전 문서가 한 묶음으로 움직인다. 말하자면 “똑똑한 눈”을 사는 게 아니라, 공장의 판단 절차를 다시 짜는 일에 가깝다.
AI 비전검사는 카메라로 찍은 이미지나 측정 데이터를 보고 결함 후보를 찾는 기술이다. 쉽게 말하면 공장 라인 위의 제품을 아주 빠르게 훑는 검사원이다. 다만 이 검사원은 피곤하지 않은 대신, 현장의 맥락을 혼자 책임지지는 못한다. 흠집이 기능 결함인지, 외관상 허용 범위인지, 고객과 약속한 품질 기준을 넘는지는 별도 판단이 필요하다.
중간 결론은 분명하다. AI 품질검사는 사람을 없애는 기술이 아니라, 사람이 봐야 할 문제를 압축하는 기술이다.
왜 중요한가
제조 품질에서 가장 무서운 실수는 두 가지다. 정상 제품을 불량으로 잡는 오탐, 그리고 불량 제품을 정상으로 통과시키는 미탐이다. 오탐이 많으면 재검, 폐기, 라인 정지, 작업자 불신이 늘어난다. 미탐이 생기면 고객 유출 불량, 보증 비용, 리콜, 평판 리스크로 이어진다.
여기서 중요한 점이 있다. AI 성능표에 나온 숫자만으로는 이 비용을 알기 어렵다. 같은 모델이라도 조명, 렌즈 오염, 카메라 위치, 공급 소재, 라인 속도, 작업자 재검 기준이 바뀌면 결과가 흔들린다.
공장에서는 데이터가 연구실처럼 얌전히 줄 서 있지 않다. 제가 보기엔 이 대목이 핵심이다. 불량은 꼭 바쁠 때 새 얼굴로 찾아온다.
그래서 AI 검사는 모델 단독이 아니라 측정·검사시스템으로 봐야 한다. ISO 9001은 품질을 프로세스와 문서화, 고객 요구, 지속개선의 문제로 다룬다. ISO/IEC 42001과 NIST AI RMF는 AI를 운영 중 모니터링, 위험관리, 인간 감독, 역할 구분의 문제로 본다. ISO 10012와 ISO/IEC 17025, NIST Gauge R&R 관점까지 붙이면 질문은 더 구체화된다.
카메라가 같은 제품을 반복해서 같은 방식으로 보는가. 작업자가 바뀌어도 같은 판단이 나오는가. 조명이 바뀌면 성능을 다시 확인하는가. AI가 제시한 후보를 사람이 뒤집을 수 있는가. 그 이유가 로그로 남는가.
정리하면 이 이슈는 “AI가 불량을 잡느냐”보다 “AI가 만든 의심을 조직이 어떻게 책임 있는 판단으로 바꾸느냐”의 문제다.
숫자로 확인하기
첫째, 정책 숫자는 방향을 보여준다. 국가기술표준원은 2026~2030년 제6차 국가표준기본계획에서 2030년까지 국제표준 1,900건 이상 개발 목표를 제시했다. 이 숫자는 제조 품질검사 AI 단독 목표가 아니다. 다만 AI와 제조가 표준 경쟁의 장으로 들어가고 있다는 신호로 볼 수 있다.
둘째, 제품안전 쪽도 AI를 관리 도구로 보고 있다. 국가기술표준원의 2026~2028년 제품안전관리 종합계획은 4대 전략과 16개 중점과제를 제시하고, 데이터·AI 기반 제품안전 전주기 관리와 AI 활용 시장감시를 포함했다. 여기서 읽을 점은 하나다. AI 검사 결과는 공장 안에서 끝나는 데이터가 아니라, 사후관리와 클레임 대응의 재료가 될 수 있다.
셋째, 품질 비용은 실제 재무제표에 큰 항목으로 잡힌다. Ford는 2024년 연차보고서에서 보증·필드서비스 관련 현금 지급액 58.31억 달러, 당기 발행 보증 관련 충당 증가 62.94억 달러, 2024년 말 충당부채 140.32억 달러를 공시했다. 이 수치는 자동차 대형 제조사의 사례다. 제조업 평균 비용도 아니고, AI 검사로 줄일 수 있는 금액도 아니다. 그래도 품질 판단이 손익과 현금흐름으로 이어진다는 점은 선명하게 보여준다.
넷째, 장비 회사의 사례는 돈이 어디서 나는지 힌트를 준다. Keyence는 2025년 연차보고서에서 회사 전체 순매출 1조591억4500만 엔, 영업이익 5497억7500만 엔을 공시했고, AI 내장 비전센서와 3D 레이저 스냅샷 센서를 제품 설명에 포함했다. 이 역시 AI 품질검사 단일 매출이 아니다. 다만 시장이 알고리즘만이 아니라 센서, 이미징 장비, 설치 편의성, 작업자 스킬 부담 절감까지 묶어 산다는 점을 보여주는 보조 근거다.
다섯째, 연구 벤치마크는 현장의 어려움을 알려준다. MVTec AD는 5,354개 이미지와 15개 카테고리를 제시했고, 2026년 공개된 MVTec AD2는 8,004개 이미지와 8개 카테고리, 조명 변화와 분포 이동을 포함한다. AD2 논문은 특정 조건의 최고 성능 지표로 58.7% AU-PRO를 보고했다. 이것은 실제 제조라인 검출률이 아니다. 연구용 benchmark다. 그러나 라인 조건이 조금만 바뀌어도 재검증이 필요하다는 메시지는 분명하다.
숫자를 한 줄로 묶으면 이렇다. AI 검사의 경제성은 모델 점수표가 아니라 품질 비용, 설비 통합, 검증 기준, 책임 로그가 만나는 지점에서 생긴다.
한국 기업 시사점
한국 제조기업은 AI 품질검사를 “불량 자동판정기”로 사면 곤란하다. 더 현실적인 구매 단위는 검사 워크플로다. 데이터 수집, 후보 선별, 재검, 격리, 품질팀 판정, 고객 통보, 출하 보류, 리콜 검토, 감사로그가 한 흐름으로 이어져야 한다.
여기서 고객은 공장장만이 아니다. 생산팀은 라인 속도를 본다. 품질팀은 미검출을 본다. CS와 영업은 고객 클레임을 본다. 법무와 규제 담당자는 리콜과 보고 의무를 본다. AI 벤더와 SI는 모델 성능과 시스템 연동을 본다. 같은 불량 후보 하나를 놓고 각자 다른 비용을 본다.
그래서 계약과 운영 기준이 중요하다. AI가 “불량 가능성 높음”이라고 찍었을 때 누가 출하를 멈출 권한을 갖는가. 사람이 AI 판단을 뒤집으면 어떤 사유를 남기는가.
모델 버전, 임계값, 이미지 원본, 로트, 설비 조건, 작업자 확인 기록을 얼마나 보관하는가. 벤더가 모델을 바꾸면 고객 승인과 재검증은 어떻게 할 것인가.
독자별 질문은 이렇게 갈린다.
- OEM과 제조사는 AI 출력보다 출하 보류, 고객 통보, 리콜 검토 권한을 먼저 정해야 한다.
- SI와 AI 벤더는 정확도 표만 팔기 어렵다. 조명, 카메라, 라인 조건이 바뀔 때 재검증과 버전 관리를 함께 제시해야 한다.
- 제조 고객과 구매팀은 PoC 성능표와 양산라인 KPI를 분리해 요구해야 한다.
- 투자자와 전략팀은 단품 알고리즘보다 센서, 설비 통합, 운영 문서화 역량을 함께 봐야 한다.
글로벌 규제 흐름도 이 질문을 밀어붙인다. EU AI Act는 모든 제조 품질검사 AI를 고위험 AI로 보는 것은 아니다. 다만 제품의 안전 부품이나 안전 관련 기능과 연결되는 경우에는 로그, 인간 감독, 기술문서가 중요해질 수 있다. EU Product Liability Directive는 소프트웨어와 AI 시스템을 제품 책임 구조 안에서 다루고, Machinery Regulation은 안전 관련 의사결정 데이터 보존 이슈를 만든다. 한국 기업이 EU향 제품을 다루면 “AI가 판단했다”는 말만으로 책임을 넘기기 어렵다.
미국 리콜 체계도 같은 방향을 보여준다. NHTSA와 CPSC의 리콜 안내에서 리콜은 제조사와 규제기관의 공식 운영 프로세스다. AI 검사 결과는 입력이 될 수 있지만, 수리·교체·환불·보고 같은 책임은 제조사와 절차에 남는다. 결국 AI는 방패가 아니라 증거를 만드는 도구에 가깝다.
한국 기업의 실무 체크포인트는 네 가지다.
- AI 출력은 합격·불합격보다 재검 후보, 격리 후보, 심각도 근거로 설계한다.
- 오탐과 미탐을 각각 재검 비용과 고객 유출 불량 비용으로 나눠 본다.
- PoC 성능표와 양산라인 성능표를 분리하고, 조명·소재·속도 변화 때 재검증한다.
- 사람의 승인, 반려, 번복, 중지 권한을 형식적 버튼이 아니라 실제 권한으로 남긴다.
앞으로 볼 포인트
- 한국의 제조 AI와 스마트공장 정책에서 AI 품질검사 도입률, 업종별 적용 범위, 불량률 개선치가 공식 통계로 분리되는지 봐야 한다.
- KOSMO, KAMP, KOSIS 같은 공식 접근점에서 제조 AI 데이터셋, 유스케이스, 교육, 통계가 어떻게 연결되는지 확인해야 한다.
- 벤더 성과 수치는 고객 원자료, 운영 로그, 동일 라인 전후 비교, 표본 기간이 붙는지 따져야 한다.
- EU AI Act와 제품책임 지침, 기계류 규정이 안전 부품·안전 기능·적합성평가 대상 제조 AI에 어떻게 적용되는지 추적해야 한다.
- 제조기업 내부에서는 모델 정확도보다 오탐·미탐 비용, 재검 시간, override 로그, 모델 변경 승인 이력이 핵심 KPI로 올라오는지 봐야 한다.
지금 확인된 한계도 분명하다. 한국 제조업 전체의 AI 비전검사 도입률, 공식 오탐·미탐 비용, 독립 시장규모, 평균 ROI는 공개 근거만으로 확정하기 어렵다. 그래서 이 글은 “AI 품질검사의 평균 성과”가 아니라 “도입할 때 책임과 돈이 어디서 갈리는가”를 말한다.
이건 제조 품질만의 문제가 아니다
이 구조는 제조 품질에서만 반복되는 일이 아니다. 병원 행정에서도 AI가 보험 청구 오류나 서류 누락 후보를 먼저 띄울 수 있다. 그러나 환자에게 무엇을 안내하고, 어떤 청구를 확정하고, 어떤 이의제기에 대응할지는 사람이 정한 절차와 기록이 맡는다.
물류 클레임도 비슷하다. 사진과 센서 데이터가 파손 의심 후보를 빨리 좁힐 수는 있다. 하지만 보상할지, 거절할지, 공급사에 구상할지, 고객에게 어떤 메시지를 보낼지는 계약과 운영 기준의 문제다.
법무 계약 검토도 같은 그림이다. AI는 위험 조항, 누락 조항, 비표준 표현을 표시할 수 있다. 그러나 서명할지, 협상할지, 리스크를 감수할지는 법무와 사업부의 판단이다. AI가 빨간 줄을 그어줘도 도장은 사람이 찍는다. 이 비유는 조금 투박하지만, 현장에서는 꽤 정확하다.
세 산업을 묶는 공통 패턴은 하나다. AI는 먼저 의심 후보를 줄인다. 사람은 최종 판단과 예외 처리를 맡는다. 조직은 그 사이의 근거와 책임을 로그로 남긴다. 앞으로 자동화의 차이는 모델 성능보다 이 세 단계를 얼마나 단단히 연결하느냐에서 난다.
inCore takeaway
제조 품질검사 AI의 질문은 “AI가 사람을 대체하는가”가 아니다. 더 좋은 질문은 “AI가 만든 의심을 조직이 얼마나 빠르고, 일관되고, 추적 가능한 판단으로 바꾸는가”다.
AI가 먼저 거른다. 사람은 끝까지 책임진다. 그리고 좋은 회사는 그 사이를 문서와 데이터로 남긴다. 이 원칙을 세운 기업은 AI를 비용절감 도구로만 쓰지 않고, 고객 신뢰와 규제 대응을 함께 관리하는 운영 자산으로 만들 수 있다.
한 문장으로 정리하면 이렇다. AI 자동화의 진짜 경쟁력은 판단을 없애는 데 있지 않고, 판단을 더 잘 남기는 데 있다.