AI 에이전트가 바꾸는 기업 업무와 조직 — 일자리보다 '직무'가 먼저 흔들린다
기술경영, AI에이전트 관점에서 AI 에이전트가 바꾸는 기업 업무와 조직 — 일자리보다 '직무'가 먼저 흔들린다의 산업 구조와 자본시장 시사점을 출처 기반으로 정리한 리서치입니다.
관찰 포인트
한 줄 요약: AI 에이전트의 첫 충격은 직종 소멸보다 직무 단위 재편으로 온다. 문제는 기술보다 업무 설계와 통제다.

도입 — 해고 뉴스보다 먼저 볼 장면
AI 에이전트 이야기는 늘 극단으로 흐릅니다. 한쪽은 "사람 일이 다 사라진다"고 말합니다. 다른 한쪽은 "그냥 똑똑한 비서"라고 낮춰 봅니다.
둘 다 너무 빠릅니다. 지금 먼저 벌어지는 일은 직업의 소멸이 아닙니다. 업무가 더 작은 단위로 쪼개지고, 그중 일부가 AI에게 넘어가는 일입니다.
예전에는 한 사람이 "영업 운영 담당자", "주니어 개발자", "고객지원 매니저"라는 직함으로 묶여 있었습니다. 이제 기업은 그 직함 안의 업무를 다시 봅니다. 메일 분류, 회의록 정리, 코드 리뷰, 티켓 응답, 견적서 초안. 무엇은 AI가 하고, 무엇은 사람이 승인하고, 무엇은 없앨지 따지는 단계입니다.
그래서 오늘의 핵심은 단순합니다. AI 에이전트가 기업 조직을 바꾸는 첫 방식은 사람을 한 번에 대체하는 일이 아니라, 일을 먼저 재조립하는 일입니다.
시장 — 파일럿은 넘었지만 스케일은 작다
기업 AI는 더 이상 실험실 이야기가 아닙니다. Microsoft는 FY2026 3분기 실적에서 Microsoft 365 Copilot 유료 시트 2,000만 개, AI 사업 연간 런레이트 370억 달러를 발표했습니다. Salesforce도 FY2026 4분기 기준 Agentforce ARR 8억 달러, 누적 2만9,000건의 Agentforce 딜을 공시했습니다.
벤더 입장에서 시장은 분명 열렸습니다. 돈이 들어오고 있습니다.
그런데 도입 기업 쪽 숫자는 훨씬 차갑습니다. McKinsey의 2025년 State of AI 조사에 따르면 응답 기업 중 62%는 에이전트 AI를 실험 중이지만, 스케일링 단계는 23%에 그칩니다. AI가 EBIT에 5% 이상 기여한다고 보고한 고성과 기업은 약 6% 수준입니다.
즉 지금의 시장은 이렇게 봐야 합니다.
- 벤더 매출은 빠르게 커진다.
- 기업 파일럿도 빠르게 늘어난다.
- 하지만 전사 스케일업과 손익 효과는 아직 좁은 구간에 머문다.
여기서 중요한 점은 AI 에이전트가 안 팔리는 기술이 아니라는 사실입니다. 팔리는데, 잘 쓰는 기업이 아직 적습니다. RPA 초기도 그랬습니다. 데모는 화려했고, 파일럿은 빨랐고, 현업은 기대했습니다. 그런데 실제 운영에서는 예외 처리, 시스템 변경, 유지보수 비용이 튀어나왔습니다.
AI 에이전트도 같은 문턱 앞에 있습니다. 과거 RPA의 "봇 워싱"처럼, 이름만 에이전트인 챗봇과 워크플로가 늘어나는 "에이전트 워싱"도 이미 문제로 지적됩니다. Gartner는 원문 미확인 보도 기준으로 2027년 말까지 에이전틱 AI 프로젝트의 40% 이상이 취소될 수 있다고 봤습니다. 예측치라 단정하면 안 됩니다. 다만 방향은 분명합니다. 파일럿의 성공과 운영의 성공은 다릅니다.
기술 — 에이전트는 오래 일할수록 약해진다
AI 에이전트를 이해하려면 "똑똑하다"보다 "얼마나 오래 믿고 맡길 수 있나"를 봐야 합니다.
METR의 2025년 3월 연구는 좋은 기준을 줍니다. 최첨단 모델의 태스크 완료 시간 지평선은 약 7개월마다 두 배로 늘어나는 추세입니다. 발전 속도는 빠릅니다. 하지만 같은 연구는 4시간을 넘는 작업에서 성공률이 10% 미만으로 급감한다고 봤습니다.
쉽게 말하면 이렇습니다. 짧은 심부름은 잘합니다. 긴 프로젝트는 아직 불안합니다. 중간에 파일을 잘못 이해하거나, 도구 호출을 놓치거나, 처음 목표와 다른 길로 갑니다. 사람으로 치면 "시키면 잘하는 인턴"인데, 아직 "일을 끝까지 책임지는 팀장"은 아닙니다.
개발자 생산성에서도 냉정한 결과가 나왔습니다. 숙련 오픈소스 개발자 대상 METR RCT는 AI 도구 사용 시 작업 완료 시간이 19% 늘었다고 보고했습니다. 연구 수행 기관은 METR입니다. 표본은 16명으로 작고, 성숙한 오픈소스 프로젝트라는 맥락도 있습니다. 그래도 중요한 메시지는 남습니다. AI 도구가 늘 빠르게 만드는 것은 아닙니다.
그래서 기업 배포의 현실적 형태는 "완전 자율"이 아닙니다. 좁은 업무, 짧은 단계, 강한 권한 통제, 사람 승인입니다.
- 고객지원: FAQ·환불·배송 상태처럼 경계가 분명한 티켓부터.
- 개발: 코드 리뷰, 테스트 생성, 문서 보강부터.
- 재무·HR: 결정 자체보다 증빙 수집과 초안 작성부터.
- 영업: 리드 분류, 제안서 초안, 다음 액션 추천부터.
에이전트의 생산성은 모델 성능만이 아니라 업무를 얼마나 작고 검증 가능하게 나누느냐에서 나옵니다.
구조 — 직업이 아니라 태스크가 이동한다
Goldman Sachs의 "3억 개" 숫자는 자주 과장됩니다. 정확한 표현은 전 세계 약 3억 개 정규직이 자동화에 "노출"될 수 있다는 것입니다. "사라진다"가 아닙니다. IMF도 전 세계 고용의 약 40%가 AI 영향에 노출될 수 있다고 봤지만, 노출은 대체와 다릅니다.
기업 현장에서는 직업보다 태스크가 먼저 움직입니다. 한 직무 안에는 자동화하기 쉬운 일과 어려운 일이 섞여 있습니다.
- 자동화하기 쉬운 일: 정형 문서 요약, 데이터 입력, 상태 조회, 초안 작성, 표준 답변.
- 사람 판단이 필요한 일: 예외 승인, 갈등 조정, 고객 맥락 판단, 책임 있는 의사결정.
- 새로 생기는 일: 프롬프트·워크플로 설계, 결과 검수, 모델 리스크 관리, 데이터 권한 관리.
이 구분이 중요합니다. 기업이 "직무"만 보고 인력을 줄이면 실패할 가능성이 큽니다. 업무를 쪼개 보지 않으면 어떤 일은 과도하게 자동화되고, 어떤 일은 병목으로 남습니다. 이건 기술 문제가 아니라 운영 설계 문제입니다.
ATM 사례가 좋은 힌트를 줍니다. 미국에서 ATM이 확산된 뒤에도 한동안 은행 창구직원 수는 오히려 늘었습니다. 지점당 필요한 직원은 줄었지만, 지점 개설 비용이 낮아지고 직원 업무가 단순 현금 처리에서 상담으로 바뀌었기 때문입니다. 자동화가 곧 직종 소멸로 이어지지 않는다는 대표 사례입니다.
다만 AI 에이전트에 그대로 낙관하면 안 됩니다. ATM은 단일 업무 자동화에 가까웠습니다. AI 에이전트는 문서, 코드, 고객응대, 분석처럼 인지 업무 전반에 걸칩니다. 전환 속도도 훨씬 빠릅니다. ATM의 교훈은 "일자리는 안 사라진다"가 아니라 "업무 단위로 봐야 한다"입니다.
과거 — ERP와 RPA가 먼저 보여준 함정
AI 에이전트의 과열을 보려면 ERP와 RPA를 같이 봐야 합니다.
ERP는 1990년대와 2000년대 기업 업무를 크게 바꿨습니다. 회계, 구매, 재고, 생산 데이터를 하나의 시스템으로 묶었습니다. 그런데 도입 초기에는 생산성 역설이 있었습니다. IT 투자는 늘었는데, 기업 생산성은 바로 튀지 않았습니다. 이유는 단순합니다. 소프트웨어만 바꾼다고 일이 바뀌지 않습니다. 프로세스, 권한, 데이터 기준이 같이 바뀌어야 합니다.
RPA도 비슷했습니다. 정형 반복 업무 자동화에는 강했습니다. 하지만 시스템 화면이 바뀌거나, 예외 문서가 들어오거나, 현업 프로세스가 바뀌면 봇은 조용히 멈췄습니다. 그래서 결국 "완전 자율화"보다 "사람 감독 아래 좁은 업무 자동화"가 현실 모델이 됐습니다.
AI 에이전트는 RPA보다 넓은 일을 다룹니다. 자연어를 읽고, 도구를 호출하고, 판단처럼 보이는 행동도 합니다. 그래서 더 강하고 더 위험합니다. RPA는 규칙이 틀리면 멈췄지만, AI 에이전트는 틀린 답을 그럴듯하게 냅니다.
정리하면 패턴은 이렇습니다.
- ERP의 교훈: 시스템 도입보다 업무 재설계가 어렵다.
- RPA의 교훈: 자동화는 예외 처리와 유지보수에서 비용이 드러난다.
- AI 에이전트의 교훈: 자율성이 높아질수록 검증·권한·책임 설계가 핵심 비용이 된다.
이번에도 생산성은 도구 구매가 아니라 운영 모델에서 갈립니다. 라이선스 결제는 시작일 뿐입니다. 진짜 비용은 그 다음에 옵니다.
돈 — ROI 숫자는 가장 조심해서 봐야 한다
AI 에이전트 ROI 자료는 밝은 숫자와 어두운 숫자가 같이 있습니다.
Forrester TEI는 Microsoft 365 Copilot에 대해 3년 ROI 116%를 제시했습니다. 하지만 이 연구는 Microsoft 의뢰 연구입니다. 독립 연구처럼 읽으면 안 됩니다. 복합 조직 모델, 인터뷰와 설문, 3년 NPV 계산이라는 전제가 붙습니다.
반대로 METR RCT는 숙련 개발자 작업에서 19% 둔화를 보였습니다. 이것도 모든 개발 업무에 일반화하면 안 됩니다. 표본이 작고 맥락이 제한적입니다. 하지만 두 연구를 나란히 놓으면 중요한 사실이 보입니다. AI의 경제성은 "있다/없다"가 아니라 "어떤 업무에서, 어떤 통제로, 얼마나 반복적으로"의 문제입니다.
벤더 매출은 이미 증명되고 있습니다. Microsoft, Salesforce, ServiceNow 모두 AI 제품을 전면에 놓고 있습니다. ServiceNow의 Now Assist 2026년 ACV 15억 달러는 실적이 아니라 목표치입니다. 이 구분도 중요합니다. 목표는 의지이고, 실적은 결과입니다.
기업이 지금 봐야 할 기준은 "도입할까 말까"가 아닙니다. 이미 도입은 시작됐습니다. 기준은 더 구체적이어야 합니다.
- 이 업무는 실패했을 때 비용이 작나.
- 입력 데이터와 권한 경계가 명확한가.
- 결과를 사람이 빠르게 검수할 수 있나.
- 절약된 시간이 실제 매출, 비용, 처리량으로 전환되나.
- 성과를 seat 수가 아니라 업무 단위 지표로 측정하고 있나.
여기까지 답하지 못하면 ROI는 장표 위에서만 좋습니다. 현업에서는 "도구가 하나 더 생겼다"로 끝납니다.
한국 — 빨리 도입하되 HR에는 더 엄격해야 한다
한쪽에서는 정부 주도의 에이전틱 AI 얼라이언스가 출범했고, 국내 대기업과 IT 서비스 기업들이 AI 에이전트 플랫폼을 빠르게 붙이고 있습니다. 한국은 제조, 금융, 통신, 유통처럼 반복 업무와 시스템 데이터가 많은 산업이 큽니다. 잘 설계하면 AI 에이전트가 현장 생산성을 실제로 끌어올릴 여지가 있습니다.
다른 한쪽에서는 중소기업 격차가 큽니다. OECD 기준 한국 중소기업 AI 도입률은 31%로, 독일의 50% 이상보다 낮게 제시됩니다. 한국 중소기업은 전체 고용의 80% 이상을 담당합니다. 대기업만 에이전트를 잘 쓰면 생산성 격차가 더 벌어집니다.
규제도 이미 시작됐습니다. 한국 AI기본법은 2026년 1월 22일 시행됐습니다. 채용·인사처럼 사람의 중요한 결정에 쓰이는 AI는 고영향 AI로 분류될 수 있습니다. 고지, 위험 식별, 설명, 기록 의무가 따라옵니다. EU AI Act도 고용 분야 AI를 고위험으로 봅니다.
그래서 한국 기업의 우선순위는 분명합니다.
- 고객지원, 영업 운영, 문서 처리처럼 경계가 분명한 업무부터 시작한다.
- 채용, 평가, 해고처럼 권리 침해 위험이 큰 업무는 보조 도구로 제한한다.
- 중소기업은 거대한 자체 플랫폼보다 기존 SaaS 안의 안전한 에이전트부터 쓴다.
- 모든 에이전트 업무에 로그, 승인권자, 예외 처리 규칙을 남긴다.
AI 에이전트는 한국 기업에 노동력 부족을 완충할 수단이 될 수 있습니다. 하지만 HR 의사결정까지 성급히 맡기면 생산성 도구가 곧 규제 리스크가 됩니다.
결론 — 추적 변수는 네 가지다
AI 에이전트는 기업 업무를 바꿉니다. 이 방향은 되돌리기 어렵습니다. 다만 변화의 단위는 직업이 아니라 태스크입니다. 기업은 사람을 없애기 전에 일을 다시 그려야 합니다.
앞으로 볼 포인트는 네 가지입니다.
- 스케일업 비율: McKinsey 기준 23% 수준인 에이전트 스케일링이 전사 운영으로 얼마나 올라가는지.
- 성과 측정 방식: 절약 시간, seat 수, 사용량이 아니라 매출, 비용, 처리량, 리스크 감소로 연결되는지.
- 신뢰성 지평선: METR가 말한 장기 작업 한계가 얼마나 빨리 개선되는지.
- 규제와 HR 적용: 한국 AI기본법과 EU AI Act 아래에서 채용·평가·업무배분 AI를 어디까지 허용할지.
순고용 효과는 아직 단정할 수 없습니다. Goldman Sachs의 3억 개는 자동화 노출이고, WEF의 순 +7,800만 전망은 기업 설문 기반 전망입니다. 지표가 다르고 둘 다 불확실합니다. 그러니 "일자리가 다 사라진다"도, "결국 다 좋아진다"도 성급합니다.
지금 가장 현실적인 결론은 이렇습니다. AI 에이전트 시대의 승자는 가장 많은 봇을 붙인 회사가 아닙니다. 업무를 가장 잘게 쪼개고, 실패 비용이 낮은 곳부터 자동화하고, 사람의 판단이 필요한 지점을 남겨둔 회사입니다.
AI 에이전트는 사람을 한 번에 대체하지 않습니다. 먼저 일을 분해합니다. 그리고 그 일을 다시 묶을 줄 아는 조직이 다음 생산성의 몫을 가져갑니다.
관련 리서치
NVIDIA GTC가 보여준 다음 AI 인프라
GTC 2026의 핵심 신호를 AI Factory, 장기 실행 에이전트, 피지컬 AI/로보틱스 관점으로 묶어 인프라와 산업 적용의 다음 병목을 정리합니다.
리서치 보기 AI/반도체휴머노이드 로봇은 '걷기'가 아니라 '단가'에서 결판난다
휴머노이드, 로봇 관점에서 휴머노이드 로봇은 '걷기'가 아니라 '단가'에서 결판난다의 산업 구조와 자본시장 시사점을 출처 기반으로 정리한 리서치입니다.
리서치 보기 AI/반도체중앙은행이 금을 쓸어 담는 진짜 이유 — 탈달러보다 먼저 봐야 할 '몰수 불가 자산'
거시, 금 관점에서 중앙은행이 금을 쓸어 담는 진짜 이유 — 탈달러보다 먼저 봐야 할 '몰수 불가 자산'의 산업 구조와 자본시장 시사점을 출처 기반으로 정리한 리서치입니다.
리서치 보기Source Notes
출처 메모
핵심 근거 확인용 링크와 메모입니다.
- S001원문 보기
Source Notes — 근거와 주의
Source Notes — 근거와 주의
- S002원문 보기
확정에 가깝게 사용한 수치
확정에 가깝게 사용한 수치
- S003원문 보기
Microsoft Copilot 2,000만 유료 시트와 AI 런레이트 370억 달러: Microsoft FY26 Q3(S001). 런레이트 구성은 미분해.
Microsoft Copilot 2,000만 유료 시트와 AI 런레이트 370억 달러: Microsoft FY26 Q3(S001). 런레이트 구성은 미분해.
- S004원문 보기
Salesforce Agentforce ARR 8억 달러와 누적 딜 2만9,000건: Salesforce FY2026 Q4(S002). 6,000 유료 딜은 과거값(S003).
Salesforce Agentforce ARR 8억 달러와 누적 딜 2만9,000건: Salesforce FY2026 Q4(S002). 6,000 유료 딜은 과거값(S003).
- S005원문 보기
McKinsey 실험 62%, 스케일링 23%, 고성과 약 6%: State of AI 2025(S008). 자기 보고 설문 한계 있음.
McKinsey 실험 62%, 스케일링 23%, 고성과 약 6%: State of AI 2025(S008). 자기 보고 설문 한계 있음.
- S006원문 보기
METR 태스크 지평선 7개월마다 두 배, 4시간 초과 성공률 10% 미만, 숙련 개발자 RCT 19% 둔화: METR(S009, S011). RCT 연구 기관은 METR, 표본 n=16.
METR 태스크 지평선 7개월마다 두 배, 4시간 초과 성공률 10% 미만, 숙련 개발자 RCT 19% 둔화: METR(S009, S011). RCT 연구 기관은 METR, 표본 n=16.
- S007원문 보기
한국 AI기본법 시행일 2026년 1월 22일: 국가법령정보센터(S016).
한국 AI기본법 시행일 2026년 1월 22일: 국가법령정보센터(S016).
- S008원문 보기
전망·주의가 필요한 수치
전망·주의가 필요한 수치
- S009원문 보기
Gartner 40% 앱 내장·40% 이상 프로젝트 취소: 원문 미확인 보도/전망(S006, S007).
Gartner 40% 앱 내장·40% 이상 프로젝트 취소: 원문 미확인 보도/전망(S006, S007).
- S010원문 보기
Forrester TEI ROI 116%는 Microsoft 의뢰 연구(S010). ServiceNow Now Assist 15억 달러는 목표치(S004).
Forrester TEI ROI 116%는 Microsoft 의뢰 연구(S010). ServiceNow Now Assist 15억 달러는 목표치(S004).
- S011원문 보기
IMF 40%와 Goldman Sachs 3억 개는 "노출" 전망이지 대체·소멸이 아님(S012, S013). IMF "-3.6%" 수치는 미사용.
IMF 40%와 Goldman Sachs 3억 개는 "노출" 전망이지 대체·소멸이 아님(S012, S013). IMF "-3.6%" 수치는 미사용.
- S012원문 보기
WEF 순 +7,800만은 기업 설문 전망(S014). Goldman Sachs 수치와 직접 비교하지 않음.
WEF 순 +7,800만은 기업 설문 전망(S014). Goldman Sachs 수치와 직접 비교하지 않음.
- S013원문 보기
크로스산업 벤치마크
크로스산업 벤치마크
- S014원문 보기
ATM과 은행 창구직원 역설은 BLS(S018), AEI(S019), Bessen 논의 기반. ERP·RPA 비교는 notes의 시장·기술 리서치와 RPA 조직 수용 연구 기반 해석.
ATM과 은행 창구직원 역설은 BLS(S018), AEI(S019), Bessen 논의 기반. ERP·RPA 비교는 notes의 시장·기술 리서치와 RPA 조직 수용 연구 기반 해석.
업데이트 알림 받기
뉴스레터 기능이 활성화되면 이 리서치의 업데이트와 공개 발행 알림을 받을 수 있습니다.