200시간짜리 냉각수 후보가 던진 질문: AI는 연구원을 대신하나, 연구소를 바꾸나

As of: 2026-06-06 KST (출처: qa_report.md)
2026년 6월 2일, Microsoft는 Discovery를 정식 출시했다(출처 S22). 회사는 앞서 이 플랫폼으로 데이터센터 침지냉각용 냉각수 후보를 약 200시간 만에 찾았다고 밝혔다(출처 S05).
이상하다. 후보가 그렇게 빨리 나오면 R&D 비용도 바로 내려가야 할 것 같다. 그런데 연구소는 마법학교가 아니라 비용센터다. 후보가 나왔다고 제품이 되는 것도, 특허가 되는 것도, 고객이 돈을 내는 것도 아니다.
AI 공동과학자의 진짜 질문은 "과학자를 대체하나"가 아니다. "누가 이 후보를 믿고, 실험비를 쓰고, 나중에 책임질 기록까지 남길 것인가"다.
후보는 빨리 나오지만, 제품은 아직 줄을 서야 한다
Microsoft Discovery가 보여주는 변화는 모델 하나가 아니라 R&D workflow layer다. 공식 설명상 Discovery는 agent, graph-based knowledge engine, HPC simulation, 분석 도구를 묶어 가설 수립부터 시뮬레이션과 반복 학습까지 연결한다. 연구원이 검색창에 질문을 던지는 수준을 넘어, 연구 과정 자체를 플랫폼 안으로 끌어들이는 그림이다.
Google의 AI co-scientist 논문도 같은 방향을 보인다. 여러 agent가 가설을 만들고, 토론하고, 발전시키는 구조다. 다만 이 근거는 "AI가 상용 R&D 성과를 이미 입증했다"가 아니다. 검증된 표현은 여기까지다. AI가 연구자의 검색 공간을 넓히고, 후보를 더 빠르게 정리할 수 있다는 것.
그래서 대표 사례는 Microsoft 하나만 끝까지 보자. Discovery가 빨라진 곳은 후보 탐색과 시뮬레이션의 앞단이다. 느린 곳은 뒤에 남는다. 실험, 품질 문서, IP disclosure, 표준 대응, 사람의 최종 판단이다. AI가 후보를 빨리 뽑을수록, 연구소 책상에는 "검토해야 할 그럴듯한 후보"가 더 많이 쌓인다.
병목은 모델 성능보다 검증 가능한 연구 루프에 있다
NBER의 AI in R&D 프레임워크는 이 문제를 모델 성능 하나로 보지 않는다. AI가 맡을 수 있는 연구 과업의 비중, 그 과업에서의 생산성, 그리고 분야별 병목의 강도를 함께 본다. 멋진 모델이 있어도 병목이 wet lab, 장비 표준, 데이터 provenance, 규제 문서에 있으면 전체 속도는 생각보다 덜 오른다.
여기서 R&D AI가 일반 사무 자동화와 갈라진다. 이메일 초안은 마음에 안 들면 다시 쓰면 된다. 신약 후보, 소재 조성, 반도체 공정 조건은 그렇게 못 한다. 틀리면 실험비가 나가고, 시간이 밀리고, 나중에는 특허와 규제 문서까지 꼬인다. 재미없지만, 돈은 바로 그 재미없는 구간에서 움직인다.
비유하면 AI 공동과학자는 초고속 아이디어 컨베이어다. 문제는 컨베이어 끝에 사람이 서서 도장을 찍어야 한다는 점이다. 도장을 없애는 게 아니라, 왜 찍었는지 남기는 장부가 더 중요해진다.
돈은 모델보다 검증 로그와 운영 장부에 붙는다
한국 기업에는 이 문제가 작지 않다. KISTEP 기준(출처 S39) 2023년 한국 총 R&D 지출은 119.074조 원이고, 그중 기업 수행 비중은 79.2%였다. AI R&D가 조금만 진짜가 되어도, 비용을 새로 부담하는 쪽은 대학 논문실이 아니라 기업 R&D 조직이다.
돈의 위치를 나누면 이렇다. 새로 부담하는 사람은 R&D 예산을 가진 기업이다. 대신해주는 쪽은 Microsoft 같은 R&D 플랫폼, cloud/HPC 제공자, domain model과 lab workflow를 붙이는 통합 파트너다. 반복매출 후보는 "AI가 발견했습니다"라는 한 줄이 아니다. 데이터 커넥터, 시뮬레이션 사용량, agent workflow 관리, provenance 기록, IP disclosure 로그, 표준 대응 문서화다.
다만 공개자료만으로 Microsoft Discovery의 외부 고객 수, 유료 계약 규모, 반복 매출 구조는 확인되지 않았다. 이 대목은 과장하면 안 된다. 지금 확실히 말할 수 있는 것은 회사가 Discovery를 R&D 운영 플랫폼으로 포지셔닝했고, 고객 입장에서는 후보 생성보다 검증과 기록 체계에 비용을 써야 한다는 점이다.
비용 부담자는 기업 R&D 조직이고, 반복 비용 후보는 compute·workflow·기록·표준 대응에 붙는다. 계약 단가와 매출 규모는 공개자료만으로 확인되지 않았다.
후보 생성은 앞단이고, 반복 비용은 검증·기록·표준 대응 루프에 붙는다. 그래프는 인코어 재구성.
기록 장부가 비싸지는 이유는 IP 때문이다. WIPO 집계에서 GenAI patent family는 5만4천 건을 넘었다(출처 S38). 숫자만 보면 "특허 많이 내면 이기는 게임"처럼 보인다. 반은 맞고 반은 틀렸다.
USPTO의 AI-assisted invention guidance가 남기는 핵심은 AI가 발명자가 된다는 이야기가 아니다. 인간 연구자의 구체적 기여가 중요하다는 점이다. 누가 문제를 정의했는지, 어떤 모델과 데이터를 썼는지, 사람이 어떤 후보를 왜 골랐는지, 어떤 실험으로 검증했는지를 남겨야 한다.
표준도 같은 방향이다. ISO의 AI management system 표준은 운영체계를, NIST AI RMF와 GenAI Profile은 위험관리와 신뢰성 기준을, NIST의 autonomous lab 표준 프로젝트는 장비·데이터·workflow 상호운용성을 다룬다. AI 공동과학자가 커질수록 R&D 로드맵은 모델 도입표가 아니라 감사 가능한 연구 운영표에 가까워진다.
인코어 관점: 다음 뉴스에서 볼 것은 데모가 아니라 누가 검증비를 내는가다
인코어식으로 돈의 위치만 보면, 이 글은 "기술 가능성보다 후단 검증에 돈이 붙는다"는 채택 전환비용 패턴과 닮았다. 하지만 같은 공통 산업 패턴으로 단정하지는 않는다. 딥테크 상용화 글에서처럼 통합·인증 파트너가 위험을 흡수하는 계약과 달리, R&D AI에서는 상당한 위험이 여전히 고객 내부 연구자, IP 담당자, 법무·품질 조직에 남는다. 그래서 cross-industry 법칙이 아니라, 이 산업 안의 돈줄로 좁혀 읽는 편이 맞다.
Trigger와 Bottleneck은 닮았지만, Risk bearer와 Contract가 달라 공통패턴으로 단정하지 않았다.
앞으로 볼 신호는 뚜렷하다. 첫째, 플랫폼 발표가 아니라 유료 고객·장기 계약·공동 연구소의 실제 범위다. Microsoft Discovery 같은 제품이 "정식 출시"를 넘어 고객 R&D stage gate에 들어가면, AI R&D는 데모에서 운영비로 넘어간다.
둘째, 후보 생성 수보다 검증 통과율과 실험 사이클 시간이다. 후보가 늘었는데 false positive가 더 늘면 실험비만 커진다. 반대로 후보 축소율, 재현율, 실패 데이터 재사용률이 개선되면 기업은 반복 비용을 낼 이유가 생긴다.
셋째, IP와 표준 문서가 연구 흐름 안에 붙는지다. 발명신고 양식, model version 기록, 데이터 출처, human contribution 로그, ISO/NIST식 risk mapping이 플랫폼 안에서 자동으로 남기 시작하면 그때부터 lock-in이 생긴다.
데모는 박수를 받고, 반복매출은 검증 로그에서 나온다.