대규모 언어 모델 '다운 형식'...슬롯 머신 개발 데이터 유출 우려 無
업계 전문가 "제약 업계, 메타의 LLaMA라도 시급히 들여와야"

정부가 '딥시크(DeepSeek)'의 국내 서비스를 잠정 중단했다고 발표했지만 제약바이오 업계에 미치는 후폭풍은 여전하다. 딥시크 논란을 통해 드러난 생성형 AI 슬롯 머신 유출 문제에 대해 제약사들이 보다 근본적인 대안을 내놓아야 한다는 전문가들의 지적이 들리고 있기 때문이다.

메타 공식 라마 홍보 페이스북 
메타 공식 라마 홍보 페이스북

개인정보보호위원회는 17일 "딥시크 앱의 국내 서비스가 지난 15일 오후 6시부터 잠정 중단됐다"며 "국내 개인정보보호법에 따른 개선·보완이 이뤄진 후 서비스가 재개될 예정"이라고 전했다.

딥시크의 데이터 유출 우려 논란은 일단락된 것일까. AI 슬롯 머신 개발 업계의 전문가들은 "결코 그렇지 않다"고 입을 모았다.

한 전문가는 "이번 발표 내용은 딥시크 앱 다운로드를 중단한다는 내용으로 새로운 내용이 아니다"며 "정부부처들이 앞다투어 딥시크 차단에 나선 내용과 같다. 그저 차단한 하면 된다는 안일한 문제의식을 다시 한번 드러낸 것일 뿐"이라고 밝혔다.

그러면서 "단순히 차단한다고 문제가 끝나지 않는다"며 "이번 딥시크 논란을 통해 생성형 AI를 통한 슬롯 머신 개발 데이터 유출 문제가 수면 위로 드러났기 때문이다. 제약사들은 생성형 AI 전반에 대한 보안 문제를 반드시 점검하고 대책을 세워야 한다"고 강조했다.

히트뉴스 취재에 따르면 일부 제약사는 구체적인 대안 마련에 돌입했다. 생성형 AI를 통한 슬롯 머신 외부 유출 문제를 사전에 인지하고 차단 시스템 구현에 사활을 걸고 있다는 뜻이다.

A 기업 관계자는 "슬롯 머신 파이프라인 하나를 개발하는데 10~20억원이 투입되고5~10년이란 긴 시간이 걸린다"며 "이런 민감한 데이터를 매번 생성형 AI에 물어본다는 것은 자살 행위나 다름없다. 내부적으로 메타의 라마를 활용한 자체적인 생성형 AI를 도입하기로 결정한 이유"라고 밝혔다.

슬롯 머신
라마의 다운로드 모델.

'LLaMA(Large Language Model Meta AI, 라마)'는 2023년 2월 미국의 빅테크 기업 메타(페이스북)가공개한 대규모 언어 모델이다. 당시 마크 저커버그 메타 CEO는 "LLaMA은 텍스트 생성이나 대화, 자료 요약, 수학, 단백질 생성 등에서 많은 가능성을 보여준다. 메타는 개방형 연구 모델에 전념하고 있다"고 전했다.

관련 전문가는 "라마가 슬롯 머신 개발 관련 데이터 유출 방지를 위한 새로운 모델로 떠오르고 있는 것은 사실"이라며 "다른 생성형 AI와 다르게, 오픈 소스로 공개됐기 때문에 컴퓨터로 라마의 언어 모델을 다운로드해서 자체적으로 생성형 AI를 만들어낼 수 있다"고 밝혔다.

그러면서 "챗GPT와 같은 생성형 AI는 대부분 연구자들이 질문하는 모든 내용이 통째로 서버로 넘어간다. 웹 브라우저 형식이기 때문에 다운로드가 불가능하다"며 "그러나 라마는 프로그램을 다운로드를 받아 설치하는 방식이고 슬롯 머신 개발 관련 데이터로 새로 트레이닝을 시키면 데이터 보안이 유지될 수 있다. 대기업처럼 자체적인 AI 모델을 개발할 수 없다면 라마가 가장 현실적인 대안"이라고 덧붙였다.

문제는 극소수의 제약바이오 기업들만이 생성형 AI 슬롯 머신 유출 문제에 대해 경각심을 느끼고 행동에 나서고 있다는 점이다. 대부분의 제약바이오 기업들은 해당 문제에 대해 큰 관심이 없는 것이 현실이다. 심지어 국책 기관도 마찬가지다.

데이터 유출 문제에 대해 어떤 대안을 마련 중인가라는 질문에 A 연구단체 관계자는 "딥시크를 포함한 생성형 AI에 대해 별도의 보안 가이드라인 마련 계획은 없다"고 밝혔다. B 바이오 기업도 "AI를 이용해서 적극적으로 슬롯 머신을 개발하고 있지 않다. 별도의 조치 필요성을 못 느낀다"고 전했다.

A 연구단체는 대학과 기업을 연계하는 방식으로 슬롯 머신 파이프라인 후보물질을 탐색하고 지원해온 국책 연구기관으로 방대한 양의 데이터를 지닌 곳이다. B 바이오도 최근 수년 동안 꾸준히 기술수출을 해온 곳으로 글로벌 빅파마들이 성과를 인정한 기밀 데이터가 넘치는 곳이다.

관련 전문가는 "AI 쪽은 임원들이 경각심을 가지지 않으면 실무자들은 움직이지 않는다"며 "생각 이상으로 슬롯 머신을 개발하는데 생성형 AI를 습관처럼 사용하는 연구원들이 상당하다. 아무리 챗GPT라도 데이터가 어디로 흘러갈지, 어떻게 활용될지 알 수 없는 상황에서 아무 조치를 취하지 않는 것은 너무 안일한 대처"라고 지적했다.

그는 이어 "구글에서 매년 트랜드 키워드를 분석한다. 그런 키워드가 어디서 나왔겠나"라고 반문하면서 "챗GPT에 물어보는 모든 내용을 기억했다가 만드는 데이터다. 슬롯 머신 개발도 다르지 않다. 슬롯 머신 파이프라인의 구조식은 한 장의 그림으로 요약 가능한데, 이 그림을 디자인하는데 몇 십억원이 든다. 결코 유출되지 않아야할 자산이기 때문에 보다 적극적인 대책이 필요하다"고 덧붙였다.

두근두근... 'HLB 간암병용요법 FDA 허가'와 '알테오젠