[CEOin PREMIUM=홍성애 기자]
국내 금융권 최초 LLM 공개에 이어 AI 경쟁력 강화 위한 데이터 확장
BC카드(대표이사 최원석)가 국내 AI 경쟁력 강화를 위해 금융 특화 언어자료(말뭉치) 180만 건을 무상 공개했다고 27일 밝혔다. 이는 지난해 국내 금융권 최초로 LLM(거대언어모델, Large Language Model)을 공개한 데 이어, 국내 AI 생태계를 더욱 확장하기 위한 조치다.
말뭉치는 인터넷에서 검색 가능한 데이터를 집합체로 구성해 LLM 훈련에 활용된다. AI 개발은 데이터 수집과 정제, LLM 훈련 단계를 거쳐 최종 모델이 구현되는 만큼, 초기 단계에서 확보한 말뭉치가 AI 성능에 결정적 영향을 미친다.
BC카드는 금융 AI 개발을 위한 최적의 환경을 갖춘 기업으로 평가받는다. 국내 금융사 최초로 ▲기업정보조회업 ▲데이터 전문기관 ▲마이데이터 ▲개인사업자 신용평가 ▲가명정보 결합전문기관 등 정부 인가 데이터 사업 라이선스 5개를 모두 획득하며 AI 개발을 위한 핵심 데이터를 확보할 수 있는 강점을 보유하고 있다.
전 세계적으로 AI 패권 경쟁이 치열해지는 가운데, 한국어 기반 AI 개발의 한계점도 부각되고 있다. AI 모델 허브 플랫폼 ‘허깅페이스’에 따르면, 영어 기반 말뭉치는 전체의 70%를 차지하지만, 한글 데이터는 현저히 부족한 실정이다.
이에 BC카드는 한글 기반 말뭉치 확대를 위한 해법으로 ▲금융 특화 말뭉치 지속 공개 ▲K-금융 특화 AI 모델 활용 확대 ▲금융 취약계층 지원 AI 모델 개발 지원 등을 추진한다. 금융기관이 BC카드의 데이터를 활용하면 기존 대비 적은 자원으로도 효율적인 AI 개발과 운영이 가능해진다. 이는 금융권을 넘어 다양한 산업에서 한국어 기반 AI 모델 개발 확산을 촉진하는 계기가 될 전망이다.
BC카드는 지급결제 전문 기업에서 금융 AI 혁신 기업으로 거듭나기 위해 AI 업무를 전담하는 조직을 신설했다.
조명식 BC.AI 본부장은 “BC카드는 AI 기반 금융 서비스의 새로운 미래를 열기 위해 금융 데이터 공개 및 AI 기술 개발을 지속적으로 확대할 것”이라며 “이번 금융 특화 말뭉치 공개를 계기로 국내 AI 경쟁력을 한층 강화하고 차별화된 금융 서비스를 선보이겠다”고 밝혔다.